今日のビッグデータの課題は、量や速度ではなく、多様性に起因しています

著者: Judy Howell
作成日: 28 J 2021
更新日: 23 六月 2024
Anonim
Tasso Azevedo: Hopeful lessons from the battle to save rainforests
ビデオ: Tasso Azevedo: Hopeful lessons from the battle to save rainforests

コンテンツ


取り除く:

IT部門の数が多すぎると、データの量と速度の問題を抱えて、さまざまなデータの基本的な問題への対処を忘れてしまいます。

ビッグデータの管理と活用の課題は、ガートナーの研究副社長であるダグレイニー氏によると、3つの要素に起因しています。 Laneyは、10年以上前に、ビッグデータは管理が困難なボリューム、速度、多様性をもたらすため、企業にとってこのような問題を引き起こすと最初に指摘しました。問題は、IT部門が多すぎて、データ量と速度の問題ですべてを投げ捨て、さまざまなデータの基本的な問題に対処するのを忘れていることです。

2001年に、Laneyは「主要企業はますます中央集中型データウェアハウスを使用して、内部および外部のコラボレーションを改善する共通のビジネス用語を定義するようになるだろう」と書いています。その語彙の問題、および企業がその語彙を作成できないようにする変動性は、今日のビッグデータの難問の最も対処されていない側面のままです。 (他の専門家の意見をチェックしてください。ビッグデータの専門家をフォローしてください。)

ビッグデータの3つのV

多くの企業が、増加したデータ量と速度を利用する方法を発見しています。たとえば、膨大な量のデータを分析できます。もちろん、そのデータは同じパラメーター内で何度も何度も表示されます。これにより、カラムデータベースなどの技術革新が促進されました。これらのデータベースは、同様のデータアイテムの同じサイズのストアに直面している他の企業で現在広く使用されています。

速度を調整するという点では、Splunkなどのベンダーは、毎秒数千のイベントをキャプチャするログファイルを通じて、迅速に作成されたデータを企業が分析するのを支援します。この大量イベントの分析は、セキュリティとパフォーマンスの監視のユースケースを対象としています。データ量の課題と同様に、速度の課題は、処理速度をデータ速度の増加に合わせて拡張できる洗練されたインデックス作成技術と分散データ分析によって主に対処されています。

ただし、多様性に関しては、ビッグデータ分析へのアプローチにおいて、依然として多くの企業が大きな問題に直面しています。この問題は次の3つの要因によって引き起こされます。1つ目は、環境に新しいシステムを追加する成長、買収、技術革新により、企業は非常に不均一な環境に閉じ込められ、この不均一性は時間とともに増加するだけです。企業は、さまざまな種類のシステムを追跡し、数万のデータ型を管理するとともに、異なる命名法と形式を使用して表される同じデータを管理する必要があります。


第二に、これらのシステムとデータ型は、多くの場合、関連する情報と、対処する問題とは無関係に安全に除外できる情報の両方を報告します。影響のある情報を確実に識別する必要があります。

多様性の課題の3番目の次元は、環境の一定の変動性または変化です。システムがアップグレードされ、新しいシステムが導入され、新しいデータ型が追加され、新しい命名法が導入されました。これにより、データの多様性の課題に対処する能力がさらに低下します。これにより、さまざまな課題に追加のレイヤーが追加されます。 (詳細については、ビッグデータ:キャプチャ、クランチ、およびビジネス上の意思決定に使用される方法をご覧ください。)

データの多様性の問題に対処する

データの多様性の問題に対処するために、企業はITドメインから始める必要があります。ITドメインはしばしば多様性の問題の最悪の犯罪者と最悪の被害者の両方を表すからです。最初のステップは、すべてのIT要素または資産の包括的な定義または分類から始めることです。これにより、IT内またはITに関するあらゆる情報を参照するためのベースラインまたは基盤が提供され、企業は既知の分類法または用語に対する不均一性の増加を管理できます。

バグやストレスなし-あなたの人生を破壊することなく人生を変えるソフトウェアを作成するためのステップバイステップガイド

誰もソフトウェアの品質を気にしない場合、プログラミングスキルを向上させることはできません。

次のステップは、異なるオブジェクトの記録システムにわたって同じオブジェクトが表現される多くの方法を識別することです。これにより、ITプロフェッショナルは異機種混在環境全体を調査し、データを高度にフィルター処理して関連する管理可能なチャンクに圧縮できます。

最後に、IT管理者は、導入されている新しいタイプの要素や同じ要素を参照する新しい命名法などの変更について、環境を絶えず調査するプロセスを採用する必要があります。


これらの手順により、IT組織はさまざまな問題を管理し、ITチームがこれまで逃してきた深い洞察を引き出すことができます。さらに、多様性の問題を管理することで、より伝統的な量と速度のビッグデータの問題に対処するツールと手法への投資収益率が大幅に向上します。