ビッグデータの管理に関する6つの大きな神話

ビデオ: Top 6 misconceptions about Linux containers Linuxコンテナの6つの誤解

コンテンツ

神話：ビッグデータの採用に関しては誰もが先を行っています。
神話：私たちにはたくさんのデータがあります。データの小さな欠陥を心配する必要はありません。
神話：ビッグデータテクノロジーは、データ統合の必要性を排除します。
神話：高度な分析にデータウェアハウスを使用することは無意味です。
神話：データレイクはデータウェアハウスに取って代わります。
Big Data Works-新しいデータ操作方法が機能しない場合がある

出典：Dwnld777 / Dreamstime.com

取り除く：

ビッグデータはビッグビジネスですが、適切に使用されている場合に限ります。

2014年5月に、Forrester Researchはビッグデータを取り巻く誇大宣伝について特定の結論を引き出す2つのレポートを発行しました。この調査会社は、250人を超えるマーケティングおよびビジネス開発のエグゼクティブを調査しました。レポートの著者によると、ビッグデータのレトリックはかつてないほど高く、テクノロジーベンダーは信じられないほどの主張と思われるもので製品を売り込んでいます。

ガートナーはForrester Researchに同意します。ビッグデータを取り巻く大きな誇大宣伝。 2014年9月のレポートで、ガートナーは5つの最大のデータ神話を暴き、ガートナーのアナリストはビッグデータとその操作について誤解されていることについて意見を述べています。ビッグデータの最大の神話は何ですか？みてみましょう。

神話：ビッグデータの採用に関しては誰もが先を行っています。

ガートナー氏によると、ビッグデータへの関心はこれまでになく高くなっています。それにもかかわらず、調査対象者のわずか13％が稼働中のシステムを持っています。理由：ほとんどの企業は、データの大きなリポジトリから価値をマイニングする方法をまだ理解していない。ここで、ガートナーの調査はForresterレポートよりも楽観的であり、調査参加者のわずか9％が来年にビッグデータテクノロジーの導入を計画していると答えています。（ビッグデータには多くのメリットがあります。ビッグデータが解決できる5つの現実の問題で詳細をご覧ください。）

神話：私たちにはたくさんのデータがあります。データの小さな欠陥を心配する必要はありません。

ガートナーは、私たち人間が持っている脆弱性について心配しています。「私たちには多くのものがありますが、悪いものは問題ではありません。」ガートナーの副社長兼著名なアナリストであるテッド・フリードマンは、これが状況を見る間違った方法であると考えています。

「実際には、個々の欠陥はデータが少ない場合に比べてデータセット全体への影響ははるかに小さくなりますが、データが多いため以前よりも多くの欠陥があります」とフリードマンは言いました。「したがって、データセット全体に対する低品質データの全体的な影響は同じままです。」

フリードマンは懸念の別の理由を追加します。ビッグデータキャプチャには、多くの場合、企業外からのデータが含まれます。そのため、構造と起源が不明です。これにより、エラーの可能性が高まります。

神話：ビッグデータテクノロジーは、データ統合の必要性を排除します。

ビッグデータに適用できる重要なデータ分析戦略には、「書き込み時のスキーマ」または「読み取り時のスキーマ」の2つがあります。最近まで、使用される方法は書き込み時のスキーマのみでした。読み取り時のスキーマは、データベース管理の現在の流行です。構造化形式を必要とする書き込み時のスキーマとは異なり、データは未加工形式で読み取り時のスキーマデータベースに読み込まれます。次に、開発者は、Hadoopなどの非構造化データベースプラットフォームを使用して、異種データを使用可能な形式に曲げます。読み取り時のスキーマには明らかな利点がありますが、ガートナーが述べているように、データの統合はある時点で行わなければなりません。

神話：高度な分析にデータウェアハウスを使用することは無意味です。

データウェアハウスの作成に時間を費やすことは、多くの情報管理者にとって無意味に思えます。特に、新しくキャプチャされたデータがデータウェアハウスのものと異なる場合はそうです。ただし、Gartnerは、高度なデータ分析でもデータウェアハウスと新しいデータを使用することを警告しています。つまり、データインテグレーターは次のことを行う必要があります。

新しいデータ型を洗練して分析に適したものにする
関連するデータと必要なデータ品質のレベルを決定する
データを集約する方法を決定する
データウェアハウス以外の場所でデータの絞り込みが発生する可能性があることを理解する

神話：データレイクはデータウェアハウスに取って代わります。

データが構造化された形式のデータウェアハウスとは対照的に、データレイクは異種データのリポジトリです。データレイクの作成は、データウェアハウスに比べて事前の労力がほとんどかかりません（データをフォーマットする必要はありません）。

ガートナーは、データを持つことはポイントではないことを強調します。情報に基づいた意思決定のためにキャプチャしたデータを操作できることがポイントです。さらに、意思決定を容易にするために（ある程度証明されていない）データレイクを使用することには問題があります。

「データウェアハウスには、組織内のさまざまなユーザーをサポートする機能が既に備わっています」と、GartnerのリサーチディレクターであるNick Heudecker氏は述べています。「情報管理のリーダーは、データレイクが追いつくのを待つ必要はありません。」（ビッグデータを採用する前に、ビッグデータについて知っておくべき7つのことで、ビッグデータの採用の詳細をご覧ください。）