ビッグデータとHadoopの違いは何ですか?

著者: Judy Howell
作成日: 5 J 2021
更新日: 21 六月 2024
Anonim
5分でHadoop | Hadoopとは何ですか? | Hadoopの概要| Hadoopの説明| Simplilearn
ビデオ: 5分でHadoop | Hadoopとは何ですか? | Hadoopの概要| Hadoopの説明| Simplilearn

コンテンツ

Q:

ビッグデータとHadoopの違いは何ですか?


A:

ビッグデータとオープンソースソフトウェアプログラムHadoopの違いは、明確で根本的なものです。前者はしばしば複雑で曖昧な資産であり、後者はその資産を扱うための一連の目標と目的を達成するプログラムです。

ビッグデータは、特定の目標と運用に役立つために企業や他の関係者がまとめた大きなデータのセットです。ビッグデータには、さまざまな種類の形式のさまざまな種類のデータを含めることができます。たとえば、企業は、通貨形式での購入、名前や社会保障番号などの顧客識別子、またはモデル番号、販売番号、在庫番号などの製品情報に関する何千ものデータの収集に多大な労力を費やす可能性があります。このすべて、またはその他の大量の情報は、ビッグデータと呼ばれます。原則として、さまざまな種類のツールとハンドラーを使用するまでは未加工で分類されていません。

Hadoopは、ビッグデータを処理するために設計されたツールの1つです。 Hadoopおよびその他のソフトウェア製品は、特定の独自のアルゴリズムおよび方法を使用して、ビッグデータ検索の結果を解釈または解析するように機能します。 Hadoopは、Apacheライセンスに基づくオープンソースプログラムであり、ユーザーのグローバルコミュニティによって維持されています。 MapReduceの一連の関数やHadoop分散ファイルシステム(HDFS)など、さまざまな主要コンポーネントが含まれています。

MapReduceの背後にある考え方は、Hadoopが最初に大きなデータセットをマッピングし、次に特定の結果のためにそのコンテンツの削減を実行できるということです。 reduce関数は、生データ用の一種のフィルターと考えることができます。次に、HDFSシステムは、ネットワーク全体にデータを配信するか、必要に応じてデータを移行します。

データベース管理者、開発者などは、Hadoopのさまざまな機能を使用して、さまざまな方法でビッグデータを処理できます。たとえば、Hadoopを使用して、不均一なデータや、従来のテーブルにきちんと収まらないデータや単純なクエリにうまく応答しないデータを使用したクラスタリングやターゲティングなどのデータ戦略を追求できます。