Hadoop分散ファイルシステム(HDFS)

著者: Judy Howell
作成日: 28 J 2021
更新日: 7 5月 2024
Anonim
Hadoop分散ファイルシステム(HDFS)の基本
ビデオ: Hadoop分散ファイルシステム(HDFS)の基本

コンテンツ

定義-Hadoop分散ファイルシステム(HDFS)とはどういう意味ですか?

Hadoop分散ファイルシステム(HDFS)は、標準またはローエンドハードウェアで実行される分散ファイルシステムです。 Apache Hadoopによって開発されたHDFSは、標準の分散ファイルシステムのように機能しますが、MapReduceアルゴリズム、高いフォールトトレランス、および大規模なデータセットのネイティブサポートによるデータスループットとアクセスを向上させます。


Microsoft AzureとMicrosoft Cloudの紹介|このガイドを通して、クラウドコンピューティングとは何か、Microsoft Azureを使用してクラウドからビジネスを移行および実行する方法を学習します。

TechopediaがHadoop分散ファイルシステム(HDFS)を説明

HDFSは、通常数百および数千の同時接続ノードにある複数のマシンに配置された大量のデータを保存し、各データインスタンスを3つの異なるコピー(2つのグループと1つのグループ)として複製することでデータの信頼性を提供します。これらのコピーは、障害が発生した場合に交換できます。

HDFSアーキテクチャはクラスターで構成されます。各クラスターは、別のマシンにインストールされた単一のNameNodeソフトウェアツールを介してアクセスされ、クラスターファイルシステムとユーザーアクセスメカニズムを監視および管理します。他のマシンは、DataNodeの1つのインスタンスをインストールして、クラスターストレージを管理します。

HDFSはJavaで記述されているため、アプリケーションの統合とアクセシビリティのためにJavaアプリケーションプログラミングインターフェイス(API)をネイティブにサポートしています。また、標準のWebブラウザからアクセスすることもできます。