コンテンツ
- 定義-Apache Nutchの意味?
- Microsoft AzureとMicrosoft Cloudの紹介|このガイドを通して、クラウドコンピューティングとは何か、Microsoft Azureを使用してクラウドからビジネスを移行および実行する方法を学習します。
- TechopediaはApache Nutchについて説明します
定義-Apache Nutchの意味?
Apache Nutchは、Webからデータを集約するために使用できるWebクローラーソフトウェア製品です。データ分析のために、Hadoopなどの他のApacheツールと組み合わせて使用されます。
Microsoft AzureとMicrosoft Cloudの紹介|このガイドを通して、クラウドコンピューティングとは何か、Microsoft Azureを使用してクラウドからビジネスを移行および実行する方法を学習します。
TechopediaはApache Nutchについて説明します
Apache Nutchは、Apache Software Foundationによってライセンスされたオープンソース製品です。この開発者コミュニティは、データをソートおよび分析できるさまざまなApacheソフトウェアツールのライセンスを保持しています。中心的なテクノロジーの1つは、ビジネスコミュニティで非常に人気のあるビッグデータ分析ツールであるApache Hadoopです。
Apache Hadoopなどのツールやファイルの保存、分析などの機能に加えて、Nutchの役割は、ウェブクロールアルゴリズムを使用してウェブからデータを収集して保存することです。
ユーザーは、Apache Nutchの単純なコマンドを利用して、URLの下で情報を収集できます。ユーザーは通常、Apache Nutchと、Apache Nutchで収集されたデータのリポジトリとして機能できるApache Solrと呼ばれる別のオープンソースツールを使用します。