Hadoop上のSQL

著者: Roger Morrison
作成日: 19 9月 2021
更新日: 1 J 2024
Anonim
並列分散処理基盤のいま〜45分で学ぶHadoop/Spark/Kafka/ストレージSW入門〜 2021-3-5 B-2
ビデオ: 並列分散処理基盤のいま〜45分で学ぶHadoop/Spark/Kafka/ストレージSW入門〜 2021-3-5 B-2

コンテンツ

定義-HadoopでのSQLの意味

Hadoop上のSQLは、Hadoopプラットフォーム上のSQL実装である分析アプリケーションツールの一種です。これは、標準SQLスタイルの構造化データのクエリとHadoopデータフレームワークを組み合わせたものです。 Hadoopはビッグデータ自体と同様に比較的新しいプラットフォームであり、多くの専門家はエキスパートではありませんが、HadoopのSQLはHadoopフレームワークへのアクセスを簡素化し、現在のエンタープライズシステムへの実装を容易にします。


Microsoft AzureとMicrosoft Cloudの紹介|このガイドでは、クラウドコンピューティングとは何か、Microsoft Azureを使用してクラウドからビジネスを移行および実行する方法を学習します。

TechopediaはHadoopでのSQLについて説明します

Hadoop上のSQLとは、Hadoopプラットフォーム向けのSQLのさまざまな実装を指します。 Hadoopsクラスタージョブマッパーおよび結果オーガナイザーであるMapReduceは、SQLを主要なユースケースおよび他の処理方法としてサポートします。したがって、データベースクエリと操作に最も広く使用されている言語の1つであるSQLを許可するための強力なツールを作成することは理にかなっています。 Hadoopがエンタープライズデータアーキテクチャで人気を博しているため、SQLは、Hadoopで使用される緩やかに構造化されたデータと構造化データの両方を適切に採用するための鍵となります。

SQL on Hadoopの主要なドライバーには以下が含まれます。

  • ほとんどの組織に存在する既存のSQLスキルを活用する
  • Hadoopへの抽出変換負荷(ETL)、ビジネスインテリジェンス(BI)、および分析インフラストラクチャへの投資の再利用

Hadoop実装の一部のSQLには以下が含まれます。

  • Apache Spark SQL
  • Apache Hive
  • アパッチタホ
  • アパッチドリル
  • MapR上のHP Vertica
  • ODBCドライバー
  • プレスト