データの前処理

著者: Louise Ward
作成日: 11 2月 2021
更新日: 13 5月 2024
Anonim
【数値編】数値型データの前処理と可視化まとめ
ビデオ: 【数値編】数値型データの前処理と可視化まとめ

コンテンツ

定義-データの前処理とはどういう意味ですか?

データの前処理は、生データを理解可能な形式に変換するデータマイニング手法です。実世界のデータは、多くの場合、不完全、一貫性のない、および/または特定の動作や傾向に欠けており、多くのエラーが含まれている可能性があります。データの前処理は、このような問題を解決する実証済みの方法です。データ前処理は、さらに処理するために生データを準備します。

データ前処理は、顧客関係管理やルールベースのアプリケーション(ニューラルネットワークなど)などのデータベース駆動型アプリケーションで使用されます。


Microsoft AzureとMicrosoft Cloudの紹介|このガイドを通して、クラウドコンピューティングとは何か、Microsoft Azureを使用してクラウドからビジネスを移行および実行する方法を学習します。

Techopediaはデータの前処理について説明します

データは、前処理中に一連のステップを実行します。

  • データクリーニング:データは、欠損値の入力、ノイズの多いデータの平滑化、データの不整合の解決などのプロセスを通じてクリーンアップされます。
  • データ統合:異なる表現のデータがまとめられ、データ内の競合が解決されます。
  • データ変換:データは正規化、集約、および一般化されます。
  • データ削減:このステップの目的は、データウェアハウス内のデータの表現を削減することです。
  • データの離散化:属性間隔の範囲を分割することにより、連続属性の値の数を削減します。