コンテンツ
Q:
教師あり学習、教師なし学習、半教師あり学習の違いは何ですか?
A:
機械学習における教師あり学習と教師なし学習の主な違いは、トレーニングデータの使用です。
教師あり学習では、サンプルデータを使用して、「正しい」データがどのように見えるかを示します。データは、指定された入力の出力を表示するように構造化されています。
果物を分類する機械学習アルゴリズムでは、リンゴ、バナナ、ブドウ、オレンジなどの果物の写真を入力として、これらの果物の名前を出力として使用できます。
実際の例は、プログラムのベイジアンスパムフィルターです。これらのフィルターは、スパムと見なされるの例を使用してトレーニングされます。スパムフィルターは、spamで発生するsに現れる特定のフレーズを検索し、それらをスパムフォルダーに移動できます。
それは、人間に新しいタスクを行う方法を示すようなものです。データ入力を行う人には、会社が望んでいる形式のデータの例が示されている場合があり、それに従うことが期待されます。
教師あり学習を使用する機械学習プログラムは、トレーニングデータで何度も繰り返されます。その結果は、本当に始まったときに印象的なものになります。 GoogleのGmailスパムフィルターは、非常に多くのユーザーがトレーニングしているため、非常に正確です。
教師なし学習には、事前のトレーニングデータはありません。果物の分類の例では、アルゴリズムに果物の写真を表示し、果物を分類するように指示するだけです。
教師なし学習には、顧客の購買習慣を学習することによる市場調査、またはハッキングパターンを監視することによるセキュリティがあります。
半教師あり学習は、データの一部にラベルを付けることにより、妥協を試みます。たとえば、果物分類プログラムではリンゴとオレンジにラベルが付けられますが、バナナとブドウにはラベルが付けられません。
これらのアルゴリズムのいずれを使用するかは、使用するデータの種類によって異なります。一部のタスクには、クレジットカード詐欺やスパムなどの安定したパターンがあります。教師あり学習は、これらの種類のタスクに適しています。ネットワーク攻撃は予測不可能であり、教師なしまたは半教師ありの学習方法がより適切な場合があります。