データサイエンスか機械学習か? Heres違いを見つける方法

著者: Laura McKinney
作成日: 3 4月 2021
更新日: 1 J 2024
Anonim
15分で分かる!機械学習とは何か【AI・データサイエンス入門】
ビデオ: 15分で分かる!機械学習とは何か【AI・データサイエンス入門】

コンテンツ


出典:Elnur / Dreamstime.com

取り除く:

データサイエンスと機械学習は、重要な点で異なります。ある意味では、一方は他方のサブセットとして見ることができます。どちらも現在のITの進歩にとって重要です。

人工知能とデータ管理のこの新しい世界では、ITの世界で最も一般的に使用されている用語のいくつかに混乱するのは簡単です。

たとえば、データサイエンスと機械学習は互いに関係があります。これらの分野の知識があまりない多くの人々が、それらの違いを理解するのに苦労するのは驚くことではありません。

原則および技術的アプローチとして、機械学習からデータサイエンスを分離する最良の方法は次のとおりです。

データサイエンスと機械学習:幅広い用語と狭い用語

まず第一に、データサイエンスは実際には、さまざまな種類のプロジェクトや作品を網羅する広範な包括的なカテゴリのテクノロジーです。 (データサイエンスの仕事に関係するものの詳細については、「職務:データサイエンティスト」を参照してください。)

データサイエンスとは、本質的にビッグデータを扱うことです。ムーアの法則と、より効率的なストレージデバイスの急増により、企業や他の関係者によって膨大な量のデータが収集されるようになりました。その後、Hadoopなどのビッグデータプラットフォームとツールは、データ管理の仕組みを変えることでコンピューティングの再定義を開始しました。現在、クラウドとコンテナ化、そして新しいモデルにより、ビッグデータは私たちの仕事と生活の主要な推進力となっています。

最も簡単な形式では、データサイエンスとは、データをクリーンアップして洗練することから洞察の形で使用することまで、そのデータを管理する方法です。

機械学習の定義ははるかに狭いです。機械学習では、「学習」と呼ばれる人間の認知プロセスをシミュレートするために、テクノロジーがデータを取り込んでアルゴリズムに送ります。つまり、データを取り込んでトレーニングすると、コンピューターは独自の結果を提供できます、プログラマーが配置したプロセスからテクノロジーが学んだように見えます。


データサイエンスと機械学習のスキルセット

データサイエンスと機械学習を対比するもう1つの方法は、これらの分野のいずれかの専門家にとって最も価値のあるさまざまなスキルを調べることです。

バグやストレスなし-あなたの人生を破壊することなく人生を変えるソフトウェアを作成するためのステップバイステップガイド

誰もソフトウェアの品質を気にしない場合、プログラミングスキルを向上させることはできません。

データサイエンティストは、深い分析スキルと数学スキル、データベーステクノロジーの実践的な経験、およびPythonなどのプログラミング言語の知識、またはビッグデータの解析に使用される他のパッケージの知識から利益を得るという一般的なコンセンサスがあります。

「(データサイエンス)で強力なキャリアを構築することに興味がある人は、分析、プログラミング、ドメイン知識の3つの部門で重要なスキルを習得する必要があります」とSimplilearnのSrihari Sasikumar氏は書いています。 「次のスキルは、データサイエンティストとしてニッチを掘り下げるのに役立ちます。Python、SAS、R(および)Scalaの強力な知識、SQLデータベースコーディングの実務経験、非構造化データの操作能力ビデオやソーシャルメディアなどのさまざまなソースは、機械学習の複数の分析機能(および)知識を理解しています。」

機械学習の側面では、専門家は、データモデリングスキル、確率と統計の知識、および幅広いプログラミングスキルを機械学習エンジニアのツールキットの有用なツールとして引用することがよくあります。

機械学習を見つける方法

ここで重要なのは、あらゆる種類のデータがデータサイエンスの作業で構成されていることですが、コンピューターが入力から学習するのを支援するための非常に厳しいレジメンが設定されていない限り、機械学習ではありません


それが適切であるとき、それは私たちの生活に広範な影響を与えることができるいくつかの驚くほど能力のあるシステムになります。

「機械学習で行うことの多くは表面下で行われます」とAmazonの創設者であるジェフ・ベゾスは、これらのタイプのシステムのアプリケーションのいくつかを指摘して伝えたと伝えられています。 「機械学習は、需要予測、製品検索ランキング、製品と取引の推奨、マーチャンダイジングプレースメント、不正検出、翻訳などのアルゴリズムを推進します。あまり見えませんが、機械学習の影響の多くはこのタイプのものであり、静かに、しかし意味のあるコア操作を改善します。」

ここで最も役立つ例の1つは、ニューラルネットワークの出現です。これは、機械学習プロセスを設定する一般的で一般的な方法です。

最も基本的な形では、ニューラルネットワークは人工ニューロンの層で構成されています。個々の人工ニューロンは、生物学的ニューロンと同等の機能を備えていますが、シナプスや樹状突起の代わりに、入力、活性化機能、最終的な出力があります。

ニューラルネットワークは人間の脳のように動作するように作られており、機械学習の専門家はこのモデルを使用して機械学習の結果を作成することがよくあります。

ただし、機械学習を行う唯一の方法ではありません。初歩的な機械学習プロジェクトには、コンピューターに広範囲の写真を表示する(または他の生データを提供する)、教師付き機械学習とラベルデータを使用するプロセスを通じてアイデアを入力する、コンピューターが最終的に区別できるようにするなどがあります視野内のさまざまな形状またはアイテム。 (機械学習の基本については、機械学習101をご覧ください。)

2つの最先端の分野

結論として、機械学習はデータサイエンスの貴重な部分です。しかし、データサイエンスは、より広範なフロンティアと、機械学習が行われる短所を表しています。

ある意味では、ビッグデータがなければ機械学習は決して起こらないと言えます。ビッグデータ自体は機械学習を作成しませんでしたが、代わりに、それをどう処理するのかほとんどわからないほど多くのデータをまとめて集計した後、トップの頭脳はこれらのバイオシミュレーションプロセスを強力な方法として思いつきました洞察を提供する。

ここで心に留めておくべきもう1つの良い点は、データサイエンスを2つの主な方法で適用できることです。機械学習と人工知能を採用してコンピューターに考えさせるか、データサイエンスをより人間中心のアプローチに戻すことができますコンピューターは単に結果を提示するだけであり、私たち人間が決定を下します。

そのため、今日のトップイノベーターを含む一部の専門家は、これらのテクノロジーの使用方法について、より活気に満ちた会計を求めています。

「(AI)はほとんど誰もが知っているよりもはるかに多くの能力があり、改善率は指数関数的です」と、Elon Musk氏は、機械学習とAIプログラムには監視が必要であると警告しながら述べています。

いずれにせよ、データサイエンスと機械学習の両方は、社会が今日の技術で行っている進歩の中核部分です。