データサイエンスを学習するための12の重要なヒント

著者: Laura McKinney
作成日: 3 4月 2021
更新日: 1 J 2024
Anonim
就職に超有利!?データサイエンスを学べる有名大学特集
ビデオ: 就職に超有利!?データサイエンスを学べる有名大学特集

コンテンツ


出典:Artinspiring / Dreamstime.com

取り除く:

データサイエンティストには、確かに強力な数学とコーディングのスキルが必要ですが、コミュニケーションやその他のソフトスキルも成功に不可欠です。

データサイエンティストは、Glassdoorでアメリカで2019年に最高の仕事としてランク付けされています。給与の中央値が108,000ドルで、仕事の満足度が5段階中4.3であることに加え、かなりの数の求人が予想されていますが、これは驚くことではありません。問題は、この仕事の資格を得るために軌道に乗るために何をしなければならないのかということです。

見つけるために、私たちはこのキャリアトラックに乗ろうとしている人々に与えられるアドバイスを探しました。多くは、コーディングと数学のハードスキルに帰着します。しかし、その強力な計算だけではそれを削減できません。成功したデータサイエンティストは、ビジネスパーソンと自分の言葉で話すことができる必要もあります。それは、ソフトスキルとリーダーシップに関連する能力を必要とします。 (データサイエンティストの職務の詳細については、「職務:データサイエンティスト」を参照してください。)

教育基盤の構築:3つの主要なヒント

NYC Data Science AcademyのデータサイエンティストであるDrace Zhanは、コーディングと数学の能力の基本を含む教育基盤の必要性を強調しています。

  1. R / Python + SQL。コーディングスキルがない場合は、この不足を強化するために、多くのネットワーク力と他の領域が必要です。数学が弱く、ドメインの経験が少ないデータサイエンティストを見てきましたが、彼らは常に強力なコーディング能力に支えられてきました。 Pythonは理想的ですが、Rは優れたフォールバックツールです。両方を武器庫に入れておくことをお勧めします。 SQLはデータアナリストにとっても非常に重要です。

  2. 強力な数学スキル。一般的に使用されるいくつかの方法(一般化線形モデル、決定木、K平均、統計的検定)を十分に理解することは、さまざまなモデルやRNNなどの専門分野の全体像よりも優れています。

一部の専門家はそれらに追加しますが、これらは構築する中心的なスキルです。たとえば、KDnuggetsのリストには、Zhanが言及したコーディングコンポーネントが含まれ、HadoopプラットフォームのApache Spark、データの視覚化、非構造化データ、機械学習、AIなど、技術面で知っておくと便利な情報が追加されています。


しかし、Kaggle調査で実際に使用するために特定された最も一般的に使用されるツールに関する調査からヒントを得ると、多少異なる結果が得られます。以下のトップ15の選択肢のグラフからわかるように、Python、R、およびSQLはトップ3を簡単に作成しますが、4番目はJupyterノートブックで、TensorFlow、Amazon Web Services、Unixシェル、Tableau、C / C ++、NoSQLが続きます、MATLAB / OctaveおよびJava、すべてHadoopおよびSparkより先です。人々を驚かせるかもしれないもう1つの追加は、MicrosoftのExcelデータマイニングです。

画像はKaggle提供

KDnuggetsリストには、正式な教育に関するヒントも含まれています。ほとんどのデータサイエンティストは高度な学位を持っています。46%が博士号を取得し、88%が少なくとも修士号を取得しています。彼らが所有する学部の学位は、一般的に関連分野に分かれています。約3分の1は数学と統計学であり、このキャリアトラックで最も人気があります。次に人気の高いのは、19パーセントが保有するコンピューターサイエンスの学位、および16パーセントの選択であるエンジニアリングです。もちろん、データサイエンスに特有の技術ツールは学位プログラムではなく、専門のブートキャンプまたはオンラインコースで学習されることがよくあります。

コース以上:さらに2つのヒント

Weill Cornell Medicineの肺科の研究助手であり、NYC Data Science Academyの学生であるHank Yunは、意欲的なデータサイエンティストに、彼らが取り組むことを計画し、メンターを見つけるよう助言します。彼は言った:

バグやストレスなし-あなたの人生を破壊することなく人生を変えるソフトウェアを作成するためのステップバイステップガイド

誰もソフトウェアの品質に関心がない場合、プログラミングスキルを向上させることはできません。


コースを受講して証明書を受け取ったので、データサイエンスを知っていると自分に言って間違えないでください。それは素晴らしいスタートですが、勉強を始めるときは、プロジェクトを念頭に置いてください。その後、現場でメンターを見つけて、すぐに情熱のプロジェクトを始めましょう!あなたが新鮮なとき、あなたはあなたが知らないことを知らないので、誰かがあなたにとって重要であるものとそうでないものにあなたを案内するのに役立ちます。何も見せずに勉強に多くの時間を費やしたくありません!

どのツールをツールボックスから取り出すかを知る:常に先を行くためのヒント

データサイエンスツールのランキングの格差を考えると、何に焦点を合わせるかについて戸惑う人もいるかもしれません。セキュリティソフトウェア会社McAfeeのチーフデータサイエンティストであるCeleste Fralickは、データサイエンティストにとって不可欠なスキルを検討するCIO記事でこの問題に対処し、「データサイエンティストは研究の曲線の先頭に立つ必要があるだけでなく、それは、「実際の問題が発生したときに「セクシー」で新しいもの」に魅了されないことを意味します。 「エコシステムの計算コスト、解釈可能性、遅延、帯域幅、およびその他のシステム境界条件、および顧客の成熟度を把握することは、データサイエンティストが適用するテクノロジーを理解するのに役立ちます。」

エッセンシャルソフトスキル:もう6つのヒント

Fralickが提起するポイントは、データサイエンティストの仕事に必要な非技術的なスキルに関連しています。そのため、KDnuggetsリストには、知的好奇心、チームワーク、コミュニケーションスキル、ビジネスの洞察力の4つが含まれています。 Zhanは、データサイエンティストのヒントにキーソフトスキルも含め、KDnuggetsのような「コミュニケーションスキル」を特定しましたが、「ビジネスの洞察力」の代わりに「ドメインの専門知識」を使用しました。ビジネス。 (コミュニケーションスキルの詳細については、「テクニカルプロフェッショナルのコミュニケーションスキルの重要性」を参照してください。)

Olivia Parr-Rudはこれに独自のスピンを提供し、さらに2つのソフトスキルを追加し、創造性の役割に重点を置いて、「データサイエンスは芸術であると同時に科学である」と主張しました。脳の両側の強さ。 「多くの人は、主に左脳を使用するキャリアとしてのデータサイエンスについて語っています。データサイエンティストが成功するには、脳全体を使用する必要があることがわかりました。」

彼女は、現場で前進するには技術的な能力だけでなく、創造性とリーダーシップに必要なビジョンが必要だと説明しました。

ほとんどの左脳/線形タスクは自動化または外部委託することができます。データサイエンティストとして競争力を提供するには、脳の両側を使用してパターンを認識し、大量の情報を合成できる必要があります。そして、私たちは革新的な思想家でなければなりません。最良の結果の多くは、左脳と右脳の統合から生じます。

また、ビジョンを明確に伝えることが不可欠である理由を強調しました。

データサイエンティストとしての目標は、データを使用してクライアントが利益を伸ばすことです。ほとんどの幹部は、私たちが何をするのか、どのようにそれを行うのか理解していません。そのため、リーダーのように考え、調査結果と推奨事項を、ステークホルダーが理解し信頼する言葉で伝える必要があります。

データダース

重要なヒントには、より多くの技術的なツール、スキル、機能、および創造性やリーダーシップに対する適性などの定量化できない質が組み込まれています。最終的には、単なる数字ゲームではありません。データサイエンスは、単に真空でモデルを作成するだけでなく、ビジネスの現実の問題を解決する実用的なアプリケーションを考え出すため、フィールドで成功する人は、テクノロジーを習得するだけでなく、ビジネスドメインを知り、ニーズを理解する必要があります職場のチームのさまざまなメンバー。