データサイエンティスト:テックワールドの新しいロックスター

著者: Robert Simon
作成日: 24 六月 2021
更新日: 1 J 2024
Anonim
Exploratory オンライン・セミナー : アナリティクス:時系列データの異常値検出
ビデオ: Exploratory オンライン・セミナー : アナリティクス:時系列データの異常値検出

コンテンツ


出典:Onradio / iStockphoto

取り除く:

データサイエンティストの役割は、テクノロジーの世界で最も求められているキャリアになりつつあります。 The New York TimesのトップデータサイエンティストであるJake Porwayに、彼がどのように仕事に就いたか、そしてこの分野で成功するためのヒントについて尋ねました。

データサイエンティストの役割は、テクノロジーの世界で最も人気のあるキャリアになりつつあります。 Google、Amazon、LinkedInなどの企業は、データサイエンティストを使用して、デジタルデータ時代の革新的なエッジを維持しています。そして今、データとテクノロジーの愛好家は、一部のミュージシャンがロックスターになることを望んでいるのと同じように、データ科学者になることを目指しています。おそらく、それが一部の人々がデータ科学者をテクノロジー時代の新しいロックスターと呼んでいる理由です。

残念ながら、この役割はまだ新しいため、多くのデータ科学者がツアーバスを間違った道に運転していることを意味するレベルのあいまいさがあります。データ科学者は彼らのロックスターの評判に値しますか? The New York TimesのR&DラボのデータサイエンティストであるJake Porwayへのインタビューで、データサイエンスの世界に飛び込みます。

データサイエンティスト:Techs Rock Stars?

では、なぜデータサイエンティストはテクノロジーの世界の新しいロックスターと呼ばれているのでしょうか?この類推は、実際、データオタクが超クールなサウンドを望んでいるよりも深くなります。ロックスターのように、データサイエンティストのキャリアには、多様性、芸術的自由、順応性が含まれます。また、エンターテインメントの世界のロックスターのように、最高のデータ科学者は、データおよびテクノロジー業界のあらゆる層からかなり多くの人々を獲得する傾向があります。

データサイエンティストが行うことは非常に多様です。ミュージシャンがさまざまな楽器、ツール、テクニックを使用して、ジャズやデスメタルとはまったく異なる音楽スタイルを演奏するように、データサイエンティストは特定のツールや分野も習得しています。関係するスタイルもあります。そして、仕事をする正しい方法も間違った方法もありません。それは、仕事が他の人々に与える影響についてです。


ビートルズが曲を書いたとき、すべての楽器のすべての音をどのように演奏するかを指示するのは一人ではありませんでした。彼らは集まって詰まった。創造的な発見を通して、彼らは機能する歌を見つけました。データサイエンティストでも同じです。彼らはリズムを感じ、溝に入り、解決策を調和させなければなりません。これは、現時点で思い浮かぶあらゆるアプローチ、ツール、テクニックを試すための適切な量の芸術的自由と、何かが鍵に見えないときに変更を加える俊敏性によってのみ可能です。

データサイエンティストは、基本的な基礎をマスターすると、順応性が高まり、他の分野でソリューションを提供する自信を得ることができます。これらの中核的な基礎については後で詳しく説明します。ここで重要なのは、データサイエンスをマスターすれば、データはどこにでもあるので、あなたが望むあらゆる分野の役割を担うことができるということです。

データサイエンティストの究極の目標は、可能な限り多くの人々のために大量の価値を生み出すことです。データサイエンティストは舞台裏で働いていますが、大勢の視聴者と遊ぶことに似ています。仕事を上手く行えば、より多くの人に到達でき、より多くの報酬を得ることができます。

データサイエンティストは何をしますか?

それでは、データサイエンティストは正確に何をしますか?私たち全員が関係できるかもしれない例でこれを見ていきましょう。

バグやストレスなし-あなたの人生を破壊することなく人生を変えるソフトウェアを作成するためのステップバイステップガイド

誰もソフトウェアの品質を気にしない場合、プログラミングスキルを向上させることはできません。

ある日、以前と同じエネルギー量ではないことに気付いたとします。あなたは自分自身に目標を設定しました:日中により多くのエネルギーを持つことです。さて、それはかなり広範で曖昧な目標です。そのため、データサイエンティストとしての最初のステップは、その曖昧さを取り除き、この目標の測定可能性を定量化することです。これには方法があります。ここでは詳しく説明しませんが、十分な睡眠が取れていないことを理論付けて、毎晩8時間睡眠をとるという副次的な目標を考えてみましょう。


この目標はもう少し測定可能で曖昧ではありませんが、独自の課題があります。眠りにつくとタイマーを開始することはできません。また、ベッドに飛び込んだ後にタイマーを開始しても、すぐに眠りに落ちることはありません。さらに、あなたが夜中に目覚める時間を説明するのは難しいです。最後に、深い睡眠と軽い睡眠など、さまざまな種類の睡眠があります。一番下の行は、睡眠を正確に測定することは難しく、したがって、あなたのエネルギーレベルへの影響を測定することはさらに難しいということです。

だからあなたは何ができますか?さて、データサイエンティストとして、最新のテクノロジーを探し、睡眠監視デバイスがあることを発見します。また、このようなデバイスを使用して睡眠を測定し、デジタルで記録すると、睡眠に関するより正確なデータを取得し、そのデータを経時的に収集してグラフを作成できます。

これだけで、何が起こっているのかをより深く知ることができます。視覚的な表現は、あなたに気づき、明確さ、方向性を与えます。一晩で8時間の睡眠という目標に達しているかどうかを確認できます。さらに重要なことは、そうでない場合は行動を起こすことができることです。

これは、データサイエンティストの基本的な仕事です。データを測定し、表示する新しい方法を提供して、データを見る人により多くの認識、明確さ、方向性を提供することです。

しかし、優秀なデータサイエンティストはそこに留まりません。データが収集されると、1日を通して行う他の測定されたアクティビティと統合できます。タスク管理システムのデータに基づいて生産性と統合します。ツイートやステータスの更新に基づいて、気分と統合します。ジムへの訪問または減量に基づいて、それをあなたの健康と統合します。すでに利用可能なデータ量と、データを簡単にキャプチャできるため、可能性は無限です。

データサイエンティストになる方法

データサイエンスのキャリアに興味がありますか?データサイエンスは非常に新しいため、トップのデータサイエンティストにこの分野の洞察を求めました。 Jake Porwayは、The New York Timesのデータサイエンティストであり、データサイエンスを必要とする非営利団体とフリーランスおよびプロボノのデータサイエンティストをマッチングするDataKind(当初は国境のないData)の創設者です。ポーウェイにはコンピューターサイエンスのバックグラウンドと博士号があります。 UCLAからの統計。データサイエンスに取り組む方法、パフォーマンスを向上させる方法、およびフィールドでの主要なミスを回避する方法について、彼が言わなければならなかったことがここにあります。

1.適切なスキルを取得する

ポーウェイによると、フィールドに入ることは3つの重要な事柄に要約されます:

  • 実用的なコンピューティングスキル
  • 統計スキル
  • 学びたいという願望

「データをスクレイピングするスクリプトを作成し、頭に浮かんだアルゴリズムをコーディングできる必要があります」とPorway氏は言います。 「モデルを構築しているのか、アルゴリズムを作成しているのがあなたが望んでいることをしているかどうかを本当に評価できるようになるなら、基本的な統計(そして理想的にはもっと)を知っておくべきです。」

2.接続する

ニューヨークタイムズのR&Dラボに参加する前、ポーウェイは機械学習とコンピュータービジョンで働いており、地雷や飛行機を識別するためのロボットの取得に多くの時間を費やしていました それ?)。ニューヨークタイムズに就職してから、より広範なデータサイエンスタスク、つまりソーシャルネットワーク全体の出版物からのリンクを追跡するProject Cascadeに拡大するようになりました。

現場に入るための最も重要なことは、学ぶことです。

「データサイエンスプロジェクトに参加してください!」ポーウェイは言います。 「データをダウンロードし、Rを取得し、再生を開始します。Rのようなものを基本的な統計書と一緒に使用して、データの探索をガイドします。機械学習とコンピューティングのスキルは、もちろん、これはあなたの過去の経験に依存します-すでに統計学者であれば、Pythonを手に入れてください!)」

次に、いくつかの接続を作成します。ポーウェイは地元の交流会をお勧めします。データサイエンスコミュニティの一員であることは、「知らないことを知る最速の方法」だからです。そして、常に進化している分野で、それは重要です。

3.ゲームに参加する

ポーウェイには博士号があります。 UCLAの統計では、しかし、彼はあなたが良い仕事をするのにそれを必要としないことを強調しています。

「それは役立つかもしれませんが、自分をデータサイエンティストと呼ぶために、もう5年間学校を出て行かなければならないとは思わないでください」とPorway氏は言います。

データサイエンスは比較的新しい分野です。これは、フィールドに入ってみたい人は、オープンマインドでアプローチする必要があることを意味します。

「Foursquareのデータサイエンティストは、ゴールドマンサックスのデータサイエンティストとは大きく異なるように見えます」とPorway氏は言います。

4.新しい役割を揺るがす

データサイエンスとは、目標を明確にし、仮定を調べ、証拠を評価し、結論を評価することです。しかし、多くの人が見落としているパズルの小さな部分があります。あなたはそれが何であるか推測できますか?ポーウェイによると、秘密の成分は批判的思考です。

「私にとって、それは本当にハッカーを真の科学者から引き離します」とポーウェイは言います。 「誰かがモデルを作成して結果を報告するのを見て、データがどこから来たのか、実験が正しく設計されているのかを批判的に考えていなかったことに驚かされるでしょう。すべてのステップに疑問を持たなければなりません。あなたのプロセスとあなたが思いつくすべての数の。」

ビッグデータへの道

膨大な量のデータを使用して機械に自分自身を教える能力があることに気付いたとき、彼は気が遠くなりました。その情熱、そして彼の教育とスキルは、彼にデータサイエンスのトップジョブを獲得するのに役立ちました。ビッグデータをロックしたい場合は、いくつかの本を探して、データをダウンロードして遊んでみてください。生データの山がどうなるかはわかりません。

インタビューの完全な転写については、DataScientists.Netにアクセスしてください。