あらゆる場所に分析を埋め込む:市民データサイエンティストの実現

著者: Lewis Jackson
作成日: 12 5月 2021
更新日: 23 六月 2024
Anonim
High Density 2022
ビデオ: High Density 2022

取り除く: ホストRebecca Jozwiakは、組み込み分析の現象と市民データ科学者について、Dr。Robin Bloor、Dez Blanchfield、David Sweenorと議論します。



ビデオを見るには、このイベントに登録する必要があります。登録してビデオをご覧ください。

レベッカ・ジョズウィアック: ご列席の皆様、こんにちは。HotTechnologiesへようこそ。 「どこにでも埋め込む:市民データ科学者を可能にする」が今日の私たちのトピックです。いつものホストの代わりに、レベッカ・ジョズウィアックがエリック・カバナに代わります。はい、今年は暑いです。特に「データサイエンティスト」という用語は、「統計学者」や「分析の専門家」などの退屈な名前と呼ばれていましたが、同じ種類の活動にほとんど取り組んでいますが、セクシーな新しい名前が付けられ、多くの注目を集めています。彼らは職場にいることが非常に望ましく、組織にとって有益であり、誰もがそれを望んでいます。しかし、それらは次のとおりです。1)高価、2)見つけにくい。確かに、データサイエンティストのスキル不足に関するニュースはあちこちにありますが、それでも組織に大きな価値を提供しており、人々はダイムを落とさずにその価値を得る方法を見つけ出すことを求めています話す。

しかし、良いニュースは、その不足を補うようなツールやソフトウェアが出てきていることです。自動化、機械学習、組み込み分析があり、これが今日学ぼうとしていることであり、この新しい用語「市民データ科学者」が生まれたのはどういう意味ですか?いいえ、トレーニングを受けたデータサイエンティストではなく、ビジネスユーザー、BIエキスパート、IT担当者、バックグラウンドは持っているが専門知識は必ずしも持っていない可能性があります。しかし、これらのツールとソフトウェアは、ディープコーディングを知らなくても、より多くの人々がスマートソリューションにアクセスできるようにします。しかし、すべての人がその分析的思考に少しでもアクセスできるようにすると、全体的なパフォーマンスの向上に役立ちます。あなたの会社にとって良い洞察につながるような好奇心を持つために、必ずしもトレーニングを受ける必要はありません。


今日私たちと話し合っているのは、Bloor Groupのチーフアナリスト、Robin Bloorであり、データ科学者であるDez Blanchfieldが電話をかけ、Dell StatisticaのDavid Sweenorが本日プレゼンテーションを行います。そして、それをロビン・ブロアに渡すつもりです。

ロビンブール: さて、その紹介に感謝します。私はこれについて歴史的な詐欺で考えました。ここで実際に見ているのは、レオナルドダヴィンチのデザインの1つで、人間が背中に乗せるようなグライダーのようなものです。実際に機能するかどうかはわかりません。私はそれに入らないだろう、と言わざるを得ない。しかし、ダヴィンチは、私がダヴィンチについて考えるときはいつでも、彼がこれまでに存在した中で最も探究的で分析的な人々の一人だと思います。そして、グライダーを見るだけで、鳥の翼に基づいて設計され、グライダーが何らかの方法で鳥の飛翔を研究してそれを構築したことは明らかです。

歴史的な観点から見ると(実際に調べたところ)、分析はおそらく最も古い数学の応用でしょう。少なくともバビロニア時代にさかのぼる国勢調査があります。基本的に、そのようなデータを持っている楔形のタブレットがいくつかあるので、これについて知っています。以前に戻ったものがあるかどうかはわかりません。しかし、明らかなことは、あなたは自分自身に多くの人々がいる文明を持っているということです。それは実際に計画を必要とし、あなたが計画しているものとそれらの人々の要件が実際に何であるかを知る価値があります。

初期のコンピューター、初期の機械式コンピューターが実際にあったので、それがコンピューティングの始まりでもありました。最初はホレリスが作成した国勢調査であり、それがIBMになったと思います。これらはすべて前進しています。おそらく1970年代と現在の間には、他の膨大な数のアプリケーションや分析が存在する間奏がありました。はい、分析が行われていました-特に銀行や保険会社、そして実際にはGeneral Electricやtelcoなどの大規模な組織で行われていましたが、ビジネス全体では一般的に使用されていませんでしたが、現在では一般的に使用され始めていますビジネス。そして、それは本当にゲームを変えました。私が最初に注目したいと思ったのは、私が特に気に入っているデータピラミッドです。これは、20年前-少なくとも20年前-の1つを描いて、理解しようとしたことです。当時、私はBIと初期のデータマイニングを理解しようとしていました。ここで定義したのはデータの概念であり、例は信号、測定、記録、イベント、トランザクション、計算、集計、個々の情報ポイントです。それらを情報の分子と考えるかもしれませんが、それらは個々のポイントです。詐欺になるとすぐに情報になります。リンクされたデータ、構造化されたデータ、データベース、データの視覚化、プロッター、スキーム、およびオントロジー-これらはすべて、情報として資格があります。実際に形、数学的な形を持っているもの。


その上、私たちは知識を持っています。情報を調べることで、さまざまなパターンがあることを知ることができ、ルール、ポリシー、ガイドライン、手順を定式化することでそれらのパターンを活用し、知識の形をとることができます。そして、ほとんどすべてのコンピュータープログラムは、何をしていても、一種の知識です。なぜなら、彼らはデータに取り組んでいて、それらにルールを適用しているからです。これら3つのレイヤーがあり、レイヤー間でさらに洗練が進んでいます。また、この図の左側には、新しいデータが入力されていることが示されているため、これらの多くは静的です。データは蓄積され、情報は蓄積され、知識は潜在的に成長しています。最上部には「理解」があり、哲学的な議論ではありますが、理解は人間にのみ存在するということを維持します。私がそれについて間違っていれば、いつかはすべてコンピューターに置き換えられます。しかし、議論をするのではなく、次のスライドに進みます。

これを見てみると、興味深いことですが、これは最近のことです。興味深いことは、分析が実際に何であるかを理解することでした。そして最終的には、さまざまな図を描いて、このように見える図を作成することで、実際には、分析開発は非常に多くの数式を使用した単なるソフトウェア開発であるという結論に達しました。分析的調査は、実際に多くの異なるモデルを使用して調査し、データに関する新しい知識を生成するという意味で、ソフトウェア開発とは少し異なります。しかし、一度生成すると、受動的意思決定支援と考えられるもの、つまりユーザーに伝えられる情報に実装されます。対話型の意思決定支援。OLAPのようなもので、ユーザーはさまざまなツールを使用して自分で物事を調査および推測できる構造化されたデータのセットをユーザーに提供します。多くの視覚化はそのようなものです。そして、収集した分析的洞察を実装可能な一連のルールに変えることができれば、自動化が行われます。必ずしも人間が関与する必要はありません。それは私がそのすべてを行ったときに私がそれを見ていたような方法です。そして、私にはさまざまなことが起こり始めました。アクティビティの領域になったら、データのドメインが実際にマイニングされ、徹底的にマイニングされ、あらゆる可能な方向で徹底的に探索され、最終的には結晶化されたBIになります。発明された知識は、さまざまな方法でさまざまなユーザーに情報を提供する知識になり始め、できれば、実際に彼らが行う仕事をする能力を高めます。

私が気づき、予測分析を約5年間見てきたことの1つですが、予測分析はBIになりつつあります。つまり、人々に情報を提供する有用な情報になりつつあり、既に指摘したように、自動化されたBIレポート、BI探索的、BI、非常に異なるグラデーション、予測分析が実際に3つのすべての方向に進んでいます。そして、私が指摘した分析プロセスは、ソフトウェア開発とそれほど変わらず、わずかに異なるスキルを持つ異なる人々によって行われます。本当に優れたデータサイエンティストを獲得するために必要なスキルは、取得するのに何年もかかることを強調する必要があると思います。彼らは簡単に習得できず、多くの人がそれを行うことはできませんが、それは何が有効で何が有効でないかを知るために非常に洗練されたレベルで数学を理解する必要があるからです。分析の開発、新しい知識の発見、分析の注入、それは知識を運用可能にすることです。それが、分析全体に見られる一種の背景です。それは巨大な領域であり、多くの多くの側面がありますが、一般化はすべてに当てはまると思います。

次に、ビジネスの混乱があります。先ほど申し上げたように、多くの組織がありますが、製薬会社もDNAに分析を持っています。しかし、実際にはDNAに含まれていない多くの組織があり、現在はソフトウェアとハ​​ードウェアが以前よりもはるかに安価になり、それを活用できるようになりました。多くのことを言います。まず、分析は多くの場合、R&Dです。組織の特定の領域に分析を適用するだけで、何らかの方法で顧客の注文をさまざまな観点から分析し、他のデータと結合することは、ありふれたものに見えるかもしれません。しかし実際には、分析は組織全体を見て、組織内で行われている特定のアクティビティやアクティビティのチェーン全体をほとんど分析する可能性を生み出します。しかし、実際にそのエリアに移動したら、私はそれが研究開発だと主張します。また、「会社が分析にいくら費やすべきか」という質問が何度かあります。それに答えるには、分析をR&Dと考えるのが最善の方法だと思います、「ビジネスの効率化の分野でR&Dにいくら費やしますか?」

そして、分析を行っていないビジネスには、知らないことがたくさんあります。まず第一に、彼らはそれをする方法を知りません。通常、組織内で実際に何らかの方法で分析を採用する場合、彼らはそれを行うのを支援できるコンサルタントに行くしか選択肢がありません。企業が実際にデータサイエンティストを雇い、1人を見つけ、1人に支払い、実際に彼らがやりたいことをすることを信頼します。非常に難しい。ほとんどの企業は、実際にこの作業を行うためにスタッフを雇用または教育する方法を知りません。その理由は、単純にDNAに含まれていないため、自然なビジネスプロセスの一部ではないからです。これは次のポイントにつながります。彼らはそれをビジネスプロセスにする方法を知りません。ちなみに、これを行うための最良の方法は、製薬会社や保険会社が見ているものをコピーすることです。ヘルスケアセンターの一部の会社は、分析を使用する方法を見てコピーすることです。それはビジネスプロセスだからです。警察や監査の方法がわかりません。本当に、特に今では非常に多くのソフトウェア会社が非常に多くの分析を自動化する製品を作成しているためです。監査についてのポイントは重要です。コンサルタントや現場に分析計算の結果が何であるかを理解できる信頼できる人がいる場合、それはあなたがしなければならない一種の選択ですが、本当に強力な分析ツールを分析を適切に理解していない人々の手は、正しくないかもしれない結論に飛びつく可能性があります。そして、私が言ったように、企業はそれをどのように予算化するかを知りません。

これらは分析のフレーバーであり、私はそれらをただ実行します。統計分析と統計モデリングは予測分析とは大きく異なり、そのほとんどは曲線近似です。機械学習はこれらのものとは異なり、パス分析と時系列は基本的にステータスストリームで行われますが、これもまた異なります。グラフ分析は再び異なり、分析とセマンティック分析は再び異なります。これは、これが非常に多ジャンルなものであることを指摘しているだけです。そうではなく、分析を開始するのではなく、抱えている問題に目を向け、それらに合ったさまざまなツールやさまざまな分析を探します。そして最後に、ネットネット。ハードウェアとソフトウェアの進化のため、私の意見では、分析はまだ始まったばかりです。まだまだたくさんありますが、今後数年間で展開されるでしょう。私は今ボールをデズに渡すことができると思います。

デズ・ブランフィールド: ええ、ロビン、従うべき厳しい行為について話してください。私のお気に入りの角度の1つである人間の角度から、このトピックに簡単にアクセスします。私たちの日常生活には非常に多くの変化が起こっています。現在の私の見解では、私たちの日常生活における最大の混乱の1つは、毎日の仕事です。仕事に戻り、あなたが雇う仕事をしようとしています。そして、日常の人からスーパーヒーローに行くことへの期待が高まり、組織の周りを流れ、非常に迅速に情報を発信しています。それは大きな挑戦であり、知識と情報の流れに対処するためのより良いツールを人々に提供しなければならないので、私は少し楽しい角度からこれに挑戦しようと思った。しかし、それは常に私がこの高心やフラッシュモブなどを持っていることを私に衝撃を与えます、それは私たちが分析として話しているものに向かって私たちを駆り立てています彼らがそれと対話し、それが自然であり、普通に感じるような方法でそれを行うことができます。

そして実際、幼い子供、小さな赤ちゃんが床に座ってそこに座ってiPadで遊んでおり、それが飛び回って画像をつまんで絞り、動かしてスクリーンで遊んでいるというYouTubeビデオを思い出させますそこのデータ。そして、親はiPadを取り出し、子供の膝に雑誌、編集雑誌を置きます。そして、この子はおそらく2歳以下です。子どもは雑誌の画面でスワイプを試みますが、ピンチとスクイーズをすると、雑誌は反応しません。子供は指を持ち上げてそれを見て、「うーん、指が機能しているとは思わない」と考えます。そして、それは腕で自分自身をつついて、「ああ、指が機能していると感じることができます。指がうごめくと、指がうごめいて反応します。はい。その後、雑誌と再びやり取りしようとしますが、目をつぶると、ピンチしたり、絞ったり、スクロールしたりしません。それから彼らは雑誌を取り去り、iPadをひざに戻したが、突然すべてが機能した。分析ツールやライブストリーミングツールを使用してエンターテインメントを行うためのトレーニングを受けた赤ちゃんがいます。雑誌のしくみやページのめくり方がわかりません。

それはそれ自体が興味深い概念です。しかし、組織内を移動する知識、データの流れ、人々の行動方法について考えるとき、人々がフラッシュ・モブであると学んだこと、それがどこで、どのソーシャル・メディアが作るかというこの概念をよく考えますこれはさらに簡単です。この日時にこの場所に行き、このビデオを見てこれらのダンスを学ぶか、この色の帽子をかぶって1時に北を指すというアイデアです。そして、あなたはこれをあなたのネットワークを通して押し出します、そして常に何百人もの人々が同じ場所で同時に同じことをします。そして、このすごい要因があります。しかし、実際にはそれは非常にシンプルなアイデアであり、シンプルなコンセプトがネットワークを介して押し出されているだけであり、視覚的に衝撃的で印象的な印象を与えるこの結果が得られます。そして、組織、人々の行動、情報システムと顧客への対処方法について考えるとき、それは多くの場合非常に単純であり、それは私たちが渡そうとするアイデアや概念、文化的または行動的な特性ですツールと情報を活用して権限を付与します。

そして、私が25年以上にわたって持ってきたこのマントラであるすべてを支えています。つまり、スタッフが仕事に必要なものを見つけられない場合、ツールであれ情報であれ、常に車輪を再発明します。そして、これは今ますます大きな課題になっています。多くの知識と多くの情報と物事が非常に速く動いているので、人々が車輪を再発明するのを止めたいです。私のお気に入りの1つである人々の角度に戻って作業環境を考えると、キュービクルが良い結果をもたらす環境ではないことに驚いたとき、またはこの恐ろしいものを並べたとき、私は驚きましたここの写真は、あまり変わっていません。壁を下げて、作業スペースを開いたと呼びます。しかし、真ん中に黄色のループがあり、知識を交換している2人の人がいます。それでも、部屋の残りの部分を見ると、そこに座っているすべての人が忠実にそこにぶつかり、情報を画面に表示します。たいていの場合、実際に知識やデータを交換するわけではありません。それにはさまざまな理由があります。しかし、黄色い円の左側の床の真ん中にあるインタラクションでは、2人の人がそこからチャットし、知識を交換し、おそらく何かを見つけようとして、「このレポートがどこにあるのか、それはおそらく機能していないので、彼らは何も持っていないので、床をさまよい、キュービクルのオフィススペースのルールを破って、それを直接やりました。

そして、私たちは冗談を言って冗談を言ってオフィスの周りに似たような環境を持っていましたが、現実にはそれらは非常に強力で効果的です。そして、私のお気に入りの1つは、ウォータークーラーと呼ばれるモバイルまたは固定の分析プラットフォームです。人々はそこに着いて、周りでしゃべり、知識を交換し、ウォータークーラーに立ってアイデアを交換しながら、アイデアを比較し、分析を実行します。それらについて考えるとき、それらは非常に強力な概念です。そして、それらをシステムやツールに変換できれば、素晴らしい結果が得られます。そして、私たちはこれまでもお気に入りでした。これは、本質的にはオフィスの最も強力なデータ配信ハブであり、レセプションデスクとしても知られています。そして、あなたが何かを見つけることができないならば、あなたはどこに行きますか?さて、あなたはオフィスの前に歩いてレセプションに行き、「x、y、zがどこにあるか知っていますか?」と言います。仕事やある時点で彼らが何かを見つけられないとき。そして、あなたは自問する必要があります、なぜ彼らはそうなのですか?イントラネットまたはツールなどのどこかにあるはずです。見つけやすいはずです。

ですから、データと分析、および仕事をするためにスタッフに提供したツールと、人間が仕事とやり取りする方法に関しては、分析ツールとビッグデータプラットフォームが最近登場する前に、 、または「データ処理」とも呼ばれ、古い学校では、レポートと知識の共有は動的または共同またはオープンとはほど遠いものであり、人々が仕事をすることを期待するシステムのタイプについて考えると、古典的なものがありました人々は今、レガシーと呼んでいますが、現実は、それが乗っているのはレガシーだけであり、今日もまだここにあるということです。したがって、実際にはレガシーではありません。しかし、従来のHRシステムとERPシステム–人事管理、エンタープライズリソースプランニング、エンタープライズデータ管理、および会社を運営するために情報を管理するために使用するシステム。常にサイロ化されています。そして、トップエンドから、部門イントラネットのようなシンプルなプラットフォームは、物事がどこにあるのか、どのようにそれらを取得するのか、場所の周りの知識と対話する方法を伝えようとします。これをイントラネットに表示します。それは時間と労力をかけてそこに置く人たちと同じくらい良いだけです。または、データがフードチェーンの最下部、企業のSAN、およびその間のすべてにあるため、ストレージエリアネットワークはファイルとデータでいっぱいですが、誰がそれを見つけるかを知っています。

多くの場合、これらのクローズドデータプラットフォームまたはクローズドシステムを構築しているため、人々はスプレッドシートやPowerPointのようなものに戻り、情報をその場所に伝えています。しかし、最近私の中で心に浮かんだ面白いことがありました。それは、モバイルデバイスとインターネットが一般的に、物事が実際に良くなるという考えに作用するということでした。そして、主に消費者のスペースで。そして、日常生活でインターネットバンキングのようなものが増え始めたことは興味深いことです。実際に銀行に行って彼らとやり取りする必要はありませんでした。電話で行うことができます。もともとそれは不格好でしたが、その後インターネットが広まり、ウェブサイトができました。ご存知のように、最近実際に何回銀行に行ったことがありますか?私は実際にはこれができません。先日このことについて会話しましたが、最後に銀行に行ったときのことを思い出せません。ショックを受けたので、これを思い出せなければならないと思いましたが、それはとても長かったです前に私は実際に私がそこに行ったときに覚えていないことができます。そして今、私たちはこれらのガジェットをモバイルと電話、タブレットとラップトップの形で手にしています。ネットワークとツールとシステムへのアクセスがあり、物事がより良いものになることを学んだ消費者スペースがあります。消費者空間の急激な変化は、企業や環境内でより無気味で氷河的な変化をもたらしているため、その変化を日々の労働生活に常に取り入れているわけではありません。

また、ハードコピーへのライブストリームデータを配信できないという事実に興味を持って楽しんでいます。この画像には、実行された分析を見て座っている人がいます。また、おそらく統計学者またはアクチュアリーとして多額のお金を支払われている人によって作成された美しいグラフがあります。ハードコピーの分析と突っ込みます。しかし、ここに私にとって恐ろしいことがあります。たとえば、この会議室にいるこれらの人々は、例としてこれを使用します。彼らは現在歴史的なデータを操作しています。そして、それが作成されてから編集されたときと同じくらい古いので、1週間前のレポートかもしれません。現在、彼らは悪いデータではなく、常に悪いデータである可能性のある古いデータについて決定を下しています。彼らは今日、歴史的なものに基づいて決定を下していますが、これは本当に悪い場所です。このハードコピーをタブレットや携帯電話などに置き換えました。消費者向けのスペースで非常に迅速に解決できたため、今ではエンタープライズ向けのスペースで解決しました。リアルタイムの洞察はリアルタイムの価値です。

そして、それはどんどん良くなっています。そして、ロビンが以前に提起したポイントに私を連れて行きます。それは市民データ科学者の概念であり、この概念の推進力でした。私にとって、市民のデータサイエンティストは、iPadのようなものに関する適切なツールと情報を持っている普通の人々です。彼らは数学をする必要はありません、彼らはアルゴリズムを知る必要はありません、彼らはアルゴリズムとルールデータを適用する方法を知る必要はありません、彼らはただインターフェースを使用する方法を知る必要があります。そして、それが私の紹介と、iPadと雑誌、iPadと一緒に座っている幼児の概念に戻ります。幼児は、iPadのインターフェイスを使用して情報に飛び込み、情報を操作する方法を非常に迅速かつ直感的に学習できます(ゲーム、ストリーミングメディア、ビデオなど)。しかし、雑誌バーから同じ反応やインタラクションを得ることができず、ページごとにページをフラッシュするだけで、特にiPadで育った幼児の場合、あまり魅力的ではありません。常に、私たちが提供するだけで、モバイルデバイス、特に十分な大きさの画面を備えたタブレットやスマートフォンなどのインターフェイスを提供する場合、特に対話することができる場合、人はツールや物を操作する方法を非常に迅速に見て学ぶことができます指の動きで触れてみると、市民データサイエンティストというこの概念が突然現れます。

適切なツールを使用してデータサイエンスを適用できるが、その方法を実際に知る必要がない人。そして、私の考えでは、これの多くは、私が言ったように、需要と企業に移動し、変化した消費者の影響によって推進されました。いくつかの非常に簡単な例。私たちの多くは、小さな広告を入れたり、追跡や移動を確認したり、ブログやウェブサイトで何かを始めたり、Googleアナリティクスのようなツールを使用したり、ブログや小さなウェブサイトで目が覚めた、そこに少しのコードを入れることができ、Googleはウェブサイトに誰がいつ、どこで、どのようにアクセスしているかについてリアルタイムの洞察を与えてくれます。そしてリアルタイムで、実際に人々がウェブサイトにアクセスし、ページを閲覧してから消えていくのを見ることができました。そして、それは非常に驚くべきものでした。リアルタイムアナリティクスを人々に説明しようとすると、GoogleアナリティクスがプラグインされたWebサイトを見せて、Webサイトにアクセスしている人々との実際のやり取りを実際に見て、ビジネスに対するこうした洞察をリアルタイムで得ました。」

小売業の例と、おそらく医薬品を考えてみましょう。アメリカのドラッグストアと呼んで、頭痛薬から日焼け止めクリームや帽子に至るまですべてを購入する薬局です。リアルタイムの情報なしでその組織を運営しようとすることは、私たちが知っていることを知っている今では怖い概念です。たとえば、交通量を測定したり、画面の片側にスマイリーの顔をしたデバイスを店の周りに置いたり、右端に不幸な赤、中央にいくつかの異なる色合いを置くことができます。また、最近では「ハッピーオアノット」と呼ばれるプラットフォームがあり、ショップに足を踏み入れると、実際の顧客感情のフィードバックに応じて、幸せそうな顔や悲しい顔を叩くことができます。そして、それはリアルタイムでインタラクティブにすることができます。ライブの需要主導型の価格設定を取得できます。そこにたくさんの人がいる場合は、価格を少し上げて、在庫状況を確認して、たとえば人々に伝えることができます。たとえば、航空会社は、あなたがウェブサイトで何席空いているかを教えますフライトを予約しているときは、ランダムにダイヤルインするだけでなく、ターンアップしてフライトを取得できることを願っています。ライブHRデータを使用すると、人々がクロックオンとクロックオフのタイミングを判断できます。調達、調達中にライブデータを取得している場合、1時間待って米ドルの価格をヘッジして、次の在庫を購入し、トラックを積み上げることができます。

人々にGoogle Analyticsを見せて、そのような逸話、このエウレカの瞬間、この「a-ha!」の瞬間を中継すると、この電球は「うーん、そうすることができる場所をたくさん見ることができます」 。私がツールを持っていて、その知識にアクセスできたなら。」そして、私たちはソーシャルメディアでこれを見ています。朝食の写真を表示するだけでなく、賢いソーシャルメディアユーザーであれば、好きなものの数、トラフィックの量、友人の数を見る傾向があります。たとえば、分析ツールとしての。 .comにアクセスしてツールを使用できますが、Googleアナリティクスのドットコムに入力するか、右上のボタンをクリックしてメニューをプルダウンして実行すると、これらのきれいなライブグラフが表示され、ツイートの数がわかります「自分自身とそれらとの相互作用の回数。そして、あなたの個人的なソーシャルメディア上でのリアルタイム分析。 Google AnalyticsやLinkedIn、LinkedInなどのeBayの統計情報があなたの職場環境にあるとしたらどうでしょうか。

今、私たちは指先でライブのウェブとモバイルを手に入れました。それはパワーの概念になります。そしてそれが私の結論に私を導きます、そしてそれは常にツールとテクノロジーを早期に活用する組織が、競合他社が実際に追いつかないかもしれないほど競合他社に対して非常に大きな利点を得るということを発見したということですそして、私たちは今、市民データ科学者の対立によってそれを見ています。スキル、採用した知識、そして適切なツール、特にリアルタイムデータを表示してデータを発見し、キュービクルを歩き回らずにデータの場所を把握できる機能を備えた人を採用できれば質問を声に出して、人々と比較分析を行うためにウォータークーラーに行ったり、インデックスがどこにあるかレセプションに行ったりする必要があります。彼らが指先でそれを行うことができ、彼らが彼らの会議にそれを持って行き、ハードコピーではなくリアルタイムで画面をめくって会議室に座ることができれば、突然、私たちは実際である必要のないスタッフに力を与えましたデータサイエンティスト。ただし、実際にデータサイエンスを使用し、組織の驚くべき成果を促進します。そして、消費者が企業へと駆り立てられた今、私たちが実際に通過したこの転換点、課題はその企業をどのように提供するかであり、それが今日の議論のテーマだと思います。それで、作品をまとめて、それを解決する方法をお聞きします。デビッド、あなたに。

デビッド・スウィーナー: よろしくお願いします。本当にありがとうございます。ロビンにも感謝します。ロビン、あなたの元の評価に同意します。分析プロセス、それは実際にソフトウェア開発と違いはありません。組織内での課題は、実際のところ、物事がそれほど明確に定義されておらず、おそらく探索的な要素と創造的な要素があると思います。 Dez、あなたは知っています、あなたに同意します、車輪の再発明がたくさんあります、そしてあなたは私が今日入る組織がないことを知っています、あなたは質問、まあ、なぜあなたはそれをこのようにしていますか?なぜビジネスはこのように運営されているのですか?また、質問するのは簡単です。また、組織内にいる多くの場合、変更することは困難です。私は物事の類推、消費化が大好きです。そのため、空港に行って座席を変更する必要がなくなったときは、携帯電話でそれを行います。ブースのエージェントに行く必要はなく、そのエージェントがモノクロモニターで15分間何かを入力するのを見て、座席の割り当てを変更する必要はありません。私は自分の電話でそれをすることを好むので、それは興味深い発展です。

今日は、集合知について少しお話します。知らない人にとって、Statisticaは最先端の分析プラットフォームであり、30年以上も前から存在しています。アナリスト業界の出版物を見ると、最も直感的で使いやすい高度な分析ソフトウェアパッケージの1つとして常に注目されています。そのため、ここ数年、集合知能と呼ばれる概念に取り組んできましたが、それを次のレベルに引き上げています。この会話を始めたかったのは、あなたの組織でどのように仕事をするのですか?

ここには2つの画像があります。左側の画像は1960年代の画像であり、1960年代にキャリアを始めたわけではありませんが、右側の画像は、私が働き始めた半導体工場です。そして、私はその黒い建物で、左上の黒い屋上で働きました。しかし、彼らは半導体製品を作りました。これはGoogle Imagesの最近の写真です。しかし、左の1960年代の画像に戻ると、非常に興味深いです。これらの人々は一列に並んでいて、彼らは集積回路と半導体を作っています。しかし、標準化があり、物事を行う標準的な方法があり、明確に定義されたプロセスがありました。おそらく、これらの人々はすべてオープンな環境に座っているため、何らかのコラボレーションが行われた可能性があります。私たちは知識労働力の中でそれを少し失ったと思います。

左上にあるその建物に座ったとき、誰かと協力したいなら、それは開かれていませんでした。これらのオフィスがあり、おそらくチームの一部は遠隔地にあったか、このキャンパスを横断しなければならなかったかもしれません。徒歩25分で、建物の一番右にいる人と話をしなければなりません。途中で何かを失ったと思います。それで、私は同じ考えを持っていた、なぜ人々はあなたの組織内で車輪を再発明し続けるのか? 1990年代と2000年代に、CRMとデータウェアハウジング、そしてある程度のBIで、組織全体が良い仕事をしたと思います。何らかの理由で、分析が少し遅れています。データウェアハウジング、データの標準化、正規化、およびこれらすべてとCRMに多大な投資が行われましたが、分析は何らかの理由で遅れをとっています。そして、なぜだろうか。クリエイティブがあるかもしれません-あなたのプロセスが明確に定義されていない、多分あなたはあなたのビジネスで物事を変えるためにどの決定やレバーを回そうとしているのかわからないかもしれません。今日、組織に入ると、スプレッドシートで非常に手作業をしている人がたくさんいます。

そして、ご存知のとおり、私は今朝の統計を見て、スプレッドシートの80、90%にエラーがあり、これらのいくつかは非常に重要であると言ったと思います。 JPMorgan Chaseがスプレッドシートエラーにより数十億ドルを失ったWhaleのようなもの。だから私は、物事を成し遂げるためのより良い方法が必要だと思う前提を持っています。そして、前述したように、これらのデータサイエンティストがいます。これらの人は高価で、見つけるのが難しいです。そして時々彼らは少し奇妙なアヒルです。しかし、データサイエンティストとは何かを要約しなければならないとしたら、データを理解しているのはおそらく誰かだと思います。数学を理解している人、問題を理解している人だと思います。そして、本当に、結果を伝えることができる誰か。また、データサイエンティストの方は、最近数年で給与が2倍になった可能性が高いため、最近は非常に幸運です。

しかし、多くの組織では、これらのデータサイエンティストはいませんが、あなたの組織には優秀な人材がいます。組織があり、優秀な人が多く、スプレッドシートを使用しています。統計と数学は主な仕事ではありませんが、データを使用してビジネスを推進します。実際、私たちが取り組んでいる課題は、データサイエンティストまたは統計学者が1人または2人いることが幸運である場合、どのようにすればよいか、それらをどのように取り、それらの人々とのコラボレーションをどのように改善できるかです。組織内の他の個人ですか?組織がどのように構成されているかを見てみましょう。まず始めに、右から左に進みます。そして、これは逆行であることは知っていますが、この種のビジネスユーザーがいます。

これがナレッジワーカーの大部分であり、これらの人々にとっては、基幹業務アプリケーションに分析を埋め込む必要があります。おそらく、コールセンターの画面などに分析結果が表示されており、顧客に提供する次善の提案を伝えている可能性があります。ウェブポータルの消費者またはサプライヤである可能性があり、即座にクレジットなどを提供します。しかし、考えは、彼らは分析を消費しているということです。真ん中に行くと、これらは知識労働者です。これらは、今日のスプレッドシートで何かをしている人々ですが、スプレッドシートはエラーが発生しやすく、ある時点でガスを使い果たします。これらの市民データ科学者は、私たちが彼らと呼んでいるように、彼らのために私たちがやろうとしていることは、本当に自動化のレベルを高めることです。

分析では、作業の80〜90%がデータ準備の部分にあり、実際の数学ではなく、データ準備であると聞きます。あなたがそうするかどうかにかかわらず、私たちはそれを自動化しようとしています。そして、ウィザードとテンプレートと再利用可能なものがあり、あなたはあなたの環境内の基礎となるインフラストラクチャの知識を持つ必要はありません。そして、左端を見ると、これらのデータサイエンティストがいます。そして、私が述べたように、彼らは不足しています。そして、彼らの生産性を高めるために私たちがやろうとしていることは、これらの市民データ科学者ができることを彼らができるようにすることです。レゴブロックのようなものだと考えてください。そのため、これらのデータサイエンティストは、市民のデータサイエンティストが使用できる再利用可能な資産を作成できます。一度構築すれば、車輪を再発明し続ける必要はありません。

そして、これらの人たちは、データベースで何かをすることができ、あなたの会社が行った既存の技術投資を活用できるかどうか心配するかもしれません。ご存知のように、今日、世界中でデータをやり取りすることは意味がありません。ですから、私が述べたように、Statisticaを見ると、かなり長い間存在しているプラ​​ットフォームです。そして、それは非常に革新的な製品です。データブレンド。アクセスできないデータソースはありません。私たちはあなたが期待するすべてのデータ発見と視覚化のものを持っています。リアルタイムで実行できます。そしておそらくそうです。ソフトウェアツール内には16,000を超える分析機能があると思うので、これは私がこれまで使用したり理解したりできなかった数学ですが、必要な場合はそこにあります。

ビジネスルールと分析ワークフローの両方を組み合わせて、実際にビジネス上の決定を下すことができます。アルゴリズムを超え、ワークフローを示しますが、常に対処しなければならないビジネスルールがあります。ガバナンスは非常に安全です。 FDAが私たちを信頼しているという点で、私たちは多くの製薬クライアントで使用されています。ご承知のとおり、私たちが彼らに受け入れられる統制と監査能力があることをプリンで証明してください。そして最後に、私たちはオープンで柔軟かつ拡張可能であるため、データサイエンティストの生産性を向上させ、市民のデータサイエンティストの生産性を向上させ、それを可能にするプラットフォームを作成する必要がありますこれらの分析出力を組織内のワーカーに展開します。

それを見てみると、いくつかの視覚化の例があります。ただし、分析出力を基幹業務ユーザーに配布できるため、左の最初の例はネットワーク分析図です。そして、おそらくあなたは詐欺捜査官であり、これらの接続がどのように行われるのか分からず、これらは人であり得、これらは実体であり得、これらは契約であり得ます。しかし、あなたはこれをマウスで操作し、それと対話して本当に理解することができます-あなたが詐欺捜査官であれば、誰に話をすることができないので、調査に行く人の優先順位リストを理解します優先順位を付けます。

予測メンテナンスダッシュボードの右側の画像を見ると、これは非常に興味深い問題です。おそらく、あなたは空港の所有者で、そこにこれらのボディスキャナーがあります。これらのボディスキャナーは、空港に行くと、約9か月の貯蔵寿命を持つコンポーネントがいくつかあります。そして、これらは本当に高価です。空港に複数のエントリポイント、複数のスキャナーがあり、ナンバー1になっている場合は、各ゲートに適切なスタッフが配置されていることを確認し、スキャナー内の部品についても注文したくない早く、私はそれが故障する前にそれらを持っていたいです。おそらく空港を所有している場合、これらの事態がいつ解消されるかを予測し、人員配置レベルを予測することができます。

右下を見ると、これは製造環境にいる場合で、製造フローのグラフィカルな表現です。少し見づらいですが、これらのさまざまなプロセスセクターには赤と緑の信号機があります。したがって、エンジニアの場合、非常に高度な数学がそこに行きますが、その特定のプロセスセクターを掘り下げて見ることができます。パラメータ、およびそれを入力すると、おそらく制御不能になります。市民データ科学者に目を向けると、私たちの目標は、市民データ科学者が簡単にできるようにすることです。ウィザードとテンプレートがありますが、本当に興味深いのは、この自動化されたデータヘルスチェックノードがあることです。そして実際にこれが何をするか、組み込みのスマートを持っています。

データの準備について言及しました。データの集約と準備の両方にかなりの時間がかかります。しかし、データがあると仮定して、このデータヘルスチェックノードを介して実行でき、不変性、スパース性、外れ値、およびこれらすべてをチェックし、欠損値を埋め、多くの計算を行います理解できないので、デフォルトを受け入れるか、もう少し賢い場合は変更できます。しかし、ポイントは、そのプロセスを自動化することです。このことは、クレンジングされたデータセットに対して約15の異なるチェックと結果を実行します。私たちがしているのは、人々がこれらのワークフローを簡単に作成できるようにすることです。

ここで、データサイエンティストと市民データサイエンティストのコラボレーションについて話します。これらの画像を右側で見ると、このデータ準備のワークフローがわかります。多分これは非常に洗練されているかもしれません。これはあなたの会社の秘密のソースかもしれません。私は知りませんが、組織内の誰かがこれらのデータサイロにアクセスできることは知っています。 1つ目は、それらをつかんでつなぎ合わせる方法、そして2つ目は、データヘルスチェックを超えた特別な処理が必要な場合があり、それがあなたの会社の秘密のソースです。組織内でこのワークフローを作成できますが、ノードとして折りたたまれます。下向きの矢印が表示されますが、これは単なるノードであり、組織内にはこれらのアイテムが100個あります。アイデアは、特定の空間について何かを知っている人々がいて、ワークフローを作成でき、他の誰かがそれを再利用できるということです。車輪の再発明を最小限にしようとしています。

そして、分析モデリングワークフローでも同じことができます。右側のこの場合、このワークフローには、おそらく15の異なるアルゴリズムがあり、タスクに最適なアルゴリズムを選択します。そして、市民のデータ科学者として、クモの巣で何が起こっているかを理解する必要はありませんが、それはただノードに崩壊し、そのノードは単に「信用リスクスコアを計算する」と言います。何がありますか「何かが不正な取引である確率を計算します。」市民データ科学者として、私は他の誰かが構築したこの非常に洗練された数学を使用できます。

データサイエンスの観点から、コードを書くのが好きなデータサイエンティストと話をし、コードを書くのが嫌いなデータサイエンティストと話をしました。それで問題ありません。非常に視覚的でグラフィカルなユーザーインターフェースがあります。データを取得し、自動化されたデータヘルスチェックを行うことができます。おそらくコードを書きたいと思います。私はPythonが好きで、Rが好きですが、アイデアは、これらのデータサイエンティストが不足していることで、特定の言語のコードが好きです。コーディングする言語を特に優先しているわけではないため、Rを実行する場合はRを実行してください。 Pythonを実行したい場合は、Pythonを実行します。それは素晴らしいことです。分析をAzureにバーストしたい場合は、分析をクラウドにバーストします。したがって、ここでの目標は、データサイエンティストを可能な限り生産的にするための柔軟性とオプションを提供することです。

現在、データサイエンティストは非常に頭がいい人ですが、すべての専門家ではないかもしれません。また、できることにはギャップがあるかもしれません。業界内を見ると、そこにはさまざまな分析市場が存在します。これは一例です。画像認識を行う必要があるかもしれませんが、そのスキルを持っていません。Algorithsiaに行って画像認識アルゴリズムを取得することもできます。たぶん私はApervitaに行き、非常に特別なヘルスケアアルゴリズムを取得します。 Azure Machine Learning Libraryで何かを使用したいのかもしれません。ネイティブのStatisticaプラットフォームで何かを使用したいのかもしれません。

繰り返しますが、ここでの考え方は、グローバルな分析コミュニティを活用することです。 4つの壁の中ですべてのスキルを備えているわけではないため、ソフトウェアを作成するにはどうすればよいのか(これが私たちの仕事です)、データサイエンティストはさまざまな市場のアルゴリズムを使用できます。私たちはRとPythonで長い間それをやってきましたが、これはそこに存在するこれらのアプリ市場にそれを広げています。この上に表示されるのと同じように、SparkでH2Oを使用しているため、多くの分析アルゴリズムがあります。これらをゼロから作成することに集中する必要はありません。オープンソースコミュニティに存在するこれらを再利用しましょう。これらの人々ができるだけ生産的になることを望んでいます。

市民のデータサイエンティストとデータサイエンティストを獲得した後の次のステップは、これらのベストプラクティスをどのように促進し、配布するかです。ソフトウェアには、分析をどこにでも配布できる技術があります。そして、これはモデル管理の見方に近いものですが、タルサ、台湾、カリフォルニアの4つの壁や特定の設備に拘束されることはありません。これはグローバルなプラットフォームであり、複数のサイトで使用されている多くのお客様がいます。

本当に重要なのは、台湾で何かをしていて、ブラジルでそれを複製したい場合、それは素晴らしいことです。そこに行き、再利用可能なテンプレートを取得し、必要なワークフローを取得します。これは、それらの標準と物事を行う一般的な方法を作成しようとしているので、私たちはどこでも完全に異なることをしているわけではありません。そして、これのもう1つの重要な要素は、データが存在する場所に数学を持ち込みたいということです。カリフォルニアとタルサ、台湾とブラジルの間でデータをシャッフルする必要はありません。データに数学を取り入れることができるテクノロジーがあり、そのテーマに関する別のホットテクノロジーのウェブキャストがあります。

しかし、私たちはこのアーキテクチャを呼び出します。ここでは、ネイティブ分散分析アーキテクチャの詳細を紹介します。この背後にある重要なアイデアは、Statisticaというプラットフォームがあることです。分析ワークフローをアトムとしてエクスポートできます。モデルやワークフロー全体を実行できるので、それは問題ではありません。しかし、これを作成し、ターゲットプラットフォームに適した言語でエクスポートすることはできます。これの左側では、多くの人がこれを行いますが、ソースシステムでスコアリングします。結構です、得点ができるし、データベースでモデルを構築できるので、面白いです。

そして、右側にBoomiがあります。これはコンパニオンテクノロジーであり、これらすべてと連携しています。しかし、これらのワークフローを利用して、基本的に世界中のどこにでも転送することもできます。 IPアドレスを持つもの。また、パブリッククラウドまたはプライベートクラウドにStatisticaをインストールする必要はありません。 JVMを実行できるものなら何でも、これらの分析ワークフロー、データ準備ワークフロー、またはこれらのターゲットプラットフォームのいずれかでモデルを実行できます。パブリッククラウドでもプライベートクラウドでも、トラクター、車、自宅、電球、モノのインターネットなど、世界中のどこにでもワークフローを転送できるテクノロジーがあります。

確認してみましょう。基幹業務ユーザーがいるので、これらの人々は、彼らが使いやすい形式で出力を消費できるようにする技術を持っています。市民のデータサイエンティストがいます。私たちがやろうとしているのは、コラボレーションを改善し、チームの一員にすることです。そして、人々に車輪の再発明を止めてほしい。これらのデータサイエンティストはスキルギャップがあるかもしれませんが、希望する言語でコーディングでき、分析市場に行き、そこでアルゴリズムを使用できます。それで、これで、すべてがこれで素晴らしいと思うことができませんでしたか?これは完璧です、これが私たちがやっていることです。再利用可能なワークフローを構築し、人々に指示を与え、レゴブロックを提供して、これらの強力な城や彼らがやりたいことを構築できるようにします。つまり、基幹業務ユーザー、市民データサイエンティスト、プログラマーデータサイエンティストを強化するプラットフォームがあります。あらゆる種類のIoTエッジ分析のユースケースに対処することができ、この集合的インテリジェンスの概念を実現しています。それで、おそらく質問のためにそれを開くと思います。

ロビン・ブロア: まあいいよ。私は最初に考えます-正直に言うと、私は以前にDell Statisticaからブリーフィングされたことを意味します、そして正直に言うと、あなたがプレゼンテーションで育てたことを知らなかったことに本当に驚いています。そして、一つのことは、それが分析の採用において私にとってバグベアであったことであると言わざるを得ません。それは、あなたが知っているように、ツールを手に入れることはそうではありませんか?そこには非常に多くのツールがあり、オープンソースのツールなどがあり、さまざまな、いわゆるセミプラットフォームがあります。しかし、あなたが持っている違いは、ワークフローのいくつかに特に感銘を受けたと思います。

しかし違いは、エンドツーエンドで提供しているように見えることです。アナリティクスは、データの取得から始まり、データがいかに不安定であるかに応じて一連のステップ全体を実行する洗練されたビジネスプロセスのようであり、その後、データ。そして、結果は何らかの形で現れ、それらは行動である必要があります。私が目にした膨大な量の分析では、多くの素晴らしい作業が行われましたが、それを実行することはできません。そして、あなたは非常に多くの必要なものを持っているようです。どれほど包括的かはわかりませんが、予想以上に包括的です。私はそれに非常に感銘を受けました。

スプレッドシートについてコメントをお願いします。あなたはすでに何かを言っていますが、私が指摘し、長年にわたって指摘してきたことの1つですが、それはますます明白になっています、シャドウシステムであるスプレッドシートがたくさんあり、本当に思うスプレッドシートは、導入されたときは素晴らしいツールであり、さまざまな方法で素晴らしいものでしたが、一般化されたツールであり、実際には目的に合っていません。確かにBIコンではあまり良くありません。アナリティクスコンではひどいものだと思います。そして、たとえば、Statisticaがフラッシュアウトした、スプレッドシートの過度の使用、またはそれについてコメントしたいという例について、コメントする必要があると思いますか?

デビッド・スウィーナー: ええ、有名なスプレッドシートの間違いを調べることができると思います。 Googleまたは使用している検索エンジンは、多くの結果を返します。スプレッドシートを置き換えることはないと思います。それは私たちの意図ではありませんが、私が行く多くの組織、これらのスプレッドシートウィザードや忍者、またはそれらを呼び出すものがいくつかありますが、これらは非常に洗練されたスプレッドシートを持っているので、人々は宝くじに勝ち、彼らは戻ってきませんか?そして、私たちがやろうとしていることは、スプレッドシートが存在することを知っているので、それらを取り込むことができますが、私たちがやろうとしているのは、ワークフローを視覚的に表現して、理解して他の人と共有できるようにすることです。スプレッドシートは非常に難しく、共有するのは非常に困難です。そして、スプレッドシートを私に渡すとすぐに、私はそれを変更しましたが、今では同期が取れておらず、さまざまな回答が得られています。私たちがやろうとしていることは、これをガードレールで囲み、物事をもう少し効率的にすることです。また、スプレッドシートは複数のデータセットを組み合わせるのが本当にひどいですよね?彼らはそこに落ちます。しかし、それらを置き換えるつもりはありません。摂取します。そして、スプレッドシートを使用している人がやろうとしている「リスクを計算する」というノードがあるなら、シフトし始めています。だからそれらはなくなった。

ロビン・ブロア: ええ、つまり、私が物事を見る観点の1つから、スプレッドシートは情報を作成するのに最適だと思います。彼らは知識の島を作るのにも優れていますが、知識を共有するのは本当に悪いです。彼らはそれを行うためのメカニズムを一切持っておらず、スプレッドシートを誰かに渡すと、彼らが何をしているのかを正確に説明する記事のように読むことができるわけではありません。そこにないだけですプレゼンテーションとStatisticaの能力について最も感銘を受けたのは、信じられないほど不可知論者のようです。しかし、このスレッドはワークフローで実行されています。データ取得から特定のBIアプリケーションへの埋め込み、さらにはアプリケーションの実行まで、エンドツーエンドのワークフローを見ることができると思いますか?

デビッド・スウィーナー: ええ、絶対に。そして、そのエンドツーエンドの機能があり、一部の組織はそれを完全に使用しています。そして、最近では、ある会社がすべてを1つのベンダーから購入しているという幻想はありません。ミックスがあります。すべてにStatisticaを使用する人もいれば、モデリングワークフローに使用する人もいれば、データ準備ワークフローに使用する人もいます。一部の人々は、それを使用して何百ものエンジニアリングレポートをエンジニアに配布しています。そして、その間にすべてがあります。そして、それは本当にエンドツーエンドであり、RまたはPython、Azure、Apervitaなどで使用したいアルゴリズムがあれば、それらを使用するという点で、不可知論的なプラットフォームです。それは素晴らしく、生産的であり、あなたが知っていることを使い、あなたが満足しているものを使います、そして私たちはそれらが管理され監査されることを確実にするメカニズムを持っています。

ロビン・ブロア: 私は特にその側面が好きです。つまり、あなたが言ったことを超えて、そこにあるものの豊かさについて話すことができるかどうかはわかりません。つまり、私はこれを見てきましたが、包括的な方法で見たことはありませんし、確かに私たちのライブラリには膨大な量のPythonライブラリがありますが、その写真に追加できるものはありますか?それは非常に興味深いことだと思います。信頼できるコンポーネントを作成するという考えは、それを作成したさまざまな人々や、ダウンロードできるさまざまな人々を知っていたからです。あなたはそれについてすでに言ったことを豊かにすることができますか?

デビッド・スウィーナー: ええ、私はアプリ市場のいくつか、あなたが知っている、そこにあるアルゴリズム市場だと思います。たとえば、アイオワ大学のジョン・クロムウェル博士は、手術中にリアルタイムで使用される予測モデルを開発しました。手術部位感染。そして、そのスコアが十分に高い場合、手術室で直接介入します。とても興味深いです。それで、それほど大きくない別の病院があるかもしれません。まあ、Apervitaは分析のための健康アプリ市場です。これらのアプリマーケットプレイスの多くで1つを見つけて、それを見つけて再利用できます。トランザクションは、あなたとそれを所有する人との間で行われますが、1つを見つけて行くか、「ここにあります」誰もが専門家であり、すべてを知ることはできないため、グローバルコミュニティを活用していると思います。 RとPythonは一つのことだと思いますが、「この機能を実行し、これらのアプリ市場の1つに仕様を公開し、誰かに開発してもらいたい」という考えがあります。これは非常に興味深く、純粋にオープンソースモデルとは大きく異なります。

ロビン・ブロア: 大丈夫。とにかく、ボールをデズに渡します。デズに飛び込みたいですか?

デズ・ブランフィールド: もちろん、ここで説明していることの多くの適切な要点を把握できたと思うので、スプレッドシートのことをちょっとの間だけ続けたいと思います。そして、物理的な形式の古いスプレッドシートから電子形式への移行について、Robin氏はコメントしました。おもしろいことに、スプレッドシートはもともと行と列のある紙のシートでしたが、手作業で書き留めてから、力を入れて計算します。頭上または他のデバイスを使用してください。しかし、手書きの間違いや失読症でエラーが入り込む可能性がまだあり、今ではタイプミスに置き換えています。リスクは、スプレッドシートを使用するとリスクプロファイルがより速く、より大きくなることですが、Statisticaなどのツールはリスクピラミッドを反転させると思います。

私はよく、この絵を人間の棒人間のトップのホワイトボードに1人で描き、次にそれらのコレクションを下に描きます。ピラミッドのポイントが一人の人に、ピラミッドの足が人の集まりになっているピラミッド。そして、これを使用して、トップの1人がスプレッドシートを間違えて10人と共有した場合、エラーのコピーが10個あるという考えを視覚化します。マクロに非常に注意し、それに移動する場合はVisual Basicに非常に注意してください。スプレッドシートのような電子ツールを構築するとき、それは非常に強力ですが、良い面と悪い面でも強力だからです。

Statisticaのようなツールは、そのリスクプロファイルを反転させる能力をもたらすと思います。つまり、個々の人が利用できる多くのツールを手に入れることができます。これらのツールとアルゴリズムを構築している人たちのチームがいる場合、ピラミッド、そして現在反転しているピラミッドのポイントが実際のツールである最下部までです。また、データサイエンティストは、データの回帰分析の専門家である必要はありません。彼らはツールを使用できるかもしれませんが、スプレッドシート用語では、5人または6人の統計学者と、そのツール、そのモジュール、そのアルゴリズム、そのプラグインなどに取り組んでいる数理学者とデータ科学者、そして数人の数学者がいる可能性があります。使用できる公開されたスプレッドシートはすべて、マクロをテストし、Visual Basicをテストし、アルゴリズムが機能することを確認した専門家によって実際に書かれたものだと想像してください。したがって、制御する方が優れていました。

多くの分析ツールがそうしていると思います。私はそれのポイントに来ていると思います、あなたは今フィールドでそれを見ていますか、あなたは潜在的にエラーとミスとリスクを押し上げる可能性のあるスプレッドシートから、あなたがあなたと一緒に構築しているツールのポイントに移行していますプラットフォームは、データの発見がリアルタイムで正確であり、モジュールとアルゴリズムを構築している人々がそのリスクプロファイルを削除または削減していますか?カスタマーサービスはそれを本当の意味で見ているのですか、それともそれが起こっているのに気づいていないと思いますか?

デビッド・スウィーナー: これに答えるにはいくつかの方法があると思います。しかし、私たちが目にしているのは、どの組織でもそうです。データウェアハウスとCRMで行ったような、企業投資の観点から分析が遅れているのではないかと述べました。しかし、私たちが目にしていることは、組織を変え、その組織のinertia性を乗り越えるのに多くの時間がかかります。しかし、私たちが見ているのは、スプレッドシートを取り、ワークフローを取っている人たちです。セキュリティとガバナンスについては、「まあ、おそらくスプレッドシートを持っている」、「まあ、これをロックダウンしてバージョン管理できます」と言いました。多くの組織が見受けられますが、たぶんそこから始めただけかもしれません。そして、それが変更された場合、ワークフローがあり、私が行くことになります、しかし、ナンバーワン、誰がそれを変更しましたか?彼らがそれを変えた理由。彼らがそれを変えたとき。また、この新しいスプレッドシートを1、2、3、ただしワークフローで定義したい多くの関係者によって検証および検証されない限り、本番環境に入れないようにワークフローを設定することもできます。人々は動き始めており、組織はそこで赤ん坊の一歩を踏み出し始めていると思いますが、おそらく私たちには長い道のりがあることをお勧めします。

デズ・ブランフィールド: 確かに、セキュリティコントロールとガバナンスの両方を構築しているとすれば、ワークロードはそれとすべてを最高リスク責任者まで自動的にマッピングできます。これらのツールとシステムへのアクセス方法と、誰が何を使用して制御するかを制御できるため、非常に強力です。これに関連する他のことは、あなたが提供するツールの種類は、私が話している従来のスプレッドシートよりも人間の行動に向いているということです。同じダッシュボードと同じデータへのアクセスにより、実際に異なるビューを取得し、その結果、同じ情報からわずかに異なる洞察を得ることができます。同じPowerPointで同じ会議に参加し、同じスプレッドシートを作成し、すべて同じ固定データを使用するのではなく、ビジネスと意思決定プロセスとのより人間的な視点と相互作用があります。

現在、ツールを取り上げている組織の行動と文化の変化を目にしますか?それは、部屋で同じスプレッドシートを見て、それをただ言葉で書き留めてメモをとる5人の人のようではありませんしかし、彼らは実際にリアルタイムでダッシュボードとツールと対話し、指先で視覚化と分析を行い、会議だけでなく組織全体の一般的なコラボレーションだけで、会話と対話のまったく異なるフローを取得していますか?彼らは質問をし、本当の答えを得ることができるので、彼らはそれをリアルタイムで行うことができるからです。それはあなたが現在見ている傾向ですか、それともまだ起こっていませんか?

デビッド・スウィーナー: いいえ、それは間違いなくその道筋から始まったと思います。たとえば、工場の例を取り上げると、非常に興味深いことだと思います。その工場内で特定のプロセスセクターを所有し、特定の方法でこのデータを調べてやり取りしたい人がいるかもしれません。そして、多分私は、すべてのプロセスを見下ろしているかもしれません。おそらくこれが一番下にあるのかもしれません。私たちが見ているのは、一番の理由は、人々が組織内で共通のビジュアライゼーションまたは標準ビジュアライゼーションを使用し始めていると思いますが、それが彼らの役割に合わせて調整されていることです。それは、サプライチェーンの観点から見ている人とは非常に異なる見方であり、仕立てる必要があり、仕事を成し遂げるために必要なレンズを通して見なければならないので素晴らしいと思います。

デズ・ブランフィールド: 賢明で正確な意思決定を実際に行うために、意思決定プロセスが時間的かつ迅速に下がっていると思います。リアルタイム分析、リアルタイムダッシュボードを持っているなら、指先でStatisticaツールを持っているなら、床を横切って誰かに何かを尋ねる必要はありません。ハードコピーで。コラボレーション、対話、実際の決定をその場で行い、その結果をすぐに得ることができます。一部の企業はまだまだ把握していないと思いますが、そうすることで、このエウレカの瞬間になります。はい、私たちはキュービクルにとどまり、自宅で仕事をすることができます。私たちは共同で成果を即座に生み出します。ほら、これまでに言わなければならないことを聞くのは素晴らしかったと思うし、それがどこに行くのか楽しみにしています。また、Q&Aで多くの質問があることを知っているので、レベッカに戻ってそれらのいくつかを実行し、できるだけ早くそれらにアクセスできるようにします。どうもありがとうございました。

レベッカ・ジョズウィアック: デズ、そしてデイブに感謝します。聴衆からの質問はたくさんあります。そして、あなたの洞察にもデズとロビンに感謝します。この特定の参加者は時間の早い時間に立ち寄らなければならなかったことを知っていますが、情報システム部門は、ツールを提供することに慣れているのではなく、洗練されたデータ管理を優先しているのでしょうか?知識労働者?つまり、そうです-先に進みます。

デビッド・スウィーナー: ええ、それは組織次第だと思います。銀行、保険会社は、マーケティング組織とは異なる優先順位とやり方を持っていると思います。私はそれがちょうどあなたが見ている産業と機能に依存していると言わなければならないと思う。産業ごとに焦点と重点が異なります。

レベッカ・ジョズウィアック: わかりました、それは理にかなっています。そして、別の出席者が知りたいと思った、Statisticaの背後にあるエンジンは何ですか?それはC ++ですか、それとも自分のものですか?

デビッド・スウィーナー: まあ、これが30年ほど前に開発されたもので、それを具体的に入手できるかどうかはわかりませんが、実行するStatisticaアルゴリズムである分析アルゴリズムのコアライブラリがあります。ここで、Rを実行し、Pythonを実行し、Azureにバーストし、H2OでSparkを実行できることを確認しました。そのため、さまざまなエンジンに関してその質問に答える必要があると思います。また、選択するアルゴリズムに応じて、Statisticaの場合はこのように実行され、H2OおよびSparkで選択した場合はそれが使用されるため、さまざまなアルゴリズムが使用されます。

レベッカ・ジョズウィアック: いいよ別の出席者は、このスライドを具体的に指して、どのような再利用可能なテンプレートを使用するかを市民データ科学者がどのように知っているのか、知りたいと尋ねました。そして、そこからもっと広範な質問をするつもりです。それは、基幹業務ユーザーまたはビジネスアナリストがこれらのツールを使用したいときに何を見ているか、彼らが簡単に手に入れて実行できるかどうかです。

デビッド・スウィーナー: 私はそれに答えると思うし、もしあなたがWindowsを使い慣れているなら、これはWindowsベースのプラットフォームなので、これらのスクリーンショットの上部を切り取ったが、それはWindowsリボンを持っている。しかし、彼らはどのワークフローを使用するかをどのように知っていますか? Windowsエクスプローラのように見えるため、ツリー構造があり、組織が設定したい場合でも、設定および設定できます。ただし、これらのフォルダーがあり、これらのフォルダー内に再利用可能なテンプレートを配置することもできます。おそらく、あなたの会社が採用できる命名法があると思います。たとえば、「リスクプロファイルの計算」、「これらのソースからデータを取得する」、そして好きな名前を付けます。それはただの無料のフォルダで、ノートをキャンバスにドラッグするだけです。とても簡単です。

レベッカ・ジョズウィアック: いいよ次回のデモかもしれません。その後、別の出席者が立ち上がって、それはあなたとロビンとデズが不正確さ、特にスプレッドシートについて話していたものですが、ゴミの出し入れは、それが来るとさらに重要であると考えています分析へ。ご存知のように、データの誤用は不幸な決定につながる可能性があります。そして、彼はあなたがあなたの見解がよりフェイルセーフなアルゴリズムの開発に関して何であるか疑問に思っています、私は推測します、彼は分析の「熱心な」使用という言葉を使います。誰かが入って来て、本当に興奮して、高度な分析をしたい、高度なアルゴリズムを実行したいのですが、よくわからないかもしれません。それで、あなたはそれに対する一種の保護のために何をしますか?

デビッド・スウィーナー: ええ、私はできる限り最善の答えをしますが、すべては人、プロセス、テクノロジーにかかっていると思います。私たちは、人々を可能にし、組織内で実行したいプロセスを可能にする技術を持っています。誰かにクーポンを渡す例では、それはそれほど重要ではないかもしれません。それがデジタルである場合、実際には費用がかからないかもしれません。1つのレベルのセキュリティ制御があるかもしれません。手術部位の感染を予測している場合、それについてもう少し注意したいかもしれません。または、薬物の品質と安全性などを予測している場合は、もう少し注意したいかもしれません。ご存知のとおり、ごみは出入りします。したがって、私たちがやろうとしているのは、組織が採用したいプロセスに合わせて調整できるプラットフォームを提供することです。

レベッカ・ジョズウィアック: いいよもう少し質問がありますが、私たちは1時間をかなり過ぎたので、プレゼンターに伝えたいだけです。そして、Dell StatisticaのDave Sweenorに感謝します。もちろん、Robin Bloor博士とDez Blanchfield氏は、今日のアナリストであることを感謝します。来月、Dell Statisticaによる別のWebキャストを開催します。デイブはこのトピックについてちょっとしたヒントを知っています。もう1つの魅力的なトピックであるエッジでの分析についてであり、非常に魅力的なユースケースがそのWebキャストで議論されることを知っています。あなたが今日見たものが好きなら、来月に戻って来てください。それで、皆さん、別れを告げます。本当にありがとう。バイバイ。