2019年7月19日

最適なデータサイエンティストを見出す方法

データサイエンティストの雇用にあたっては、組織のニーズに適したタイプを選択することが大切です。

AIと機械学習が急速に発展するなか、データサイエンティストの雇用ニーズが従来になく高まっています。
Harvard Business Review誌が「21世紀における最も魅力的な職業」と評したデータサイエンティストは、今日とりわけ注目される職業の1つです。その理由は明白で、この仕事は賃金が高く、ワークライフバランスに優れていることで知られており、多くの組織にわたって需要が常に存在しています。事実、昨年8月に発表されたLinkedIn社のレポートによると、米国では15万1,000人以上のデータサイエンティストが不足しており、とりわけ状況が深刻なのが、ニューヨーク、サンフランシスコ、およびロサンゼルスの各都市です。
マーケティング部門は、差別化された印象深いカスタマーエクスペリエンスを提供するためにデータサイエンティストを求めています。また財務部門はリスクや市場についての理解を深めるために、運営責任者はプロセスを合理化して効率性を高めるために、データサイエンティストの能力を必要としています。さらに米国のインテリジェンスコミュニティにおいても、データを体系化して有益な情報を引き出し、戦略的な意思決定の精度を高める目的で、データサイエンティストの活用が進んでいます。
こうしたデータサイエンティストに対する需要の高まりに伴い、必要な人材を確保できない企業も増加しています。固有の要件に適したスキルセットと経験を有するデータサイエンティストの獲得は難しくなる一方です。
以下では、ニーズに適した優秀なデータサイエンティストを見出すためのガイドラインをご紹介します。

 

データサイエンティスト間の違いを理解

データサイエンティストの獲得にあたって、組織が犯しがちな最大の誤りが、目的の業務においてこの用語が何を意味するのかを明確にしないまま、求人を開始することです。この数十年間でデータサイエンティストの役割は劇的な変化を遂げています。
こうした相違が雇用プロセスを混乱させることも少なくありません。
「「データサイエンティスト」という役職に対する認識は、人によってさまざまです」と、『Data Mining for Dummies』の著者であるビジネス分析コンサルタントのMeta S. Brown氏は指摘します。「データサイエンティストの雇用を望んでいながら、その理由を説明できない組織も少なくありません。ときには1人の人間が満たすことは到底不可能なスキルリストが職務明細書に記載されています。より現実的な視点に立つことが必要であり、1人のデータサイエンティストにあらゆるビジネス分析ニーズへの対応を求めてはなりません」。
その一方、求人担当者が常にあらゆるスキルを求めているわけではありません。「担当者の個人的な好みが採用活動に不適切な影響を及ぼしている可能性もあります」とBrown氏は付け加えています。「好みと現実的なビジネスニーズは必ずしも一致しません」。
こうした落とし穴を回避するためには、事前に十分な時間をかけて、データサイエンティストが必要な理由 (あるいは本当に必要かどうか) を考察することが大切です。そのうえで具体的なビジネスニーズ、およびそのために必要なスキルを明確にします。こうしたプロセスを経ることで初めて、目的に合ったデータサイエンティストの獲得が可能になります。
残念ながら、データサイエンティストのカテゴリ分けに関して広く合意された定義は存在しておらず、このことがデータサイエンティストのタイプとビジネスニーズの対応付けを難しくしています。そこで注目されるのが、個々のデータサイエンティストが主として提供している成果物のタイプに基づく分類です。
Apple社のSiriデータサイエンス/エンジニアリング担当ディレクターのYael Garten氏が指摘するように、一部のデータサイエンティストは、製品戦略のための推奨事項として人間によって使用される成果物を主に提供しています。同氏はこのタイプのデータサイエンティストを「Decision Scientist (意思決定サイエンティスト)」と呼んでいます。これに対して、モデル、トレーニングデータ、アルゴリズムなど、マシンによって使用される成果物の提供を専門とするデータサイエンティストも存在し、同氏はこれらの専門家を「Modeling Scientist (モデリングサイエンティスト)」と呼んでいます。
また、カリフォルニア大学ロサンゼルス校 (UCLA) のコンピューターサイエンス学部准教授のMiryung Kim氏は、ソフトウェア業界で働く800人近くのデータサイエンティストを調査した結果に基づき、以下に示すような詳細なカテゴリを定義しています。

  • Data Preparer (データ準備者): 分析用データの照会と準備を主な任務とする人物を指します。通常Data Preparerの作業では機械学習アルゴリズムよりもSQLが多用されます。
  • Data Shaper (データ形成者): Data Preparerのスキルに加えて、機械学習にも取り組む専門家を指します。そのためData ShaperがSQLや構造化データを扱うことはあまりありません。
  • Data Analyzer (データ分析者): 従来の統計、数学、およびデータ操作手法を使用して、ビジネスやマーケティング戦略に役立つ傾向を見出すデータサイエンティストを指します。
  • Platform Builder (プラットフォーム構築者): データ収集の目的でプラットフォームやコードを作成する人物を指します。通常Platform Builderの作業にはHadoopのような分散型システムが使用されます。
  • Data Evangelist (データエバンジェリスト): データの活用に関して、ビジネスリーダーやプロダクトマネージャーとの協働を主な任務とするデータサイエンティストを指します。
  • Insight Actor (インサイトアクター): データから得られた知見に基づく活動や周知を主な任務とするデータサイエンティストを指します。
  • Moonlighter (副業者): 必要性やインスピレーションが生じた場合にのみデータサイエンス業務に関与するエンジニア、マーケティング担当者、プロダクトマネージャーなどを指します。
  • Polymath (博識家): データ収集用プラットフォームの構築、データの分析、得られた結果に基づく活動など、データ指向のさまざまな業務に関与する「よろず屋」的な人物を指します。


これらの分類に加えて、もう1つ忘れてはならないカテゴリが「シチズンデータサイエンティスト」です。この用語を考案したGartner社では、シチズンデータサイエンティストを、高度な診断分析や予測/処方機能を使用するモデルの構築や開発を行うが、統計/分析処理が本業ではない人物と位置付けています。シチズンデータサイエンティストは、(以前であればより高度な専門知識が必要とされた) シンプルな、もしくは中程度に複雑な分析タスクを実行できるパワーユーザーです。データサイエンスに関する広範なニーズに応じて新たな専門家を雇う代わりに、シチズンデータサイエンティストを活用することで、既存の熟練したデータサイエンティストを補完できる可能性があります。
「あらゆるニーズに対応できる万能な専門家は存在しないため、データサイエンティストを探す際は、どのカテゴリの専門家が必要なのかを見極めることが大切です」とKim氏は指摘します。「データサイエンティストのタイプの選択を誤ると、データの活用や分析に向けた努力が無駄に終わります」。

 

新たな人材ソースを開拓

データサイエンティストの獲得競争が厳しさを増すなかで優れた人材を見出すには、一般的な求人サイト以外にも目を向けることが必要です。
最初に取り組むべきは求人要件の見直しです。セキュリティ専門家と同様に、データサイエンティストの場合も、優れた人材が従来型のキャリアを有していないケースが少なくありません。「スキルギャップを解消し、優れたデータサイエンティストの不足に対処するためには、従来の人材調達手法を見直し、学位よりもスキルや潜在能力に注目する必要があります」と、LinkedIn Recruiter製品の責任者であるJared Goralnick氏は指摘します。「非従来型の人材とは、四年制大学の学位、難易度の高い資格、輝かしい職歴などを持たない候補者を意味します」。速修型のトレーニングプログラムやブートキャンプ、地域のコミュニティカレッジ、各種の組織など、新たな人材プールにも目を向けてください。データサイエンス分野への投資をお考えであれば、まずは主要な業界イベント (Strata Data Conferences、TDWI Chicago Conference、Forrester Data Strategies and Insights Forumなど) にスタッフを参加させることをお勧めします。
Indeed.comのエコノミストのAndrew Flowers氏は、データサイエンス分野の人材育成に関して大学は後れを取っており、企業は大学以外にも視野を広げる必要があると指摘します。また同氏は、DataCamp、Springboard、General Assemblyといった、定評ある営利目的のトレーニングプログラムから人材を直接雇用することも検討するよう提案しています。「これらの企業は認可された大学ではありませんが、最新のデータサイエンススキルのトレーニングにより俊敏に適応できます」と同氏は指摘します。
この点に関してBrown氏も同じように考えており、データサイエンティストが不足する今日の状況を、米国における初期の宇宙計画と比較しています。
「宇宙計画を成功へと導くうえでプログラマの役割は極めて重要でしたが、当時、経験豊富なプログラマを雇うのは不可能でした。学校では必要なスキルを教えておらず、また、コンピュータープログラミングの実務経験を持つ人もほとんどいませんでした」とBrown氏は指摘します。「しかしながらプログラミング経験のまったくない人々が、ソフトウェア開発スキルを短期間で習得し、今日のスマートフォンの性能にはるかに劣るコンピューターを使用して、人類を宇宙に送り出し、無事帰還させることに成功したのです。今日の求人担当者も優れた人材の発見を諦める必要はありません。人材は育てることが可能です」。

 

クリエイティブな姿勢が大切

人材獲得競争が激化するなか、優秀なデータサイエンティストを見出すために、企業はよりクリエイティブな姿勢を求められています。
一例として、投資会社のCitadel社は、全米の大学で一連のデータソンコンペティションを後援しています。このThe Data Openコンペティションには数千人もの学生が招待されて、膨大かつ複雑なデータセットの分析にチーム単位で取り組み、その結果を審査員に提出します。優勝チームには2万5,000ドルの賞金に加えて、Citadel社でのインタビュー機会が与えられます。このコンペティションを通じて同社の採用部門は、有望なデータサイエンティスト候補者を見出し、場合によっては雇用するというユニークな機会に恵まれます。
データサイエンス分野の発展や支援を目的として、企業が地域の学校や大学と連携することも可能です。こうした取り組みは、地域の学生だけでなく、企業の従業員にもメリットをもたらします。現在20以上の学校でデータサイエンス修士課程がすでに開設されており、その数は増え続けると予想されます。

 

既存のスタッフを再訓練

新たな人材をスカウトすることも大切ですが、優れた候補者が既存の従業員の中に存在していることも少なくありません。この種のデータ分析の経験はなくても、事業の内容や目標に精通している既存の従業員は、他の候補者に比べてそれだけ有利です。
有望な従業員向けのトレーニングを通じて、優れたデータサイエンティストを育てることも検討してください。「当社調査によると、現在データサイエンティストとして雇用されている人々の5年前の役職で最も多かったのが、研究助手および研究者でした」とGoralnick氏は述べています。「現在研究者として雇用されている人々は、将来のデータサイエンティストを探すうえで最も有望な候補者です」。
データサイエンティストに関する業界認定の策定も進んでおり、こうした動向も従業員のトレーニングに活用できます。一例として今年の初めに、ベンダー中立のテクノロジー標準/認定機関であるThe Open Groupが、新しいデータサイエンティスト認定プログラムを発表しました。同コンソーシアムによると、個人がこのプログラムを通じて自身のスキルと経験を直接証明できるだけでなく、組織がThe Open Group標準を採用して内部的な認定プロセスを確立することも可能です。個人が必要な基準を満たしているかどうかは同僚によって審査され、3段階のスキルおよび経験レベルのいずれかに分類されます。
言うまでもなく、要件を満たすデータサイエンティストを見出すのは容易ではありません。しかしながら堅実な計画を策定し、雇用するデータサイエンティストに何を求めるのかを明らかにするとともに、従来型および非従来型の人材ソースを意欲的に開拓し、クリエイティブな姿勢で問題に取り組み、既存のスタッフの再訓練を積極的に行うことで、組織はニーズに合ったデータサイエンティストを発見または育成することが可能です。

 

データサイエンティストの雇用: リーダーのためのアドバイス

  • 必要なデータサイエンティストのタイプを明らかにします。ニーズの領域に応じて、必要なスキルや知識のタイプは異なります。

  • この分野のスキルに特化したトレーニングプログラムにも目を向ける必要があります。

  • 関心を持っているスタッフと標準ベースの教育に重点を置いて、既存のリソースを活用します。

この記事/コンテンツは、記載されている個人の著者が執筆したものであり、必ずしもヒューレット・パッカード エンタープライズの見解を反映しているわけではありません。

enterprise.nxt

ITプロフェッショナルの皆様へ価値あるインサイトをご提供する Enterprise.nxt へようこそ。

ハイブリッド IT、エッジコンピューティング、データセンター変革、新しいコンピューティングパラダイムに関する分析、リサーチ、実践的アドバイスを業界の第一人者からご提供します。