2020年4月3日

データアナリストおよびデータサイエンティストとは何か - 高収入のキャリアを開始する方法

データのプロフェッショナルとして成功するためには、コンピュータープログラミング、統計学、コミュニケーションなどのスキルが必要です。

今日のビジネス環境で重要性を増しているのが、データアナリストとデータサイエンティストという関連性の高い2つの職種です。いずれの業務にもビジネス問題を解決するためのデータ処理が含まれますが、データアナリストが比較的シンプルな当座の課題に取り組むことが多いのに対して、(より上位の学位を持ち、より高賃金を得ている) データサイエンティストはより広い視野でビジネスを支えることを求められます。しかしながら、この2つの職種は重なり合う部分も多く、必要とされる基本的スキルの多くが共通しています。またデータアナリストがキャリアの進展に伴いデータサイエンティストになるケースも珍しくありません。

 

データアナリストとデータサイエンティストの違い: 定義

データアナリストとデータサイエンティストはいずれも急速に拡大するデータレイクを自在に活用して、そこから有用な情報を取り出す役割を担っています。データサイエンス分野の学部課程と大学院課程のプログラムを提供しているノースイースタン大学では、以下のようにこの2つの職種を定義しています。

「データアナリストは、大規模なデータセットを調べて傾向を見出し、グラフを作成し、視覚的なプレゼンテーションを提供することで、戦略的なビジネス上の意思決定を支援する。一方データサイエンティストは、プロトタイプ、アルゴリズム、予測モデル、カスタム分析などを駆使して、データのモデリングや生成のための新たなプロセスを設計および構築する。」

この定義では2つの職種の違いがいささか抽象的に捉えられています。これに対して、ビッグデータと分析に関する認定プログラムを提供しているSimplilearnは、以下のように2つの職種の違いを説明しています。

「データアナリストがビジネスチームから質問を与えられ、そのガイダンスに沿って解決策を追求するのに対して、データサイエンティストはビジネスに役立つ質問を自ら考え、その解決に取り組むことを求められる。」

とはいえ現実はそれほど単純でなく、とりわけ小規模な組織では職務のオーバーラップが発生しがちです。職務内容は雇用主によっても異なり、いわゆる役職のインフレにより、データサイエンティストの肩書を持つ人物が、多くの時間をデータアナリストの職務に費やしているケースも珍しくありません。しかしながら、こうした定義は概要の把握に役立ちます。

 

データアナリストとデータサイエンティストの具体的な業務内容

この2つの職種について理解を深めるために、これらの肩書を持つ人々の典型的な1日を見てみましょう。一例として、モバイルアプリの広告スロットの活用を支援する企業でデータアナリストを務めるEric Fandel氏は、自分の主な職務は「内部向けレポート/分析ダッシュボードを構築し、有用なデータポイントをアカウントマネージャーに提供し、エンジニアリング最適化チームが新しい製品機能やアルゴリズムのパフォーマンスを把握できるよう支援すること」であると述べています。言い換えれば、同氏はデータを徹底的に調べて、一般的なメトリックの観点から自社のパフォーマンスの把握に役立つ情報を得て、その情報を社内の他の人々に伝える役割を担っています。

ノースイースタン大学はデータアナリストの一般的な職責として以下を挙げています。

  •  データシステムとデータベースを設計および保守し、データとコードをクリーンな状態に維持
  •  プライマリソースとセカンダリソースからデータをマイニング
  •  統計ツールを使用し、傾向やパターンに注目してデータを解釈
  •  経営陣を含む組織内の他の人々に結論を提供
  •  同僚と協力してデータに関するプロセスやポリシーを構築

また、架空のデータサイエンティストのある1日を取り上げたCourseraのブログ記事も、データサイエンティストが担うより包括的な役割を理解するのに役立ちます。この架空の人物は飲料会社で働いており、その1日は主として2つの業務に充てられています。1番目は新しい天然スポーツドリンクラインの3つの特徴に対するミレニアル世代の考えを探るために、ソーシャルメディアの感情分析を行う方法を検討すること、2番目は自社製品をよりシステマチックに小売業者に届けられるよう流通ネットワークを改革するためのアルゴリズムの構築について経営幹部と話し合うことです。いずれの業務にもデータの分析が含まれますが、データアナリストの場合とは異なり、これらの課題に取り組むにあたりデータサイエンティストは、問題点を明らかにするための「質問」を自身で考える必要があります。例えば、顧客の考えを把握するためにソーシャルメディアデータをどのように活用できるか、小売業者への飲料製品の配送に関して何を目標とすべきか、またそれらの目標を達成する方法を探るためのモデルをどのように構築できるか、といった質問です。

データサイエンスプログラムを提供しているウィスコンシン大学では、データサイエンティストの職責として、以下のような項目を挙げています。

  •  組織にとって有用な結果を期待できるデータ分析問題を特定する
  •  特定した問題に関連するさまざまなソースから適切なデータを収集して検証する
  •  データを分析するためのモデルとアルゴリズムを構築する
  •  データ内のパターンと傾向を見出す
  •  得られた情報を組織全体に伝える

 

データアナリストとデータサイエンティスト: スキル

こうした職責リストを見ると、データアナリストおよびデータサイエンティストに必要なスキルが浮かび上がってきます。いずれの職務でも分析対象のデータを理解するために、数学と統計学の基礎知識が必要です。さらにノースイースタン大学が指摘しているように、コンピューター上でデータを処理するためには、さまざまなツールにも精通していなければなりません。主なツールとしては、SQL、R、Pythonなどのプログラミング言語 (データサイエンスのメンターであるJeremie Harris氏によると、なかでもPythonは必須です)、TablaeuやQlikなどのデータ可視化ソフトウェア、Excelをはじめとするスプレッドシートアプリケーションなどが挙げられます。データサイエンティストは、その基盤として上記にとどまらない広範なスキルを求められ、とりわけコンピューターサイエンスに関しては、収集したデータを使用して将来のイベントを予測するモデルを構築するために、機械学習と人工知能についての知識が不可欠です。またSlackのJosh Wills氏は職務のオーバーラップについて、「(データサイエンティストとは) ソフトウェアエンジニアの誰よりも統計学に精通しており、統計学者の誰よりもソフトウェア工学に精通している人物である」という的確なコメントをTwitterに投稿しています。

さらにデータプロフェッショナルは、rawデータとそのデータの意味を理解する必要がある人々との仲介者であるため、データアナリストおよびデータサイエンティストはさまざまなソフトスキルも身に付ける必要があります。なかでも重要なのがコミュニケーションスキルと対人スキルで、データアナリストおよびデータサイエンティストは発見した情報を同僚や経営陣にできる限り効果的な方法で伝達できなければなりません。

また管理下にあるデータに的確な質問を投げかけるためには、組織のビジネスニーズを理解していることも必要です。この点をわかりやすく説明しているのがAlluvium社CEOのDrew Conway氏が作成したデータサイエンスのベン図です。同氏はデータサイエンスを、プログラミングスキル、数学と統計学の知識、および「現実的な専門知識」(所属する業界に関する知識や実務能力) がオーバーラップする領域と捉えています。「ある1日」の事例で紹介したデータアナリストのFandel氏がその責務を果たすためには、オンライン広告のエコシステムがどのように機能しているかを理解している必要があり、また先ほど取り上げた架空のデータサイエンティストの場合であれば、飲料の製造、マーケティング、および流通方法について、少なくとも基礎的な知識が不可欠です。このようにデータプロフェッショナルは、自身が所属する組織のビジネスに後れを取らないように、常に貪欲な学習者であることを求められます。

 

データアナリストまたはデータサイエンティストになる方法: トレーニング、学位、認定、およびキャリアパス

前述のとおり、多くの大学がデータサイエンスまたは類似の分野の教育プログラムを提供しており、データプロフェッショナルへの道筋は他にもあるとはいえ、こうしたプログラムの修了者が有利なスタートを切ることは疑いありません。通常データサイエンティストが何らかの大学院学位 (データサイエンスとは限らず、コンピューターサイエンスなどの場合もあります) を取得しているのに対して、多くのデータアナリストは学士号しか持っていません (ご興味のある方は、CIO.comによる推奨されるデータサイエンスプログラムをご覧ください)。しかしながら、データサイエンスの分野は進化が早く日々変化しており、その門戸は専門学位を持つ大学新卒者のみに開かれているわけではありません。専門学位を持たない人々のために、さまざまな自主学習コースやMOOCが存在しており、Open Data Science Conferenceではこのカテゴリの推奨コースを公開しています。

データサイエンスのメンターであるHarris氏が、この分野における3つのキャリアパスについて概説するとともに、それぞれのコースで成功するためのヒントを紹介しています。

  •  独学。オープンソースプロジェクトに参加してパーソナルブランドを築きつつ、MOOCや独力での探求を通じて基礎知識を身に付けます。
  •  ソフトウェアエンジニアからの転身。自身のコンピュータースキルをデータの世界に移すにあたり、給与がいったん下がることを覚悟する必要があります。
  •  新規のSTEM卒業生の採用。基礎知識はありますが、通常は何らかのスキルギャップの解消が求められます。


さらにあらゆる技術関連分野と同様に、データサイエンスの分野でも能力の実証に役立つさまざまな認定資格が存在しています。CIO.comの記事に、知名度が高く有望な認定資格のリストが紹介されています。

 

データアナリストとデータサイエンティストの給与:

データアナリストの給与は個人差が大きい傾向にあります。これはこの肩書がエントリーレベルの従業員に与えられることも多い一方で、この仕事に長年携わっており、さまざまなスキルを習得している専門家もいるためです。Robert Half Technology社の2019年版給与ガイドでは、一般的な年間給与は81,750~138,000ドルとなっています。

より重責を担い、高水準の学位を保有しているデータサイエンティストは、給与水準も高い傾向にあり、同ガイドによると年間給与は116,000~163,500ドルの範囲です。ここ数年にわたり、データサイエンティストは需要と給与の伸び率の高さにより、米国で最も有望な職種に選ばれています。しかしながらTechRepublicのレポートでは、2019年に入ってデータサイエンティストの給与が横ばいになり始めており、一般的なソフトウェア開発者の給与水準との差が小さくなりつつあると報告されています。それでもなお、データプロフェッショナルの給与水準は他の多くの分野に比べて高く、この分野に興味があり必要なスキルを有する人々にとって、魅力的な仕事であることは間違いありません。

この記事/コンテンツは、記載されている特定の著者によって書かれたものであり、必ずしもヒューレット・パッカード エンタープライズの見解を反映しているわけではありません。

enterprise.nxt

ITプロフェッショナルの皆様へ価値あるインサイトをご提供する Enterprise.nxt へようこそ。

ハイブリッド IT、エッジコンピューティング、データセンター変革、新しいコンピューティングパラダイムに関する分析、リサーチ、実践的アドバイスを業界の第一人者からご提供します。

enterprise.nxt
ニュースレターのご登録

enterprise.nxtから最新のニュースをメールで配信します。