未来予測を、すべてのビジネスに―AI活用の常識を変えた、データサイエンスオートメーション



日本電気株式会社 様

 

データサイエンス自動化ソフトウェア「dotData」の全てをHPE Moonshot Systemの1ボックスで利用可能に

 

トップクラスのデータサイエンティストが「数ヶ月」を要するデータサイエンスのプロセスを「数日」に短縮――NEC データサイエンス研究所が開発した「dotData」は、世界初のデータサイエンス自動化ソフトウェアであり、いま世界から最も注目されている日本発のAIテクノロジーである。企業は「dotData」をインテル® Xeon® プロセッサー搭載の「HPE MoonshotSystem」と統合された1ボックスソリューションとして導入し、AIのビジネス活用を短期間でスタートさせることができる。

業界

IT

 

目的

世界初のデータサイエンス自動化ソフトウェア「dotData」を、オンプレミス環境で活用するための最適なサーバープラットフォームの選定。

 

アプローチ

dotDataとサーバープラットフォームを統合し、設計や構築の手間を最小限にして、企業が導入しやすいパッケージソリューションとして提供。

 

ITの効果

• HPE Moonshot Systemを採用しシンプルかつ高性能のdotData環境を実現

• dotDataを利用する最適な計算リソース要件を満たすとともに、配線不要でお客様の分析規模に応じたサーバー増設や交換を可能に

• ラックマウント型サーバー比でおよそ1/10の省スペース化を実現(1Uサーバー45台を4.3Uに)

• 代表的なパブリッククラウドサービスを大幅に上回る性能をオンプレミスで実現

 

ビジネスの効果

• dotData によるデータサイエンスプロセス全体を「1ボックス」で実現し、データ分析者の生産性向上に寄与

• ユーザー企業が自社のセキュリティポリシーに合致した環境でのAI のビジネス活用が可能に

• 「ビジネスの未来予測」を可能にするデータサイエンスの活用をより多くの企業で推進

チャレンジ

データサイエンティスト1,000人分の成果を10人で

 

2019年5月、dotData,Inc.が米フォレスター・リサーチのForrester New Wave™ Report*においてAutoML(機械学習自動化)領域のリーダーと認定された。同社は、データサイエンス自動化ソフトウェア「dotData」の開発元であり、2018年にNECから戦略的カーブアウト(NECが資本参加しつつ新会社として独立)したばかりのAIテクノロジーベンチャーである。NECビジネスイノベーションユニットのエグゼクティブ・ディレクターであり、dotData Japanの代表執行役社長を兼務する森英人氏は次のように話す。

「dotDataは、世界初のデータサイエンス自動化ソフトウェアとして業界をリードし続けています。独自開発のAIエンジンが、データ準備から、特徴量設計、機械学習による予測モデル設計、業務への実装まで『データサイエンスプロセス全体』を自動化します。中でも、予測モデルの精度と期間短縮に対する評価は揺るぎないものです。dotDataは、それまで『人間にしかできない』と言われてきた特徴量設計の領域を自動化したことで世界中のAI技術者を驚かせました」

データサイエンス自動化ソフトウェア「dotData」は、NEC データサイエンス研究所の主席研究員だった藤巻遼平氏(現dotData, Inc. CEO)が中心となって開発された。シリコンバレーに設立された同社には、dotDataのコアをなす、NECが持つ最先端のAI技術とそれを担う人材を移管。データ分析の市場ニーズが高い米国で技術開発・事業化に取り組みながら、世界を相手に戦うための実力を磨いている。

「明日のランチタイムにサンドイッチがいくつ売れるか(回帰問題)、その金融商品を高い確率で買ってくれるのは誰か(ターゲティング問題)、研修の途中で脱落しそうな人を区分するには(判別問題)など、データサイエンスはすでに様々なケースで利用されています。予測精度の優劣が売上や収益に大きな影響を与えるため、先進的な企業では優秀なデータサイエンティストを大量に囲い込んで取り組みを先鋭化させています」(森氏)

世界的な流通大手では、数千人規模のデータサイエンティストが「欠品を出さず過剰在庫も持たないための予測分析」「効果的なクロスセル&アップセルの推奨」などに力を注いでいることが知られている。

「データサイエンティストの質と量で圧倒する先進企業に対して、一般の企業がどう戦いを挑むか。その道を拓くのが『dotData』です。dotDataなら、データサイエンティスト1,000人分の仕事を10人でこなしながら、同等以上の成果を出すことも難しくありません」と森氏は自信を示す。

 

* Forrester New Wave Report(TheForrester New Wave ™ : Automation-Focused Machine Learning (AutoML)Solutions, Q22019)

日本電気株式会社

ビジネスイノベーションユニット
エグゼクティブ・ディレクター
森 英人 氏

日本電気株式会社

コーポレート事業開発本部
dotData事業開発室
主任
上堂薗 浩光 氏

インテル® Xeon® プロセッサー搭載

ソリューション

AIのビジネス活用における最大の課題をdotDataが解決

 

トップクラスのデータサイエンティストでも「数ヶ月」を要するというデータサイエンスのプロセスを「数日」に短縮――データサイエンス自動化ソフトウェア「dotData」がもたらす最大のビジネス価値は、「プロセス全体のスピード化」と「予測モデルの高精度化」である。分析を実行する前に分析用のデータを準備する作業が、データサイエンスプロセスの8割を占めている現実にまず着目したい。

「これまで予測モデルの開発は、優秀なデータサイエンティストの知見とひらめきに多くを依存してきました。中でも、過去の事実から仮説・検証を繰り返す『特徴量設計』は、人間にしかできないと言われてきた難関です。dotDataは世界で初めてこの壁を突破し、独自のAIエンジンによる特徴量設計の自動化に成功しました」(森氏)

特徴量とは機械学習の入力に使う説明変数であり、小売店の顧客分析の例では「時間帯」「購買金額」「購買件数」「購買単価」などがこれにあたる。設計次第で予測精度や分析結果の有用性が大きく変わるため、より良い特徴量設計を行うには、業種や業務ごとで異なるビジネスの文脈に精通したエキスパートの知見が不可欠と考えられてきた。

「その常識をdotDataが覆しました。dotDataを利用した分析で人間が考慮しなければならないのは、『何を予測するか』、『どのデータを使用するか』、『データテーブルの関係性は』という3項目だけです」と森氏は言う。

dotDataは、学習対象となる膨大な数のデータテーブルを、独自のAIエンジンが自動的にひとつの広大な「特徴量テーブル」上にまとめ上げていく。この特徴量テーブルは、AIエンジンが予測分析の目的に沿った「仮説」を数百万~数千万という規模で自動的に生成し、実際の事実との相関性が高いものを自動選択して作られる。

「dotDataのAIエンジンは、過去のデータと照らして意味のある仮説/意味のない仮説を判断しながら、確かに相関性があって意味のある『特徴量』を導き出します。このように、データサイエンスプロセス全体の中で最も難易度が高く、多大な工数と時間を要する『特徴量設計』を自動化することで、大幅な期間短縮が可能になりました」(森氏)

さらに、dotDataのコアであるAIエンジンの優秀性は、「プロセス全体のスピード化」だけでなく「予測モデルの高精度化」でも証明されている。

「データサイエンスの取り組みが長い大手金融機関様より、『自分たちは2~3ヶ月をかけて試行錯誤しながら予測モデルを作成してきた。dotDataではそれを上回る精度の予測モデルを2~3日で設計できてしまうことがわかった。もはや採用しない理由はない』というコメントをいただいています」と森氏は笑顔を見せる。

導き出した特徴量に妥当性があるかどうか、AIエンジンによる分析過程や判断理由を、後から人が理解できる「ホワイトボックス型」であることもdotDataの評価を高めている。

dotDataは、企業におけるAIのビジネス活用を加速させ、データサイエンティストの生産性を飛躍的に高めるとともに、想像もしなかった深いビジネスインサイトをもたらす。そして、新しいビジネス価値の創造が企業の競争力に結びついていく。

HPE Moonshot Systemによる1ボックスのdotDataソリューション

 

dotDataのAIエンジンは、テラバイト規模のデータを複数の汎用的なx86サーバーで構成した分散処理基盤上で動作する。

「金融機関や製造業を中心に、セキュリティ上の理由から分析データをパブリッククラウド上で扱えないお客様は数多くいらっしゃいます。また、数百テラバイト規模のデータをクラウドに上げるのが難しいという現実もあります。お客様にとって利便性が高く、安心してお使いいただける『オンプレミスdotData環境』を実現するために、私たちが選定したプラットフォームがHPE Moonshot Systemでした」と森氏は話す。

「HPE Moonshot System」は、高さ4.3Uシャーシに45台のサーバーブレードと2台のネットワークスイッチを収容できるユニークな超高密度サーバーである。インテル® Xeon® E-2200プロセッサーを採用した、手のひらに載るほど小さなサーバーブレード「HPE ProLiant m750」は、最大で8コア/128GBメモリ/15TB NVMe SSDを搭載できる。

「45台の物理サーバーをコンパクトに集約できるプラットフォームは、HPE Moonshot Systemをおいて他に見あたりませんでした。お客様は、dotDataとHPE Moonshot Systemが統合された『1ボックスソリューション』としてご導入いただけます。AIのビジネス活用を短期間でスタートできるだけでなく、1ボックスでdotDataによるデータサイエンスプロセスをすべて網羅できます」とコーポレート事業開発本部dotData事業開発室 主任の上堂薗浩光氏は話す。

ユーザー企業によるAI/データサイエンスのプロジェクトで、小さな成功を積み重ねて段階的に大きくしていくようなケースでは、HPE Moonshot Systemの拡張の容易さが活かされる。

「サーバーブレードをシャーシに挿すだけで計算リソースを拡張できるアーキテクチャーも魅力的でした。HPE Moonshot Systemはシャーシ内の配線が不要で、超省スペース、低消費電力という、ラックマウント型サーバーでは得られないメリットをお客様に提供できます」(上堂薗氏)
しかもHPE Moonshot Systemは、性能面でもクラウドサービスを大きく上回ることが明らかになった。

「同じコア/メモリ構成で、代表的なパブリッククラウドサービス(IaaS)とともに性能検証を実施したところ、HPE Moonshot Systemの分析時間はクラウドの2/3程度でした。想像以上のスコアに驚きました」と上堂薗氏は話す。

ベネフィット

「ビジネスの未来予測」を加速させるdotDataとHPE Moonshot System

 

2019年10月、dotData, Inc.は2,300万ドルのシリーズA資金調達を完了させ、さらなるビジネス成長に向けて大きな一歩を踏み出した。同社では、中期目標として2022年度に企業価値(時価総額)500億円を達成することを掲げている。

「これを受けて、NECでも新たなサービスを立ち上げるなど、より多くのお客様にdotDataを使っていただけるような取り組みを加速させています。COVID-19の影響で人と人とが直接コミュニケーションする機会が貴重になっており、ビジネスモデルの転換を迫られている企業は少なくありません。正確な販売量予測、効率的な顧客発見、契約の妥当性の評価など――『ビジネスの未来予測』を可能にするデータサイエンスが、dotDataにより多くの企業で活用が広がって、ビジネスの競争力強化に貢献できることを願っています」(森氏)

dotDataによるデータサイエンスプロセス全体を「1ボックス」で実行可能なHPE MoonshotSystemは、dotData事業に携わるメンバーからの期待も大きい。森氏は次のように語って締めくくった。

「お客様のユーザー部門/データサイエンスチーム主導でdotDataをご活用いただきたい、という思いを強く持っています。そのために、プラットフォームがシンプルかつコンパクトで扱いやすいことは不可欠な要件でした。HPE Moonshot Systemは、現時点で私たちの理想に最も近いサーバー製品です。日々進化を続けるdotDataとともに、HPE Moonshot Systemにも新たな進化を期待しています」

ご導入企業様

日本電気株式会社 様

 

所在地:東京都港区芝五丁目7番1号

URL:https://jpn.nec.com/