Cutting Edge
AI分野でソニーがNo.1になるために
2018年11月。ソニーは、ディープラーニング(深層学習)の分散学習において「世界最高速の達成※」を発表した。それは、ソニーが開発したディープラーニングフレームワーク「Neural Network Libraries」と、国立研究開発法人 産業技術総合研究所が構築・運用するAI処理向け計算インフラストラクチャ「ABCI(AI Bridging Cloud Infrastructure/AI橋渡しクラウド)」によってもたらされた快挙であった。この結果を導き出したソニーの2人の研究者、そして産総研のABCI開発者に話を訊いた。
※ 2018年11月13日時点(ソニー調べ)
プロフィール
-
三上 裕明
-
影山 雄一
-
小川 宏高
産総研と協働した理由
──国立研究開発法人 産業技術総合研究所(以下、産総研)とソニー株式会社(以下、ソニー)は、どういう経緯で協働することになったのでしょうか?
影山:ソニーで Neural Network Libraries(以下、NNL)のエバンジェリストを担当している小林 由幸さんから、産総研の関口 智嗣さん(理事、情報・人間工学領域領域長)を紹介され、「ABCIを活用していろいろ試してみませんか?」というお声がけをいただいたんです。
ちょうど我々としても、ABCIのような世界トップレベルの計算処理能力とデータ処理能力を持つスーパーコンピューターを使って研究開発を進めたいと考えていた時期でした。ですから早速、研究チーム長の小川さんとお会いして、「ぜひ共同研究をさせてほしい」と、その場で打診をさせていただきました。
──「それまでの環境」に、どのような「課題」を感じていたのでしょうか?
三上:元々は、クラウドを利用したITインフラストラクチャサービス(以下、クラウドサービス)を活用することを想起していました。ネットワーク自体は安定しているのですが、粒度といいますかレベル感といいますか、例えばミリセカンドオーダーのネットワーク遅延であればクラウドでも十分ですし、GPUの数も、数十であればクラウドサービスで問題ありません。しかしどちらかがそのレベルを超え始めると、クラウドサービスでは難しくなるという状況が見えてきたんです。その点ABCIは、マイクロセカンドオーダーなのでレイテンシーの問題もクリアできますし、使えるGPUの数は現状国内で一番多いわけですから、非常に魅力的でした。
影山:AIの開発では、あらゆることを試さなければならないんです。だから、たくさんのGPUを使って徹底的に処理速度を速くして、開発スピードを上げることが不可欠なんですが、スーパーコンピューターであれば多くのGPUを活用することが可能になります。ただ、それまでは、ABCIのような「スーパーコンピューティングなんて、我々には縁遠いもの」と思っていましたし、実際、仕事として関わることはほとんどありませんでした。ですが、数年前からHigh-Performance Computing(以下、HPC )の領域とAIの領域が一気に融合し始めたんです。そしていよいよ、ABCIを活用できる機会があり、更には産総研のHPCの専門家と協働できる機会があるということで、ぜひ一緒にやりましょうと、お願いしました。
「世界最高速」は予想通り!?
──共同研究を持ちかけられた当初、小川さんはどういうお気持ちだったのでしょうか?
小川:ソニーが開発したNNLの存在自体は知っていましたが、多くの研究者が使っている機械学習ツールではないので、若干不安もありました(笑)。
でも、影山さんからお話を聞いた後に自分でNNLのコードをダウンロードして動かしてみたら、非常によくできているということがわかりました。「ソニーのソフトウェア水準は高いな」ということを改めて確認でき、これは期待できると認識を改めました。
影山:実績のある機械学習のツールに比べて「ソニーのソフトウェアが本当に使えるものなのかどうか……」と、思われたということですよね。AIの分野においては、ソニーはまだまだやれることがたくさんあります。AIの技術開発において、少なくとも日本でNo.1になりたいですし、世界でもトップを目指していく上では、外部の方々と積極的に協働していくことが不可欠だと思っています。その意味でも、今回は大きなステップアップになりました。
──「第2回ABCIグランドチャレンジ(2018年10月)」において、いきなり世界最高速を出したわけですが、そもそも世界最高速が出るという確信や自信はあったのでしょうか?
三上:事前に想定していたものがすべてうまく動いたわけではありませんが、「これくらいまでは行けるだろう」という見込みが事前にあり、実際、3.7分という結果はそれに近いものでした。
影山:「第1回ABCIグランドチャレンジ(2018年7月)」では、10分という記録を出して喜んだのですが、その直後に中国のIT企業であるテンセントが6.6分という論文を出してきて、ヘコみました(笑)。今回、我々が3.7分という世界最高速を出し、その後、グーグルが2.2分、1.8分と縮めてきたのですが、我々も2019年1月に、2.0分まで縮めています。
正直、GAFAに比べるとAIへの投資規模はまるで違いますが、ソニーも、グーグルと同じレベルの記録を出せる環境になったことは、すごいことかなと思います。
4352基のGPU、2.5マイクロセカンドのレイテンシー
──改めて、ABCIの概要を教えていただけますか?
小川:最先端のAI技術の研究開発や産業等への導入を加速していくためには、ディープラーニングを始めとする「アルゴリズム」と、実社会から取得される多種多様大量の「ビッグデータ」、そして両者の組み合わせを可能とする膨大な「コンピューティングパワー」、とりわけ機械学習処理能力の供給が欠かせません。ABCIは、この3つの連携によるオープンイノベーションを促進するプラットフォームの実現を目指し、産総研が2016年から開発を開始し、2018年の8月から正式運用している大規模クラウド計算システムです。
ABCIは、つくばエクスプレス柏の葉キャンパス駅近くにある産総研柏センターに設置されています。全1088サーバーで構成され、それぞれにCPUが2基とGPUが4基ずつ、つまり合わせて4352基のGPUを搭載した計算システムです。先程、三上さんがレイテンシーの話をされましたが、ABCIは、単にGPUが搭載されたサーバーがたくさんあるというだけではなく、すべてのサーバー、すべてのGPUが2.5マイクロセカンド以下のレイテンシーで相互に通信できます。
──小川さんご自身の一番のモチベーションは何でしょう?
小川:ABCIという大きなオモチャで遊ぶのに夢中……というのは冗談ですが、ABCIを使ってトップノッチの成果を導き出していくこと、産総研をはじめ様々な研究機関、大学や企業で研究開発されている技術シーズを実社会規模の問題にスケールアップしていくこと、その他いろいろな産業の方々に使ってもらうためにさまざまな手段を講じていくというのが自分の仕事だと思っています。
現在のところ、産総研をはじめ、公的研究機関や企業や大学の100以上のプロジェクトで使っていただいていますし、ユーザーベースの規模としても、500〜600人に到達しています。まだまだ満足していません。この先、ユーザー数を5倍にはしていきたいと思っています。
AIが入っていない事例はほとんどない
──今後ソニーは、ディープラーニングを使ってどのような分野に切り込んで行こうとしているのでしょうか?
影山:「研究開発」という意味では、ワンショット・ラーニングやトランスファー・ラーニングなど、いろいろやっています。「製品応用」の部分で言うと、aiboや不動産価格推定エンジン、あるいはXperia Earのジェスチャー認識やデジタルペーパーの手書き入力文字の認識など、AIを活用した製品・サービス化の事例はどんどん増えてきています。
三上:学習を短くすることは、性能のいいモデルを速く作ることにつながります。製品やサービスは、今後ますます個人に最適化されていくと思いますので、自分たちの研究活動が、そうしたものをより速く社会に実装する手助けになればと考えています。
──ソニーですと、エンタテインメントの領域でも何かしらAIが入っていくのだろうなと、ワクワクしているのですが……。
影山:うーん、まだお話できないですね(笑)。クリエイティブエンタテインメントカンパニーとして、エンタテインメントにしろ金融にしろ、いろいろな事業にAIを入れて活かしていくというのは、当然我々が進むべき方向だと思っています。
深層ニューラルネットワークの専門家がほしい!?
──ソニーと産総研がAIの分野で協働された今回の事例は、産総研にとって今後どのようなメリットがあるとお考えですか?
小川:いろいろなレベルがあろうかと思っています。影山さんから「スーパーコンピューティングは縁遠いものと思っていた」というお話がありましたが、我々は、スーパーコンピューティングに関して技術的蓄積があり、ABCIシステム自体に精通している一方、ソニーが得意とするディープラーニングの処理系に関してはそれほど知見がありません。お互いに技術を補完し合う関係であることは非常に重要だと思います。また、ソニーはアプリケーション領域をお持ちなので、将来的にはソニーと産総研の間でナレッジを共有しながら、研究開発を進めていけないかと思っています。
──AIについてよく言われることのひとつに、「解析はできるけれど、解釈するのはやはり人間」ということがあると思います。そうした「人と機械の関係性」について、影山さんはどういう意見をお持ちですか?
影山:基本的には「Explainable AI(説明可能なAI)」の領域だと思うのですが、社内でもたびたび話題にはなっています。「この結果の根拠は何なの?」と。例えば金融系の場合、何かしら予測をして、それに対して「何でこうなったんですか?」という疑問は当然出てきます。それに対して「学習させたからです」と答えても誰も納得しません。そこにどういう解釈を付与するかは、研究開発ネタとして存在するのではないかと思います。実際、安全安心といったところに近づけば近づくほど、説明責任が問われてくるのではないかと思いますし、社内でも研究をしています。
──新しい人材の採用活動はされているのでしょうか?
三上:DNN(Deep Neural Network:深層ニューラルネットワーク)の専門スキルを持った人が来て欲しいです。
影山:ただ、この領域は人材獲得競争が激しいですよね。今回のABCIで達成したような実績を、ひとつずつ積み重ねてソニーのAI分野でのプレゼンスを高めていくことが大切だと思います。Neural Network Consoleのクラウドサービスも含めて展開していますので、地道にコツコツやっていくしかないですね。また、製品・サービス化も含めて、AI分野におけるソニーの実績をもっと積極的に公開していく必要があるかもしれません。研究者は本質を見抜くので、お金をかけてプロモーションをしたからといって、すぐに来てくれるとは思えません。どちらかというと魅力的な研究ができる環境、我々でいうとエレクトロニクス・エンタテインメント・金融などの製品やサービスにつながる研究に繋がっていく、というところをしっかりアピールしていきたいです。
──小川さんは、日本にいい人材がやってくるために必要なことは何だとお考えですか?
小川:AI業界、特に研究者の業界では人材が流動することがそもそもの大前提となっています。アメリカで学位を取ったばかりの研究者に来てもらうのはかなり難しいという実情があるので、ヨーロッパやインド、あるいは中国の研究者、なかでも駆け出しの研究者に来てもらうことに、私自身は時間を割いています。その体験で言うと、魅力的な課題設定がちゃんと与えられるということが重要です。産総研で知見を積んだ研究者が組織に留まらず、外に出ていってしまうことは致し方ないです。「公的な機関として、人材を生み出すことに貢献したのだ」と、割り切っています(笑)。
影山:そういえば三上さんは入社2年目で、元々専門領域は違うんですよね。
三上:学科ではコンパイラーとかプログラム言語系をやっていました。専門はヒューマンコンピューターインタラクション、つまりUI(ユーザーインターフェース)です。
小川:なるほど。
影山:三上さんは今回、新たな領域へのチャレンジだったにも関わらず、すばらしい結果を出してくれました。いろいろな人材が集まることで次のイノベーションを生む、ということが、AIの分野でもあり得ると、僕は考えています。全然違う分野だけど、課題設定を適切にして、そこに向けて一気に進めていくと、トップレベルまで行けるんじゃないかという気がしています。
そういったアプローチも、考えて行きたいなと思っているんです。
──最後に、産総研との協業で楽しかった部分について教えてください。
三上:自分のやったことがダイレクトにすぐに外に出るので、それが楽しかったというか、嬉しかったです。
影山:僕は純粋に、外部の人と話すのが面白かったですね。いろいろな考え方があるなとか、自分たちに足りないところをどんどん教えてもらえるので。
そういえばこの前、「ソニーさんって時間にきっちりしてますよね」と言われてビックリしました。「えぇっ? どちらかというとルーズなことで有名なんですけど」って(笑)。異文化交流は、単純に楽しいですね。