Cutting Edge

「クリエイティブに寄り添うAI」こそ、
ソニーらしいAIの未来

2019年8月9日

スマートスピーカーのみならず、人事採用や投資運用など、さまざまな場面にAIが実装される時代となった今日。AI研究の最前線では、いったいなにが起きているのか?そして、今後ソニーとして歩むべき方向性とは?ソニーが誇る2人の異才、北野 宏明と藤田 雅博に訊いた。

プロフィール

  • 北野 宏明

    ソニー株式会社
    執行役員
    ソニーコンピュータサイエンス
    研究所 所長

  • 藤田 雅博

    ソニー株式会社
    AIコラボレーションオフィス
    シニアチーフリサーチャー

「入力」と「出力」が結びついてきた

──発明家/未来学者のレイ・カーツワイルが「シンギュラリティ」について言及したのが2005年でした。それから14年が経った現在、AI研究の最前線ではどのような「テーマ」や「課題」が論じられているのでしょうか?

北野:画像認識であるとか、認識・分類系のことはかなりできるようになり、普及期に入ってきたといえます。実際、色々なオープンソースの深層学習ツールやGoogleの「Cloud AutoML」のような非常に簡単に深層学習が使えるようなサービスも出始め、多くの人たちが機械学習という側面からAIを使うようになりました。

あと、自然言語処理系の進化もすごいですね。これもGoogleになってしまうのですが、「BERT」という非常に高性能な自然言語処理の手法が発表されたり、発話者の声や雰囲気を再現した声で翻訳ができるような技術が登場しました。次は、これらの技術の実用的な応用やさらに難易度の高い「連続的で、スムーズな対話ができるかどうか」という点がチャレンジになります。

そうした学会レベルやショウケースとして進んでいるプロジェクトに関してはどんどん新しいものが出てきているわけですが、一方で、モノやサービスといった実装のフェーズで見てみると、うまくいっているものもあるし、思ったよりうまくいっていないものもあるといった状況です。すべてがディープラーニングで実現できるわけでもありませんから。

藤田:ディープニューラルネットワークの研究は2000年代後半には始まっていたと思いますが、われわれ研究者の間で知られるようになったのは2010年あたりでした。2014年頃から、画像認識の精度が人間の認識能力を超えた、という結果がではじめました。特に認識技術に関しては、コンピュータ技術の発達により、大量にラベル付けをした教師データを処理できたり、学習時の課題である過学習などを防ぐ工夫が出てきたことが急激な改善に貢献したと思います。そしてその次に登場したのが、「AlphaGO」のようにこのディープニューラルネットワークと強化学習を組み合わせて使いインタラクションのストラテジーを学習していくタイプですね。

さらに最近、ディープニューラルネットワークを用いた生成系がいろいろ出てきましたね。絵を描いたり音楽を作ったり、音声合成もそれにあたります。敵対的学習法などを用いて、かなりリアリティのある画像や音声をつくれるようになってきたと思います。

AIが「科学的発見」をする意味

──AIに関する最大の国際学会である「IJCAI(イチカイ)」2019にて、北野さんは基調講演をされるそうですね。どのようなお話をされるのでしょうか?

北野:ライフワークとも言える、AIとシステム生物学の融合の話をします。特に、AIとロボットで、科学的発見を自動化するというテーマです。そこで取り上げるのが、「ノーベル賞クラスかそれ以上の科学的発見を、AIシステムが自律的にできるようにする」チャレンジです。今後20〜30年で完成させ、生命科学の分野を中心に活用していきたいと考えています。

生命科学は、とりわけ人間が苦手な分野だと思うのです。情報量が非常に多くて、対象になるものが非線形で、超多次元で、その動態の解釈にも曖昧さがあります。こういうものを理解するのって、人間は認知機能的に不得意だと思っています。ちなみにバイオメディカルの分野では、毎年200万本の論文が出ています。がんや免疫系といった重要な分野では毎日数百本ほどの論文が出版されています。つまり、人間の情報処理能力を完全に超える量の知識が生み出されているわけです。

だからここをAIでやれるようにしたいのです。いまでも生命科学は、iPS細胞ができたり新しい抗がん剤ができたり、すごく進歩はしているけれど、AIが入ることによって、飛躍的に進歩するのではないかと考えています。
その一環として、わたしは「ノーベル・チューリング・チャレンジ」というものを提唱しています。高度に自律性を持つAIサイエンティストが開発されたら、その科学的発見をしたのが人間なのかAIなのかどうか、ノーベル賞委員会がわかるかというと、わからないのではないかと思っているからです。例えばビットコインの生みの親であるサトシ・ナカモトは、「誰かはわからないけれど、誰かなんだろう」とみんな思っていますよね。なぜあれをAIだと疑わないのかというと、AIがまだそのレベルに達していないことをみんな知っているからにほかなりません。しかし、ブロックチェーンや仮想通貨の分野で、ノーベル経済学賞を与えることになるとするとサトシ・ナカモトに授賞せざるを得ないですよね。同じようなことが起きる可能性があります。

あと、数学の世界では1930年代にブルバキがいましたよね。みんなニコラ・ブルバキという人物がいるのかと思っていたら、実はグループで、ブルバキという仮想の人格を作っていたわけです。それと同じように、人間だと思っていたけれど、実はAIなんじゃないかと思われるレベルに早く到達したいと思っています。

AIシステムがサイエンティフィックディスカバリーをするということは、知識を生み出すマシンができるということです。これは、いままでほぼ実現していません。知識を生み出し、しかも加速するから、毎日のようにすごい発見をすることになるはずなんです。その知識を使って技術的に次のことをやるようになると、おそらく文明が次のフェーズに入るというか、われわれの手を離れて加速していくことになるのではないでしょうか。

──そのときのAIというのは、どういうものなのでしょうか?

北野:ふたつ考えられます。ひとつは、なんでもアクセスできるひとつのAIエージェントがスーパーサイエンティストになるか、もうひとつは、それぞれが専門領域を持ち、知識をオーガニックに成長させていく多様なAIエージェントがつながっていく感じです。

人間の科学者は、基本的に「これを研究して、次にこれを研究して、これを知ったからこれが見つかった」というヒストリーがあります。そうした状況を、たくさんのAIエージェントで作るのがいいのか、それともすべてにアクセスできる全能のエージェントを作るほうがより発見が早いのか……。どちらがいいかはまだわかりませんが、もしかしたら、多様なエージェントがたくさんいるほうがいいのかなと思ったりしています。そこは、とてもおもしろいところですよね。

あと、「すごく大きな発見を狙わない」といったこともありえます。「それほど難しくはない実験を1年中ひたすら続け、可能性を全部やる」というのは、機械だからこそできることですから。

サイエンスのおもしろいところは、どこに重要な発見があるかわからないところなのです。最近だと、液体のりの成分で造血幹細胞を大量培養できるというニュースがあったじゃないですか。あれは決して偶然ではありません。15年間研究を続け、そのなかで見つかったのがあの物質だったわけです。話としてはおもしろいのですが、偶然、液体のりと思いついたわけではなく、網羅的に実験をし続けた結果なのです。

つまり、そんなに複雑な実験じゃなくても「全部やるといろいろわかる」ことがたくさんあって、そのなかには、極めて重要な発見もあるだろうと。サイエンスのおもしろさってセレンディピティだったりするのですが、人間が介在すると、おそらく人間が重要だと思うところにいくんです。その点、機械はバイアスをかけないので、「人間だったらやらないよね」というところですごい発見が起きるだろうと思っています。

──藤田さんは、「スーパーサイエンティストなAI」と「多様性のあるAI」という点に関してはどのようなお考えをお持ちですか?

藤田:個人的な好みで言うと、狭いけれど深いところを知っているマルチエージェントが統合的に行動するほうが、成功する可能性があるのかな、と思います。はじめから全領域を知っているエージェントを開発するのは難しいですし、実際問題としていろいろな領域の学習をすることで、学習が収束しなくなったりするので、ある分野に限った特殊性を持ったAIエージェントが多数いるうえで、全体調整として統合されるようなかたちになると思います。

よく、対話のエージェントをどう実現するかといったときに、例えばラーメンのことばっかり知っているエージェントとカレーばっかり知っているエージェントのようなものを別々に作ることはそれほど難しくありませんが、それらすべて知っているエージェントをひとつにするのはなかなか難しいんです。

その点、それぞれのドメインで特殊な知識や能力を持ち、それに沿った特殊な喋り方で対話をするといったことであれば、インクリメンタルな(徐々に増やしていく)方法で実現していくことは可能だと思います。

ソニーはなぜ「食」へ向かうのか?

──IJCAIにて、「食に関するワークショップ」を開催するそうですが、その狙いはなんですか?

藤田:食の領域に人工知能を道具として持ち込む、ということを主張したいと思っています。基本的に食というのは、和食にせよバスク料理にせよ、長い歴史のなかで培われたルールが一応あります。そのルールに則って、いろいろな食材や調味料や調理法の組み合わせをするわけですが、そのコンビネーションを、いろいろ変えて新しい組み合わせにすることで新しい味が生まれるわけです。例えば、ラズベリーと海苔は同じドミナントな分子構造を持っているので、海苔巻きにして食べるとおいしい……といったことだったり、ある制約のなかで組み合わせると、それなりのおいしい味になるということはわかってきています。

食材は非常に広がりがありますし、クッキングというのはある意味、化学的なプロセスですから、それを探し当てることによってどういう結果になるのか、という話には人工知能の領域としても魅力的なテーマだと思います。

北野:今年の3月に、バルセロナで「SCIENCE & COOKING WORLD CONGRÉS 2019」というカンファレンスが開催され、ソニーもセッションを持ったりディナーを主催したりしました。ちなみにこのイベントのオープニングトークは、かつて分子ガストロノミーで非常に有名になった「エル・ブリ」のオーナーだったフェラン・アドリアでした。

カンファレンスで出てきた議論を見ていると、経験的に「これがいいね」という味だけではなく、本当にサイエンスに切り込もうとしている姿勢が感じられ、われわれが貢献できる部分は大きいと思いました。

バルセロナやサンセバスチャンは、食におけるシリコンバレーですね。ものすごくいろいろなことをやっていますし、かつて「エル・ブリ」にいたシェフたちも、自分で店を持ち、アトリエなりラボなりといった場所を抱えているようです。そこでありとあらゆる実験をして、その結果、いいレシピをレストランで出すというやり方をしています。かなり本格的に、サイエンス×フードを実践している感じですね。

藤田:先日、サンセバスチャンのあるシェフと話をしたのですが、レストランを経営していると、とにかく日々のオペレーションが大変なのだそうです。なので1年に4ヶ月の休暇を取り、1ヶ月は普通のバケーションにあてるけれど、あとの3ヶ月は、新しい料理を考えるためにいろいろなトライをする期間にあてているそうです。それくらい、アタマを切り替えないといけないそうです。完全にクリエイティビティを持ったモードでいろいろなことにチャレンジするアタマと、日々のレストランのオペレーションのなかで集中しておいしい料理を作ることは、全く違うそうです。AIは、そうしたシェフのクリエイティビティをアシストできるのではないかと思っています。

「トロッコ問題」になった時点で負け!?

──ところでAIというと、一般的には「トロッコ問題」や「フレーム問題」といった課題が挙げられますが、おふたりは、倫理面から見てどのような課題があるとお考えでしょうか?

藤田:ソニーの立場でいうと、「ソニーが提供する商品とサービスに含まれるAIが、どういう社会的な問題を起こす可能性があるか」、ということがポイントではないかと思います。

一般的に言われているのが、顔の検出・認識において、いわゆる肌の色や性別によって認識率に差があることであったり、ある会社の採用にAIシステムを使うというとき、どうしても男性のデータが多めになる可能性があり、それゆえのバイアスが起きてしまう可能性があったり……といった点で、意図的ではないにせよ、結果としてジェンダーによる認識の差が出てしまう可能性があります。

ディープニューラルネットワークというのはブラックボックスですから、それをブラックボックスとして使ってしまうと、「データとしてきちんと入れて、その結果いい結果が出ました」といっても、副次的にやはり何らかのバイアスがかかってしまっている可能性があります。その辺をきちんと認識しながら、お客さまにはそういった問題がないことを説明しながら、社会に受け入れてもらえるAIシステムを届けるということが重要だと思います。

ちなみにトロッコ問題は、人間が考えても難しい問題じゃないですか。ディスカッションとしてはおもしろいのですが。

──北野さんは、バイアスの解消についてどうお考えですか?

北野:プロセスを「工学」としてやらなければダメだと思います。「やってみたらこうだった」では手探りになってしまい、それだと作業として成り立たちませんので、プロセスに品質基準を設け、アンバイアスなAIシステムを作り込めるシステムを作る必要があると思います。その意味でも、特にマシンラーニングの工業化/工学化というのが非常に大事なプロセスになってくると思います。

トロッコ問題に関していうと、わたしから見ると、トロッコ問題になった時点で負けです。要するに、道路を塞がれたのに止まれないというのは、その手前から減速しているべきだし、視界が悪かったのなら尚更すぐに止まれるように徐行してるべきです。なので、「そもそも、トロッコ問題という状態になった時点で負けてるでしょ」という話です。

トロッコ問題は哲学的な問いとしてはとても興味深いものですが、プラクティカルには、そこに行ったら負けなので。その手前で解決しておきましょうという話になると思います。

──いま北野さんがおっしゃった「バイアスに対する工学」というのは、すでに研究が進んでいるのでしょうか?

藤田:そういう議論や研究をする団体が出始めている状況です。もちろん、われわれのほうでも気をつけながらやらなければ、という意識を持っています。元々ソニーも含めて、家電における品質保証システムをしっかり作っていますよね。ハードにせよソフトにせよ、品質、あるいは安全性として定義されて、それをきちんとチェックするプロセスが入っていますので、そこにAIが入ってくるとき、なにが特殊なのかということを考えながら入れていくというのが、大事なアプローチだと思っています。

クリエイティブに寄り添うAI

──「ソニーらしいAI(研究)」と言うと、エンタテインメント分野が挙げられると思います。この分野において、現在、どのような成果が出ているのでしょうか?

藤田:例えば音楽で言うと、ソニーコンピュータサイエンス研究所(以下、ソニーCSL)では「Flow Machines」という自動で作曲をするAIを開発しています。と言っても、人間の代わりに自動作曲して出せばいいかというとそうではなく、「作曲家というクリエイターを支援するためのシステム」というのがわれわれのスタンスです。AIとクリエイターがお互いにインタラクションしながら、最終的には人間がいい曲を生み出せる状態を作りたい、というプロジェクトです。

これは調理も同じで、シェフがいい料理を作るために、AIがいろいろな検索結果や仮説を提案することで選択肢を与え、人間の感性で選んだり選ばなかったり、ということがエンタテインメントの領域で重要になるのだと思います。映画創作でも同じことが言えると思います。クリエイティビティを発揮させるところには、必ずそういうシステムがいるのではないかと思います。

北野:「Flow Machines」は、ソニーCSLパリが中心となって行っているプロジェクトで、3年くらい前にビートルズ風の曲を「Flow Machines」が作った動画がYouTubeでも話題になりました。それはそれで、「AIはここまではできるのか」ということで非常におもしろかったのですが、実際には、アーティストが「ビートルズ風の曲を作りました」といって売り出すことはないですよね。自分風の曲でなければいけないわけですから。従っていまは、アーティストが自分のオリジナルの曲をインタラクティブに作っていくプロセスを、「Flow Machine」でサポートするというコンセプトでやっています。例えばコード進行とか、自分のスタイルをデータとして入れて、自分のスタイルはあるけれど、自分は思いつかなかったものを出してくれるようなシステムにガラッと変わりました。ヒューマンセントリックというか、アーティストのクリエイティビティをできるだけ発揮してもらうように、AIはアシストをするというわけです。実際使っていただいていると「人間だとこのフレーズは思いつかないよね、でも、これおもしろいよね」というものが結構出てくるんです。そうしたパフォーマンスを、今年のSXSW(サウス・バイ・サウスウエスト)で披露しました。

そういったAIによるアシストが、エンタテインメントのクリエイティブの領域にこれからたくさん起きるのではないかと思います。アーティストが予想していなかったものができたらおもしろいわけです。「なにこれ?」みたいなものが出てきたときに、創造力を刺激されるというか。どうしても人間のイマジネーションには限界がありますから、AIがアイデアをどんどん出してくれると、「だったらこういう展開があるよね」と、人間のクリエイティビティが刺激されるといった感じです。

AIと腸内フローラの相関関係?

──今後、例えば第二の脳と呼ばれる腸の研究が、AI研究にフィードバックされることはあるのでしょうか?

北野:フェーズによりますね。強化学習みたいなものは、動物行動学や心理学の成果が入ってきたりすることもあります。ただ、いまはディープラーニングとか強化学習を応用する部分でやることがあまりにもたくさんあるので、みんなそこに集中している感はあります。

あと、末梢神経系や脳腸相関や、神経の免疫支配やマイクロフローラといったものって、すごくファンダメンタルなところじゃないですか。最近では、腸内細菌や炎症性腸疾患と中枢神経系疾患の関係がわかり始めました。これがAIにどう還元されるかは、まだわかりません。ただ、サイエンスとして極めて大きな進展、特に今までの常識を覆すような発見が次々と出てきている領域なので注目です。これはガストロノミーの研究の方に大きく関わるように思います。

藤田:腸内フローラの話は、バイオロジカルに正確にモデル化する、という意味でのサイエンスもあると思いますが、複雑なシステムをどのように安定的に動作させるのか、という工学的な意義もあると思います。いろいろなシステムが協調しながら、ある統一的な目的に向かって中央司令なしに進んでいくシステムを考えるときには、どういう原理で動いているか、ということは非常に参考になります。従って、マルチエージェントが中央司令を持たずにどうやって協調しながらゴールを達成するかといったことをやるときには、そういう部分を参考にするという話も出てくると思います。

──ほかにも、AI研究において生物を模倣しているケースはあるのでしょうか?

藤田:わたしはロボットもやっているので、いいか悪いかは別として、どうしてもバイオミメティック(生物模倣)な解決策…を取ることがあります。逆に言うと、人間の制約をはずして考えるとき、例えば腕が2本ではなくて数本あるようなシステムを考えるとき、人間とは違う発想のシステムが必要で、だったらなにをメタファーにすればいいのかというのは、常に求めながらやっています。自然界のなかには、そのように似たようなシステムがあることが多いです。

北野:例えば基板に手作業で細かい表面実装をするときとか、腕が2本だと足りないですよね。あと2本くらいあれば、ちょっと基板を押さえたりしながらはんだ付けできるのにと。

藤田:人間と協調して解決するタスクに対して、ロボットを人間と協調的に動かすにはどうすればいいか。端的に考えれば、人間がなにをしたいのかを意図推定して助けていくという話だと思うのですが、それ自身は極めて難しい問題なんです。

例えばシェアードエコノミーと呼ばれる世界は、機械と人間とオートノミーをうまくシェアしながらタスクを進めていくという話なわけですが、そこにおける意図推定みたいことをどうするのかというと、まだまだ難しい。もちろん、人間の意図推定のやり方をアナロジーとして持ちながら、もう少し工学的なアプローチを取りながら進めていく必要があると思います。

──そういった意味でも、クッキングという領域はおもしろいわけですね。

藤田:いままでソニーは映画、音楽、あるいはゲームとやってきましたが、基本的に仮想世界が多いんです。でも食に行くということは、実世界で実際に行われる作業をどうやってAIとロボットが協調してやっていくか、という物理実体による作業が含まれているわけですよね。これは、ロボット研究者においても、非常にいいテーマじゃないかと思います。

──やる領域が本当に多岐にわたっていますので、人材の育成や採用が急務ではないかと思うのですが、どういった現状なのでしょうか?

北野:まあ、がんばって探して採ることで、それしかないです。良い人をとるには、チャレンジングなテーマがあることが必須だと思います。ソニーに来れば一緒に世の中を変えられるというテーマですね。まずは、これが基本だと思います。あと、AI領域にコミットしているか?という本気度も見ていると思います。あと、現実的な側面では、いろいろな意味で大きなアップサイドが期待できることですね。

藤田:魅力的な成果を出して、「ソニーに来ればチャレンジングなことができますよ」というアピールをしていくことが大切だと思います。魅力的なテーマを企業として発信しながら、そこに人をつけていくようなアクションを取っていくことがひとつだと思います。IJCAIのメインスポンサーになったのも、人材獲得に対するわれわれのメッセージだったりします。

──いま、どこにAI人材が集中しているのでしょうか?

北野:世界中で人手不足です。どこに行っちゃうということでもなく、あらゆるところで足りない。強いてあげればスタートアップでしょうか。スタートアップの場合は、IPOによるアップサイドがすごくあるじゃないですか。なのでわれわれも、状況によってはカーブアウトするようなことをやったりだとか、アップサイドが取れるような施策をすることが必要かもしれません。いろいろなやり方を考えながら、いい人材を吸引して、新しいことができて、ビジネスとして成長することを考えていく必要があります。世の中のリアリティをちゃんと反映させて、こちらから攻めていかないといけません。

藤田:AI人材と言っても、研究者のほかにも、AIシステムを使って製品やサービスを提供するエンジニアも必要です。いまは、そうしたエンジニアたちが急速に必要になっている状況です。

北野:ただし「なにに使うか」、つまり領域のことがわかっていないといけません。AIやデータサイエンスのことはよくわかっているけれど、例えばクッキングにAIを使いたいとなったら、クッキング自体のことがわかっていないと大したことはできません。製造業だったら製造工程のことや素材のことや設計デザインのことがわかっていないと、中途半端なことしかできません。

AIの基礎は重要ですが、応用する領域への理解が深いことが重要だと思います。それは、エンジニアやサイエンティストに限らず、経営でも、経理でも、人事でも同じです。人事のAIシステムを作るといったら、人事のことをわかっていない人が作ったってお話になりませんから。

──最後に、「これは生きている間に実現するんじゃないか」という夢を教えていただけますか?

北野:わたしは「ノーベル・チューリング・チャレンジ」ですね。あれで人類の行く末は変わります。AIが、エクスポネンシャルに発見を加速される。文明の大転換です。それが一番大きいかな。

藤田:わたしは食ですね。食の分野でロボットとAIを使って……というところでブレイクスルーを起こしたいと思います。シェフが、いわゆるソニーでいうところのアーティストやミュージシャンと同じような立場になり、みんながそれを楽しめるような状態であったり、知識もスキルもない人がなにか作りたいなと思ったときに、一緒になって作ってくれるようなシステムであるとか、食に対する世界観をドラスティックに変える提案ができればと思います。

関連記事