コンパクトかつ高性能なAIを追求する
画像認識では人や環境物体を認識する機能を提供し、カメラ、ゲーム、モバイル、ロボットなどさまざまなソニー製品へ応用展開しています。具体的な技術開発としては、Deep Learningなどの機械学習技術を用いた顔認識やジェスチャ認識、物体認識、セマンティックセグメンテーションなどがあります。また、ソニーのセンサやプロセッサと画像認識アルゴリズムの最適化の検討もしています。AI × ロボティクスなどに求められる各種認識技術開発を通じて、実世界でリアルタイム動作するロバストな認識器をソニーの幅広い商品・サービスに展開していきます。
Deep Learningは機械学習技術の一つであり、訓練データを用意することであらゆるデータに関する「認識・予測」、「生成・変換」を行うことができます。ソニーでは要素技術として、大規模データ・モデル学習、モデル探索・圧縮、転移学習、生成モデル・ニューラルレンダリングなどの研究を行っており、それらの成果をGUIによる開発ツールNeural Network Console、オープンソースライブラリNeural Network Librariesと合わせて公開し、世界のAIの発展に積極的に貢献しています。これらの技術は、これまでにも多くのAI応用を実現しているエレクトロニクス製品だけでなく、映画・音楽・ゲームといったエンタテインメントビジネスやその他新規事業と多岐にわたり活用されます。
「行動学習」は強化学習に代表されるように、自律システムが試行錯誤を通じて環境に適した行動を獲得する技術。人が設計しきれないほど複雑・多様な状況での行動計画や、事前の想定を超えて変動する環境に追従するオンライン最適制御を主な目的とし、Navigation(地図獲得と自律移動)とManipulation(物体操作)などのロボティクス課題やゲームAI分野への応用を目指しています。海外大学や研究機関との共同研究も積極的に行ない、最先端技術を取り入れた研究開発を進めています。
ユーザーの発話やテキスト入力を理解して、音声とビジュアル表現を組み合わせ、生き生きとしたキャラクター表現で応答を返すエージェントプラットフォームを開発しています。このエージェントプラットフォームは、音声認識や画像認識、発話意味解析、対話応答生成、ビジュアル表現制御など、様々な技術を組み合わせて実現しています。また、対話アプリケーションを開発するためのツール、SDK、クラウドシステムの開発も進めています。アニメ・映画などの「エンタテインメント領域」、ライフプランのサポートなどの「金融領域」、店舗やオフィスの受付や案内といった「B2B領域」でのアプリケーション活用が進められています。
ソニーグループ各事業においてデータ利活用による新しい顧客価値やビジネス創出の動きが活発です。ソニーグループには、エンタテインメント・エレクトロニクス・ネットワークサービス・金融など様々な事業があり、多種多様なデータが日々生まれています。それらのデータを効果的かつ簡単に活用できるよう、新しい機械学習技術と分析プラットフォームを研究開発しています。具体的な取り組みとして、例えば機械学習や統計の専門家でなくても予測分析を簡単に実行できるPrediction Oneや、DTC(Direct to consumer)サービスにおける個人化のための因果推論技術などがあります。これらコア技術と分析プラットフォームによって先端技術を社会実装していきます。
あらゆる商品・サービスにAI機能が当然のように利用されていますが、その中核となる技術がDeep Learningです。しかしながら、より高度なAI機能の開発のために、利用される学習データ量は年々増加し、また学習に利用するモデルも巨大化していくため、Deep Learningの学習時間は年々増加の一途を辿っています。そこで、ソニーでは、AI開発のためのスーパーコンピュータ(GAIA)の構築と技術開発を行っています。特に、最新のH/Wをベースに「AI開発に最適なアーキテクチャ技術」、H/Wリソースを最大限活用するための「リソースマネジメント技術」、複数のGPUなどのプロセッサを利用し超高速な学習を実現する「大規模分散学習技術」に注力しています。これらの技術をGAIAに統合し、さらに社内の学習データ共有システムであるsDataと連携することで、AI技術開発の高速化の実現とAIによる新たな価値の実現を目指しています。
説明可能なAIとは、ブラックボックスと言われる機械学習を人間が理解できるように、判断根拠の可視化する技術です。このテーマの目標は、信頼されるAIを構築することです。近年の機械学習の進展は目覚ましく、あらゆる分野にて技術革新をもたらしています。その一方で、AIが人間を傷つける倫理問題も生じています。そこで、機械学習における公平性、説明性、透明性を技術にて解決するために、説明可能なAIの研究開発に取り組んでいます。説明可能なAIによって、どのような理由でAIが判断を下したのかを人間が理解し、コントロールできるAIを目指しています。