People

標準化とは、社会インフラを作ること

2019年3月1日

まるでフィールドに立っているかのような視点から、サッカーを観戦する。そんな没入感のある体験が可能となる時代がやって来る。しかしそれを実現するためには、現在のストリーミングとは違う概念を持つ必要があると、技術者たちは考えている。エンタテインメントの未来に向けて、今後、オーディオとビジュアルに関する技術はいかなる発展を遂げるのか。その担い手たちに話を訊いた。

  • 平林 光浩

    ソニー株式会社
    R&Dセンター
    基盤技術研究開発第1部門
    コネクティビティ技術開発部

  • 山本 優樹

    ソニー株式会社
    R&Dセンター
    基盤技術研究開発第1部門
    オーディオ技術開発部

  • 鈴木 輝彦

    ソニー株式会社
    R&Dセンター
    基盤技術研究開発第1部門
    映像技術開発1部

この四半世紀で、会話をするパートナーがどんどん変わった

──最初に、みなさんの社歴を教えていただけますか?

平林:私は1991年中途入社で、研究開発一筋ではありません。最初は事業部に配属され、業務用機器の設計をしていました。研究開発に異動したのは97年で、2000年からはカムコーダーのフォーマット開発に携わりました。ソニーは元々、テープであったりディスクであったり、磁気メディアの技術を強みとして持っていたわけですが、そうした「磁気メディア」から「インターネットメディア」へと時代が移り始め、「どこを基点にしていけばいいのか」というゆらぎが起きたのが、ちょうどそのころだったように思います。

鈴木:私は92年にソニーへ入社して以来、ビデオ用映像信号の圧縮技術(or アルゴリズム)を研究開発しています。当時からMPEGで標準化されていたので、ある意味やっていることはずっと変わらないと言えます。入社したころは、ちょうどMPEG-2 を使って、DVDやデジタル放送事業を立ち上げる時期でした。その規格化に最初から加われたのは幸運でした。いまは、次世代のより圧縮率が高いものの規格化をちょうど始めたところです。

──映像技術のトレンドは、鈴木さんが見てこられたこの15、6年の間だけでもどのような変遷があったのでしょうか?

鈴木:国際標準化に携わっていると、社内だけではなく、いろいろな会社の方々と話しをします。会話をするパートナーがどんどん変わっていったという印象です。最初のMPEG-2やDVDの標準化が進められていたころは、日本のメーカーが主流でした。その次の世代になると、米国のIT系企業が強くなり、さらにその次は、スマートフォン向けSoCを手掛ける半導体系の会社がキープレイヤーとなりました。そしていまは、中国のIT系企業が強くなってきています。中国はこれまで独自路線で標準化を進めてきたのですが、国際的な枠組みの中で進める方向性へとシフトしている印象です。

──山本さんはいかがでしょうか?

山本:私は2008年の入社です。時代的にいうとIT全盛で、米国のITベンチャーが存在感を出してきた時代です。大学では情報系を学んでいたので、IT系を希望する学生は周りにたくさんいました。そんな環境でもソニーを選んだのは、実はとても個人的な理由です。昔からピアノを弾いたり学生時代はバンドをやったりしていたので、働くなら音楽に関係するところがいいと思っていました。たまたまソニーのオーディオ担当部署でインターンをすることになり、音楽にも触れられ、学んだことも生かせるということで決めました。

入社した2008年は、MPEGでのオーディオデータ圧縮の標準化が一段落している時期でした。そのため、入社後の数年間は標準化ではなく、その周辺技術の開発に携わりました。具体的には、圧縮することで劣化してしまった音質を、高音質にするという技術です。2010年代に入ってからは、この高音質にするという技術を圧縮に応用し、MPEG規格として標準化する、ということを行っていました。その後は、3次元立体音響や、機械学習をオーディオに応用するといった技術開発を進めています。

この先、ストリーミングとは違う概念が必要になる

──VRなどに代表される没入感の高い体験を可能にする「イマーシブメディア技術」の標準化という点に関して、みなさんそれぞれの立場から意見を聞かせてください。

鈴木:イマーシブメディアという言葉自体がとても広義です。テレビのように2次元(2D)だったところから、最近では、空間を映像としてキャプチャーできるようになってきました。今後は、空間の中に入って好きな所を見たりすることを目指していくことになると思います。ただし、その時代の到来は10〜20年先になるのではないでしょうか。今は、そこに向けた要素技術開発として、撮り方や圧縮などの様々な信号処理技術、認識技術といったところを、できるところから少しずつ始めているという段階だといえます。まずはヘッドマウントディスプレイを被ってできるようなものから、徐々に未来形のものに取り組んでいくということになると思います。

──ヘッドマウントディスプレイを被って全天球の映像を見る、というのが現段階だとすると、今後は、どのような没入感のある映像体験が考えられるのでしょうか?

鈴木:例えばサッカーのフィールドに入って自分の好きな所が見られるようになる、といったところが次のステップになると思います。もしかすると2020年には、限定的なものが体験できるかもしれません。

山本:イマーシブメディアの技術開発をするのは当然のことだと思うのですが、ソニーの強みを生かすためには、いいコンテンツを作り続けていかなければならない、という点が重要だと思います。イマーシブメディアは新しいメディアなので、表現の仕方がこれまでのメディアと全く異なります。コンテンツ制作の手法も大きく変わるでしょう。そのため、クリエイターも巻き込んで「イマーシブメディアはどうあるべきか」というところを突き詰めていかなければならないと思います。そういったところに対する取り組みを、いまは進めています。

平林:我々がやっている配信技術という視点で見ると、現状主流のストリーミングは、流れてきたものを端末側で受けとるということになります。しかし、音であれ映像であれ空間のデータを送るということになると、そのデータ容量は膨大となり、現在のストリーミングとは違う概念を持ち込んでいかないと情報を送ることは難しいと思います。

──いまは話せないとしても、現在のストリーミングの次にくる配信の概念を、既に研究しているということですよね。

平林:はい。おそらく5〜10年のうちにはその一部が登場してくると思います。

鈴木:結構世界が大きく変わる話なのですが、一気に切り替わるというより、ステップ・バイ・ステップで進んでいくと思います。例えば映像を映し出す装置が2Dのテレビというのは、私たちが子供のころからあまり変わっていないと思うのですが、現在取り組んでいるものは「対象となるディスプレイデバイスは何だろう」といったところから考えているので、自由度がとても高いです。直近だとヘッドマウントディスプレイがありますが、少しずつ変化していくと思っています。大きく変わるのは、10年、もしかすると20年後ではないでしょうか。そこまでいくと少し先過ぎるので、手前でまずはできるところからやっていこうと思っています。

標準化活動が認められ 産業技術環境局長賞を受賞

扱うのは、もはやRGBの画像だけではない

──未来の話になってきたところでひとつ聞きたいのですが、自分が思い描く未来像に近い映画はなんでしょうか?

山本:『バニラ・スカイ』は、とても没入感があり好きですね。

平林:好きなSF映画はふたつあります。ひとつは『バック・トゥ・ザ・フューチャー』です。スケボーが浮くなど、技術的な観点で大好きです。

もうひとつは『猿の惑星』ですね。私たちは技術開発をやっているわけですが、「社会はこのままでいいのかな」、「この先人間がサルにひっくり返されるくらい、大きなことが起きるのかな」という社会的な危機感を示唆する作品に思えて好きなんです。

鈴木:私は『ブレードランナー』が好きです。レプリカントは、ある意味AIが進化していく世界の象徴でもあると思います。実際にあの世界が来るかどうかはともかく、リスクというものを考えさせられます。

──では、みなさんの研究開発が、どのような未来へとつながっていると考えていますでしょうか?

鈴木:イマーシブというのは、ひとつの方向ではないかと思います。もうひとつの方向として、例えば自動運転が象徴的だと思います。映像はこれまで人間が見るものでしたが、だんだんとセンシングする装置がいろいろなものに付いてきているので、もはや扱うのが、普通のRGBの画像だけではなくなってきているのが現状です。そうなった時にどのような新しい処理が必要になってくるのかということを、今後考えていく必要があると思います。

山本:人類は、ほかの動物と違ってエンタテインメントを楽しむところが特徴でもあると思います。この特徴は未来でも変わらないでしょう。また、エンタテインメントの形態は技術に影響を受けます。このように考えると、自分の技術は未来のエンタテインメントにつながるのではないかと思っています。かつて、録音したり録画したりする技術が登場し、音楽や映画といったエンタテインメントを楽しめるようになりました。いまはちょうどその形態の転換点にあるのではないかと思います。例えば200年後を考えた時に、「まだスピーカーがふたつ」なんてことはないと思います。おそらく200年後、当たり前のようにいろいろなところにスピーカーが埋め込まれ、すべての空間で映像が楽しめる、といった本当に没入感のあるエンタテインメントが登場していると思います。私は、いままさに、そういったところに向かう技術開発に携わっています。

平林:私は、ふたつあると思っています。ひとつはユーザー・ジェネレイテッド・コンテンツ(UGC)と呼ばれるユーザーが作り手となったコンテンツ市場の裾野が、ものすごく広がっているという点です。その裾野は、我々が想像しているよりも、もっともっと広がっていくのではないかと思っています。あくまでも個人的な見解ですが、この先社会は、コンテンツの楽しみ方が、個人個人に合わせて細分化されていくのではないかと考えています。それを実現するのが我々の技術だと思っています。また配信技術においては、送り手側のプレイヤーやコンテンツが今後大きく変わってくるのではないかと感じています。

誰かに自分が考えていることを伝える手段はいまでもありますが、今後は没入感のある映像やオーディオメディアを使って、手軽でおもしろい表現が出来るようにしていきたいと思います。

もうひとつが、高齢社会におけるエンタテインメントです。コンテンツの多様化は、見やすく聴きやすいといった、アクセシビリティを高める手助けに繋がるため、高齢の方にとっても重要になります。さらに身体機能などをサポートするメカトロニクス技術と、多様な映像とオーディオの配信技術が融合することで、高齢社会を支えるものになっていくと考えています。

標準化とは、社会インフラを作ること

──ソニーが設立されて以来、オーディオとビジュアルは、常に根幹にあった技術だと思いますが、今後の数十年を考えた時も、引き続き重要な技術であると考えていますか?

山本:そう考えています。五感といいますが、人間は目と耳から得る情報が大きいので、そのほかの器官によって捉えられる感動と比べると、もちろん個人差はありますが目と耳で得る感動の大きさは計り知れないと思います。

平林:ほかの器官を使ったエンタテインメントも今後は登場すると思いますが、オーディオとビジュアルの影響力が落ちることはないと思います。

鈴木:デバイスがいまのままかはわかりませんが、ビジュアルとオーディオが人間の主要な情報源であることは、今後も変わらないと思います。

──先程平林さんから、高齢社会におけるエンタテインメントの可能性のお話が出ましたが、ご自身の研究開発と社会貢献という意味合いが交わることは今後あり得るのでしょうか?

山本:私は「時間」というものがとても重要だと考えています。同じことをするにあたっても、それにかかる時間は短い方がいいのは当然のことだと思います。その点、いま我々がやっている伝送とか圧縮技術というのは、究極的にはそこを目指しているともいえます。例えば空間を伝送することができたら、移動時間をなくすことができます。しかも情報量を落とさないで伝送することができれば、まったく同じアウトプットを短時間でできるようになるわけで、それは大きな社会貢献になるのではないかと思います。

鈴木:夢のある話の後に現実的な話題で恐縮ですが、いま我々がやっている国際標準化自体が、ある意味インフラを作っているともいえるわけです。広い意味では日々の活動自体が社会貢献につながっているのかもしれないと改めて感じています。

次の新しいオーディオとビジュアルの土台を我々が作っているのだとすれば、その土台の上で人々に楽しんでもらえることになるわけですが。その土台作りにアクセシビリティを高める視点を盛り込むことは、年齢や障がいの有無に関わらず、あらゆる人がコンテンツを楽しめる社会の実現につなげられるのかもしれません。

平林:それはその通りですね。標準化って、まさに社会インフラそのものなのではないかというのは、とてもいいメッセージだと思います。

関連記事