AIスピーカーと音声対話 (LINEがAIスピーカーを正式発表)

日経コンピュータがITProの平成29年10月5日付で報道していました。同日、LINEがAIスピーカー「ClovaWAVE」を正式に発売しました。LINEメッセージの読み書きや音楽の再生、赤外線リモコンによる家電操作機能などがあり、順次、機能拡充するということです。LINE MUSICの1年間利用権付きで1万4千円(税込、来年1月までのキャンペーン価格)です。

赤外線を使うなどWi−Fiが普及していない日本に合わせた工夫があります。外部の様々なサービスと連携できるように、SDKを来年初めには提供開始する予定です。こうしてLINEがハードウェア事業に参入したことは、今後のネット企業の方向性を示しています。ICT産業は昔から垂直統合と水平分散を繰返してきました。ハードとソフトの整合性とバランスを確保するには、双方を内製する必要があるからです。

もっとも、今日の垂直統合というのは、昔のように全てを自社内で完結させるというよりは、開発、設計を自社内で行ない、製造、量産はEMS企業に任せます。Appleなどが典型例です。そのEMSも全てを内製する訳ではなく、それぞれのパーツを性能と価格に応じて各方面から調達します。ですから、インタフェースを含めた設計力が勝負となります。その設計力は、机上の知識だけでは不足で、製造経験がないと駄目だそうです。その製造経験は、企業が持つというよりは、個々の技術者が持っている。日本以外では、技術者の労働移動性が高いので、人材の調達が容易ですが、それでも、彼らの技能を維持発展させるには、製造現場というプラットフォームが必要だということです。

LINEのClovaWAVEですが、筆者が自分も欲しいと思うシーンは、病などで体が思うように動かなくなった時です。眼が弱って小さなリモコンを自在に操作できないときは、便利でしょう。スマホで検索する際、Siriに頼むと手早いことがあります。でも、多くの場合は、期待した反応とは違っていたり、ご質問の意味が判りませんという回答だったりします。スピーカーに気を遣いながら頼むよりは、さっさとキーを押した方が速い。

要は音声認識技術の問題でして、発声した音波をデジタル・パターン化する技術とそれを日本語として意味解釈する技術(日本語辞書を含む)に大別できます。AIスピーカーのコア技術は、音声認識を使った音声対話技術ということになります。日本でもNTTグル−プやLINE(日本というべきか韓国というべきか。LINEジャパンでは日本人技術者が多いのでここでは日本と言いますが。)、アドバンスト・メディアなどの企業が頑張っています。それ以外の日系ベンダーが使う音声認識エンジンは、大半がアマゾン、アップル、IBM、グーグルなどのエンジンです。米系エンジンに日本語辞書などを組みわせています。海外ベンダーはこのエコシステムを構築する為にAPIや開発ツールSDKを公開しています。10月15日付日経記事では、NTTドコモが同じようなアプローチで開発ツールを無償公開する予定だと報道していました。

スマホの次のデバイスは、AIスピーカーだという説が多い。人が音だけで生活や情報活動を行なえるとは思えませんが、AIスピーカーをモニターと連動させるのは簡単ですから、遠からず、音声アシスタンスがユーザーインタフェースの中心になると考えられます。その時に、金融機関のIT戦略はどうなるのでしょう?まだ時間がありますから、結論を急ぐ必要はありませんが、酒の肴や眠れない時などの暇つぶしには、良いテーマだと思います。スマホの画面を終日追い続ける生活をしている人達は、音からの情報向けに脳の切り替えができないのではないかと危惧されます。これも付随するテーマとなるでしょう。

ただし、音よりも光の方が、耳よりも眼の方が速いことは確実なので、文章をAIスピーカーが読み上げるよりは、眼で読む方が大量情報処理に効率的であることは間違いありません。すると、AIスピーカーの次のデバイスは、AIカメラということでしょうか?となると、我々はますます、脳の筋肉を鍛えて、脳による時間当たり情報処理能力を大幅に改善しておかないといけない。または、通常の論理的思考程度であれば、AIがやってくれるから、ただ、スピーカーに命令して、カメラで視覚情報を大量に入力して、AIが整理したストーリーとイベントに従って、体を動かすだけになるのでしょうか?であれば、余り脳を鍛えなくて良い。でも、そういう人はAI以前に複合プリンターに職を奪われそうです。

さて、金融業界もAIスピーカーには強い関心を抱いています。銀行や証券会社が、AIスピーカーで取引相談に応じたり、取引指図を受けたりするシーンがイメージされているようです。忙しいオーナー社長が、経理事務員に「A社に百万振込んでおいて」と指示する代わりに、AIスピーカーに怒鳴れば済んでしまうとすれば、お客は喜ぶでしょうか?いろいろな方面から反論の声が聞こえてくるような気がします。日経新聞は連日、AIスピーカーを大きく報道しています。何故こんなにAIスピーカーが好きなのか?これでニュースを配信しようと普及を狙っているのでしょうか?

生命保険協会は、業界を上げて高齢顧客に対するサービス改善を提唱しています。特に、単居世帯や要介護世帯への支援サービスに熱心です。IoT、ウエアラブル機器、AIスピーカー、家電などを連動させれば、喜ばれそうなサービスがふんだんに思いつくでしょう。こう考えると、個人向けFinTechでは生命保険会社、法人向けFinTechでは損害保険会社が主役となる予感がしてきます。当然、オープン・イノベーションとして、銀行、証券を含めた多様なサービス会社との連携となるでしょう。初期段階では金融機関が顧客インタフェースを確保できるかもしれません。その後は、アイデア競争、サービス競争となって、誰が主導権を握るかは判りません。

                       (平成29年10月12日 島田 直貴)