AIスピーカー、映像付きで進化 (Google I/O)

日経新聞の平成30年5月10日付記事です。Googleが開発者向け年次会議「Google I/O」で発表した会話AIのGoogle Duplexのデモを紹介しています。聴衆に受けたのが、AIが利用者の替わりに美容院に予約するデモだったそうです。利用者の指示を受けたAIが美容院に電話をし、店員とやり取りします。その時に、希望する時間で取れないのですが、店が提示する別の時間でも許容範囲と判断して予約を取ります。自然な自動会話だったそうです。あくまでもデモシナリオの範囲なのですが、それでも開発者達が驚く対応ぶりだったようです。

別のデモは、レストランの予約です。4人で予約したいのですが、店からは5人以上でないと予約は受けられない。直接、店に来るようにと言われます。するとAIは、普段ならどれくらい待ちますか?と聞く。いつですかと聞かれて、来週水曜の7日と返す。店員が、それなら混んでないから大丈夫と答えます。AIはそれで充分だと判断してありがとうと言って電話を切る。文脈まで理解して対応している。発音は合成ですが、かなり自然で相槌まで打つとのこと。

デモだからということもできますが、自然言語処理AIと音声認識・アシスタンス技術がここまで進んだということが理解できます。深層学習による学習速度を考えると、毎日のように大きな進歩がある筈です。特に、この種の会話と判断であれば、学習データや教師データの入手に苦労しません。英語のようなシンプル構造の言語だから可能だが、複雑な日本語なら難しいと思う人もいるでしょう。しかし、複雑な言い方をするのは人間です。相手がAIだと判れば、人間がシンプルな表現を使えば済みます。または、AIとAIで会話させれば良い。

音声だけでは会話内容の黙視確認ができないとか映像イメージなどが伝わらないという問題もありますが、これは、スマートディスプレーと呼ばれる音声アシスタンス付きタブレットが既にAmazonによって一年近く前に発売済みです。また、AIに予約指示を出して、予約させるくらいなら、自分で店のAIとコンタクトした方が、手っとり速いとも言えそうです。その時は、そうすれば良い。最近、ビジネスチャットで顧客とコミュニケーションする方法がブームとなっています。ここでもAIの対話エンジンが活躍しています。この折衝履歴は、音声による自動会話にも良い学習データとなります。テキストを音声に変えれば良いだけです。

音声認識の話をすると必ず方言の問題が出てきます。しかし、方言は音波と単語との変換テーブルで簡単に対応できるそうです。この声は誰の声かと認識するのは難しいそうです。でも、事前に音声を登録しておけば、誰の声かは判ります。エッジAIで所有者の会話の癖も覚えることができるでしょう。寝たきりのおばーちゃんでも、銀行に電話して、音声で本人確認しながら「年金が入っている筈だから、千円札10枚入れて5万円を持ってきて。」と指示できるでしょう。銀行本体が届けると制度的な問題に絡みますが、いろいろと方法は考えられます。その時に、銀行側 (AIかもしれません) が2、3質問することで、その顧客が正常な認知状態であることも確認できそうです。ということはクロスセルの機会も出てくる。

こうして、銀行のような生活必需のサービス事業者に、新たな事業機会が拡がる可能性があります。他業禁止規制という制約は残りますが、本業と既存客に限定すれば可能です。銀行よりもっと生活必需の産業もあります。例えば、スーパーや病院などです。AIは大手企業でないと導入できないと思う人が多いですが、それは間違いです。スマホと同じような価格と使い方になるでしょう。AIサービスをサポートするBPOサービスも普及するでしょう。今、最大のRPA利用業種はBPO事業者です。RPAがBPO事業者の仕事を奪うのではなく、その生産性向上に使われています。つまりAIサービスBPO事業者を使う方法もある。日本ではAI技術者というと、すぐに機会学習など基礎技術のスキルやアルゴリズム開発者などを思い浮かべますが、オープンソース化された、或いは、市販のAIツールを使ったサービス開発技術者さえいれば、AIの実用化は可能です。

今年のGoogle I/Oには7千人程が参加したそうですが、日本人の姿は少なかったそうです。多めに見ても2、3%以下と聞きます。中国やインド系の人が目立ったそうです。日本は、AIを重要技術だと騒ぐ割には、取組みが消極的に見えます。海外Webサイトを見れば、おおよその内容は判ると思うでしょうが、実際にその会場にいて空気を吸い、歓声を聞き、近くの人と感想を交換しあうこととは、余りに大きな差があります。どうも日本人は体を動かすのが面倒な人種になってしまったように感じます。このことは、日本語や表意文字である漢字というデジタル社会におけるハンディキャップ以上に深刻な問題なのかも知れません。

その面倒くさがり屋の日本人の中でも、官僚や金融マンは代表的な職業のようです。「世の中は急速に変わっている。自分達も変わらなくてはならない。でも、余計なことはしない、今のままでもしばらくは何とかなる。今までもズーッとそうだった。」という共通意識が見えます。こうした文化を変えないとデジタル化、グローバル化の中で消滅するという人も多い。でもその警告が効果を出したケースを見たことがない。官僚も金融マンも今の革袋の中で変わる努力をするより、別の革袋に自分が移った方が、遥かに少ない努力で自己実現できる可能性の高いことを知っている。下手に行員を脅かすとひどい反発を受けます。RPAで業務量を減らすと発表したメガバンクから人材が大量に流出しつつあります。銀行IT部門は、RPAで人減らしだとか、企業文化を変えるなどと言うから、大半の行員を敵に回してしまった。米銀のマネをしすぎですが、もう手遅れです。

AIでネットワーク効果を狙う戦略もありますが、筆者は差別化手段としてサービスへの適用を優先すべきだと思っています。世界共通のサービスというのは限られる。新サービスの多くはローカルで生まれます。地域を限るという意味もありますが、何よりも現場という意味でのローカルです。AIで何ができそうかということさえ知っていれば、新サービスの開発が可能となる。こう言うと、成長が止まり、収益力も落ちる一方なのでAI投資の資金調達ができないと返ってきます。国全体では眠っている資金が2千兆円以上もあります。そのごく一部で充分です。金を廻すのが金融の仕事です。その人達に金がないと言って欲しくない。廻っていないだけです。金融機関はAIサービス開発の為のインキュベーションを事業戦略の柱の一つにすべきだと考えています。自社用だけでなく、顧客用のAIサービス開発です。IT戦略には、スキル調達と資金調達が絶対必要条件です。金融業界は、国内IT産業についていくだけでは、確実に共倒れします。 

                    (平成30年5月15日 島田 直貴)