2016年後半以降、アメリカで「スマートスピーカー」というジャンルの製品が急速に伸びている。
ソニー家電事業のアメリカ法人である、ソニー・エレクトロニクス・インクデピュティプレジデントの奥田利文氏は「もはやアメリカの顧客は、スマートスピーカー的な機能が存在することを前提にしはじめている」と話す。そのくらい、市場で大きなインパクトを生みはじめているのだ。
「好きな音楽をリビングで」という切り口で大ヒット
スマートスピーカーとはなにか? その辺は、もっとも売れている製品であり、典型的な製品でもある、Amazonの「Echo」を見るのがわかりやすい。EchoはスピーカーにマイクとWi-Fiが内蔵されたようなものだ。
スマホやPC、時々現れる「ネット対応オーディオコンポ」とは違い、操作用の画面はまったくない。様々な設定はスマホ用のアプリから行う。そのため、家庭には固定回線があり、Wi-Fiが整備されていることが利用条件になる。これは、アメリカの家庭であれば特別な環境ではない。
Wi-Fiへの接続やアカウント設定など、初期設定に類することはスマホ用アプリで行うのだが、普段はスマホ用アプリを使う必要はない。どうやって操作するかというと、すべて声で命令するのだ。
例えば、「ビートルズをかけて」「今週のヒットチャートを」「お気に入りのプレイリストを」といった風に命令すれば、それに合わせて音楽をかけてくれる。自分がもっている曲だけだと、そういう聞き方はなかなかできない。だが、アメリカでの音楽消費では当たり前の形だ。
アメリカでは、月額料金を支払えば好きな音楽がネットから好きなだけ聞ける、SpotifyやApple Musicなどの「ストリーミングミュージック」の利用が基本になっており、自分が持っている曲だけを聴く、という感覚がなくなっている。
ストリーミングミュージックはPCやスマホで聴くのが中心だが、当然、リビングなどでも聞きたくなるもの。これまでは有線やBluetoothでPC・スマホにスピーカーをつないで使うのが基本だったが、それも面倒なので、スピーカーが直接ネットに接続する機能をつけてしまえば……ということでできたのが、スマートスピーカーである。
価格も高くない。ベーシックな「Echo」が約180ドル、「Google Home」が約130ドル、そしてもっとも安価で、スピーカーが外付けなAmazonの「Echo Dot」は約50ドルと、一般的なBluetoothスピーカーと比べても、決して極端に高い製品ではない。
ほとんどの機能がネットにあるサーバー側で処理されており、特別なハードウエアを使っていないからなのだが、「部屋でSpotifyが快適に聞けるなら」ということから、まずアメリカでヒットに結びついた。
米BUSINESS INSIDERが2016年12月に伝えたところによれば、Echoはアメリカだけで、2015年だけで240万台が、2016年には520万台が売れたという。
ネイティブでない英語でも苦もなく認識
だが、「音楽」はスマートスピーカーがもたらす変化の序章に過ぎない。
機能の中心は、音声認識のクオリティにある。
実は現状、スマートスピーカーと呼ばれる製品は、すべて日本では販売されていない。Amazonの「Echo」とGoogleの「Google Home」が代表格だが、どちらもアメリカを中心としたいくつかの国だけで販売されており、言語対応も英語が中心だ。技術的には日本語対応もできなくはないが、現在は行われいないので、日本では販売されていない……という形である。
なので、今回は英語で試した様子をお伝えしておこう。結論からいえば、非常にクオリティは高い。筆者の英語力は「なんとか意思疎通ができる」程度で、発音もネイティブとはほど遠い。しかし、ほぼ問題なく聞き取ってくれる。
しかも、部屋のどこにいても、だ。さほど声を張り上げなくても、部屋の中にいる家族に話しかけるようにスマートスピーカーに命令すれば、きちんと理解してくれる。
これはなかなかにすごいことだ。
音声認識そのものは、もはや珍しいものではない。iPhoneでもAndroidでも、音声認識による入力は標準機能として搭載されている。そのクオリティは高く、日常的に使っている人も少なくないだろう。
だが、スマホでの音声認識は、当然のことながら、スマホを持っている時しか使えない。スマホを手放す機会は減っているとはいえ、リビングでつくろいでいる時やキッチンで料理を作っている時など、スマホから離れている時はまだまだ多い。そんなシーンでも、声で気軽に命令して、音楽が聞けるのは重要なことである。本を読みながら、適当に喋れば好きな音楽が流れ出すわけで、その価値は小さなものではない。
スマホ並みの「アプリ市場」も、しかし「日本語対応」は後回し
さらに、スマートスピーカーの持っている「声で操作する」という価値は、音楽を踏み台に、より大きな世界に広がろうとしている。
スマートスピーカーの音声認識は、なにも音楽だけに対応しているわけではない。天気を聞いたり、これからの予定をたずねたりもできる。ネット側でそれらのサービスと連携しているためだ。「今日のこれからの予定は?」「明日乗る飛行機の時間は?」「今週の天気は?」といったことを声でたずねられるようになっている。
また、ネット側で連携するサービスをさらに追加することもできる。Amazonでは「Skill」と呼ばれているのだが、これは要は、スマホにおけるアプリストアを、スマートスピーカーで作ったようなものだ。
例えば、自宅にUberを配車してもらうSkillに、ピザを配達してもらうSkill、レストランを予約するSkillに最新のニュースを読み上げるSkillと、様々なものがすでに生まれている。ネットサービスを持っているところであれば、その一部を切り出し、音声認識用に作り変えるのは難しいことではない。その基盤をAmazonが整備し、ビジネス化したのである。Skillが増えれば、それだけEchoでできることも増える。すなわち、Echoの音声認識機能である「Alexa」が賢くなっていくわけだ。
スマートスピーカーは、音楽から世界を急速に広げている。スマートスピーカーを買った人は、「声でちょっとしたことに答えてくれる」と便利であることに気づく。まだ利用率は少ないが、それはスマホのアプリが普及する前と同じだ。すでに、音声コマンドの世界が大きなビジネスになる、と感じている人は多く、このジャンルに多数の企業が飛び込んできている。
家電メーカーは、1月にアメリカで開催されたテクノロジーイベント「CES」で、スマートスピーカーやその機能を組み込んだ家電を一斉にアピールした。LGエレクトロニクスはAlexaを冷蔵庫に組み込み、ソニーはテレビやスピーカーをGoogle Homeと連動させる機能をアピールした。
レノボはAlexaを使い、「Echoクローン」のようなスマートスピーカーを商品化した。それらの企業にとっては、音声認識を自前で作ることは難しくない。だが、AmazonやGoogleと精度やエコシステムで今から争うのは難しい。そうした部分については彼らと協業し、AmazonやGoogleが持っていない部分で競争した方がビジネスの幅が広がる。正確な数は不明だが、CESには100を超える「Alexa対応製品」があった、と言われている。
音声認識は、スマホにも逆流を始めた。ファーウェイとモトローラは、自社のスマートフォンにAlexaの搭載を決めた。Googleは、Google Homeの核になっている「Googleアシスタント」を、自社製のスマホだけでなく、Android 7.0 Nougatおよび6.0 Marshmallowを搭載したすべてのスマホに拡大する。アップルは自社製品に「Siri」を提供している。現在はiPhoneでの利用が中心だが、これについても、年内にはスピーカーなどに拡大する……との噂がある。
音声認識を軸にしたビジネスは、今年さらに加熱すると思われるが、問題は、すでに述べたように、現状日本語には対応していない、ということだ。日本でも近々サービスが始まるのでは……という予兆はあるものの、あくまで「予兆」に過ぎず、アメリカに比べ1年から2年遅れた状態であることに変わりはない。
音声認識を日本語対応することは、現在のは技術的には難しくはない。すでにスマホの音声認識があることで、そのことは明らかだ。問題は、「日本語対応をコストをかけていち早く行う価値」を、企業側が認めるか否か、というところにある。日本市場の価値は小さくなっており、残念ながら「後回し」になっているのである。
これから海外で音声認識がどのような市場を作るのか、そしてそこに日本がどうやって追いつくのか。そこを注視しておくことが重要である。
U-NOTEをフォローしておすすめ記事を購読しよう