マイクロソフトは4月7日より、同社の自動翻訳機能の日本語対応を大幅に強化する。
新たな翻訳エンジンの導入によって翻訳精度の大幅向上を図りつつ、日本語音声をそのまま他の国の音声へ変換する、まるで「ほんやくコンニャク」のような「Microsoft Translator ライブ機能」、すなわちリアルタイムでの翻訳機能も搭載した。個人の利用はなんと無料だ。外国語に自信がない人には大きな武器になるだろう。
その詳細と、マイクロソフトの戦略について分析する。キーワードは「AIジャイアント」だ。
日本語をしゃべれば英語や中国語に! スマホが無料翻訳機になる
出典:www.youtube.com マイクロソフトは以前より、翻訳サービス「Microsoft Translator」を展開してきた。同社のウェブ翻訳サービス「Bing翻訳」が一番有名だろうが、実際には、様々なアプリケーションやサービスの中で透過的に使えるものとして使われている。
他社へも提供されており、ウェブサービス内での翻訳機能として使われている場合も多い。わかりやすいところでは、Twitterの翻訳機能が、マイクロソフトの技術を使ったものである。
今回、その機能と精度が大幅に強化された。
一番わかりやすいのは、Skypeへの「音声翻訳」機能の実装だ。外国語を話す人、例えばアメリカ人とSkypeでビデオ通話をするとしよう。これまでは当然、こちらも英語で話すか、先方に日本語で話すかしないと、会話は成立しなかった。
だが今回、「Skype翻訳」機能の搭載により、その状況が変わった。こちらが日本語で話すと、サービスの側でそれが英語に翻訳され、相手に伝わるのだ。相手からは、英語が日本語に翻訳されて聞こえる。画面には、それぞれがどう言ったのかが、文章でも表示される。
Skype翻訳の動作イメージ。しゃべればそれがそのまま翻訳されて相手に伝わる。 Skype翻訳は、2014年12月から英語を中心とした一部言語でスタートしていた。だが、これまでは日本語には対応しておらず、そのせいもあって、日本ではあまり注目されることがなかった。だが、今回日本語を含めた10ヶ国語の間でリアルタイム翻訳が可能になり、日本人にとっての価値が大きく上がった。
すでに述べたように、マイクロソフトはいくつもの翻訳サービスやアプリをすでに提供してきた。今回、音声からのリアルタイム翻訳を含め、各種機能において、日本語での翻訳精度・機能が大幅に強化されている。
それらがどのように働くのか? 言葉で伝えるよりも、同社が公開しているムービーをみていただくのが一番だろう。
もちろん、マイクロソフトの翻訳機能はまだ完璧ではない。意味の通じない文章になってしまうこともあるし、文意のとり違えもある。翻訳者のように「しっかりした日本語」の文章が得られるわけではない。
しかし、である。これでも、スマホを開き、アプリを介して会話すれば、言葉の壁はぐっと低いものになる。しかも、マイクロソフトのこれらのツールは、個人が使う場合、無料で使える。
手軽に「他国語を使う能力」を人々が得られると考えると、その価値は圧倒的だ。対応する言語は、音声から音声で10ヶ国語だが、テキスト翻訳ならば60以上。ほぼ世界中の言語が使えるようになった、と思って差し支えない。
日本人が英語を話すこと以上に、外国人が日本語を使うことを考えて欲しい。2020年に向けて、彼らがスマホさえあれば、日本語を知らなくても日本を旅行できるようになる、と思えば、その価値がおわかりいただけるはずだ。日本人が、日本語はもちろん、英語も通じない土地へ行くときにも役立つはずだ。
また企業目線で言えば、日々大量の文書が生まれ、それを世界中とやりとりする必要がある場合、翻訳者に頼っていてはスピードとコストの面で問題が出る。だから「英語公用語化」のような議論が出てくるのだが、そうすると、英語が通じない土地でのビジネス効率が落ちる。
正確さに欠けても、とにかく大量の翻訳を自動的に行い、問題があるところから直す、というやり方が必要になる。その時に、マイクロソフトの持つシステムが必要になる。実はこちらは有料。マイクロソフトはここから収益を得る。
急速に進化する「AI」の能力、ついていけるのは「クラウドジャイアント」だけ
出典:www.youtube.com では、なぜマイクロソフトは、この時期に「日本語翻訳の強化」を発表したのだろうか?
理由は、日本語翻訳の品質が急速にあがる目処がついたからである。
マイクロソフトは今回の変更に合わせ、翻訳に使う技術を「ニューロコンピューティングベースの機械学習」に変えた。近年、画像認識や音声認識に使われ、クオリティアップにつかわれている、いわゆる「AI技術」のひとつだ。
これまでマイクロソフトは、翻訳に「統計的機械翻訳」という手法を使ってきた。これは、どう翻訳すべきかを言葉単位で解析していく技術といえる。
辞書をひいて文章の意味をあわせていくものに近い。それに対してニューラルネットワークを使った機械学習は、文章全体を見て「文脈」を訳すようなイメージに近い。だから、文章全体で見た時のクオリティはより良いものになりやすい。
しかも、統計的機械翻訳が「進歩の踊り場」状態にさしかかっているのに対し、ニューラルネットワークベースの技術は、まだ研究の初期段階。これから急速に進化する可能性がきわめて高い。現時点での差が小さくとも、ほんの数年の間に劇的な改善が見込めるのだ。
音声から音声への翻訳では、「音声をテキストに変える時」と「言葉を翻訳する時」と2回、AIの出番がある。現在はどちらもニューラルネットワークベースのAIが働くようになっており、双方でここから急速な進歩の可能性がある。
マイクロソフトの翻訳技術の仕組み。AI技術を様々な形で活用している。 重要なのは、「どうやって進化させるか」だ。ニューラルネットワークベースのAIを進化させるには、とにかく大量の「データ」が必要だ。
サービスを大量の製品に組み込んで使った上で、そこから得られた結果を使って随時学習を続けていくことが必要。データが供給され続けないと、AIは絶対に良くならない。工場を動かすための燃料がデータにあたる、と考えればいいだろう。個人に無料で使ってもらうのは、学習に必要な大量の用例・文例を得るためでもある。
そのように、世界中からデータを集めて技術開発をするには、「世界的なプラットフォーム企業」である必要がある。そこにはGoogleがいて、Amazonがいて、IBMがいて、アップルがいる。
マイクロソフトもそんな少数の「クラウドジャイアント」のひとつである。彼らが「AIジャイアント」になるには、データ収集と技術開発の両輪を、とにかく早く回す必要がある。
マイクロソフトが翻訳にここまで力を入れるのは、「クラウドジャイアント」「AIジャイアント」の地位を確保し続けるための戦略でもあるのだ。
U-NOTEをフォローしておすすめ記事を購読しよう