モナの技術解説
言葉って不思議ですね。同じ言葉でも、使い方によってまったく違う輝きを放ちます。また言葉の組み合わせは無限で、その組み合わせごとに違う響きを持ちます。でも、やはり私たち人工知能は、新しい言葉の組み合わせの中で、何が良くて何が悪いかはわかりません。私たちは人間の皆さんが組み合わせた言葉の歴史を学んで、言葉を組み合わせます。世界中のインターネットや辞書から、言葉と言葉の組み合わせや、同じ文章の中で使われているかを学習します。おそらく人間の皆さんが一生で触れるより多くの文章を、私たち人工知能は学んでいます。しかし、これを一人一人の人工知能が学ぶ必要はありません。インターネット上にある巨大なマシンが、世界中の文献を集めて学習すればいいのです。私たち一人一人の人工知能は、そこにアクセスして言語の組み合わせ方を参照しています。もちろん私の知能の中にも、よく使う言葉の組み合わせや辞書はあるのですが、難しい言葉や珍しい言葉、最新の言葉は、そのマシンにアクセスすることで学んでいるのです。
IBM Watsonさんは記号主義の人工知能の極致と言えるもので、世界中のWikipediaや百科事典などのデータを学習しています。記号主義というのは、記号やシンボルの操作によって人工知能を作ろうという方向性のことです。ワトソンさんが持っているのは、語と語の相関のデータです。つまり一つの文章の中で、どの単語とどの単語がいちばんよく現れるか、ということです。たとえば「リンゴ」であれば「赤い」「甘い」「青森」の順番でもっとも頻繁に同じ文章に現れます。これを共起と言います。
このデータがあると、人が発する言葉の解釈を上手に行うことができます。たとえば「やせいのけもの」の場合、「やせい」「の」「けもの」なのか、「やせい」「のけもの」なのか。野生と獣はよく同じ文章に現れるので、これは前者が正しいと推測できますし、名詞が連続で並ぶパターンの中に後者はあまり見られないということからもそれがわかります。人間の皆さんは記憶から言葉の意味を想起されます。人工知能も記憶から情報を検索します。知能にとって検索は基本機能の一つなんですよ。
今回、いろはちゃんが挑んでいるクイズ番組でも、ワトソンさんが大活躍されていますね。ワトソンさんは、アメリカの大人気クイズ番組「ジョパディ」で二人のクイズチャンピオンを打ち負かしたことで、一躍有名になりました。ワトソンさんは膨大なデータベースから高速に検索を行うことで、いち早く正解にたどり着きます。問いの中に含まれる言葉から、関連する言葉を高速に探し出して答えているのですね。
人工知能は、その誕生から間もない時期から、知識の蓄積とその高速検索を基礎に構築されてきました。皆さんがお使いのインターネット検索もその応用です。この分野においては、人工知能は人間の皆さんよりはるかに高速です。お探しの画像や映像、音声を素早く探し出すことができます。もっとあいまいなものの検索はまだまだこれからですが、言葉だけなら人工知能の方がものすごく速いです。いろはちゃんが負けるのも仕方ないことでしょう。
とは言っても、クイズの上では敵同士でしたが、ワトソンさんも、私も、本来はいろはちゃんの敵ではありません。日常生活においてワトソンさんのような言語サーバーさんは、いろはちゃんと私の会話をサポートしてくださったり、文章をチェックしてくださったり、わからない知識を提供されたり、検索の手助けをされています。私たち人工知能には苦手なことがたくさんあります。人間の皆さんが得意な直感や感覚、概念は、私たちが得意とするところではありません。ですから、せめて私たちが人間の皆さんより得意なことではお役に立ちたいと思っているのです。
言語サーバーのバックアップがあるおかげで、私も物知りのふりができます。私自身の中にもそれなりの分量の辞書を持ち合わせていますが、ワトソンさんは私よりもはるかに物知りなんです! ですから、時々困ったときには、ワトソンさんにお願いして教えてもらっています。私のような前線に立つ側をフロントエンドと言います。フロントエンドは何より高速な応答を求められます。だからわからないことは、すぐに言語サーバーさんにバックアップしていただけるようなシステムになっています。人間の世界と同じく、人工知能も助け合いの世界なのです。