東大合格ロボットは、頭が良いと言えるのか?

東京大学合格を目指して能力アップをしているロボットのプロジェクトがある。
「東ロボ君のプロジェクトにおいては、ロボットが想像し、理解したうえで考えるプロセスが重要」と、京大教授の斉藤康己氏は述べている。ベスト新書『アルファ碁はなぜ人間に勝てたのか』より抜粋する。 

 自然言語理解の分野は、AIの中でも一番難しい分野とされ、機械翻訳などは長年の夢でした。しかし、最近グーグルやフェイスブックなどがインターネット上で提供するソーシャルネットワークサービス(SNS)では、言語を適切に処理して答えを返してくれるたぐいのサービスが増えてきています。

 
 

 

 それらにはニューラルネットや深層学習など、最近の新しい手法がうまく使われています。この方向で言語理解も新しいレベルへと進化するのでしょうか?
 一つの例として、NII(国立情報学研究所)で研究が進んでいる東ロボ君のことを考えてみましょう。
 このプロジェクトは「ロボットは東大に入れるか?」という挑発的なテーマのもと、大学入試センター試験などの試験問題(当然自然言語や図を使って書かれています)を、AIが問題を理解して解くことができるかという課題に挑戦しているプロジェクトです。新井紀子率いる100人以上の研究者が、寄ってたかって計算機に予備校の模試やセンター試験の試験問題をなんとか解かせようと努力しているのですから、不思議なプロジェクトといえば不思議なプロジェクトです。
 第5世代プロジェクトの時の失敗(客観的に評価可能な評価軸を設定せずに、あやふやな成果で終わってしまった)を繰り返さないために、人工知能のベンチマークとしての役割を果たそうという趣旨はよくわかります。また、入試にはたくさんの科目があるので、それぞれに別々のアプローチで試験への対策を進めることで、幅広いAI技術の分野でのブレークスルーも得られるかもしれません。

 しかし、世の中に現れる記事や新井紀子のインタビューなどを読む限り、新しいAIの手法を使って「文章理解」というAI長年の難問に正面から取り組んでいるようには見えないのが残念です。どちらかというと、「真の理解」という難題は横へ置いておいて、姑息(失礼!)な手段でまずは成果を出そうとしているように見えるからです。姑息と言っているのは、例えば国語の問題で、問題文のある部分と同じ趣旨の要約文を選択肢の中から選べというような問題に答えるのに、文中のキーワードの出現分布とか頻度とかを使う
とそれだけである程度正解が導けるというような手法のことです。

 これでは、予備校でいわゆる「受験テクニック」と称して、時間がなくて急ぎ答えを出したいときにはこうせよと教えているような方法となんら変わらず、「真の理解」は棚上げしちゃっているように思えるからです。


 昔、パット・ヘイズ(Pat Hayes)というAI研究者(私がエセックス大学に留学していた時の指導教官だったのですが)が、人間の一般的な物理法則の理解のメカニズムを定式化しようという試みとして「Naive Physics Manifesto」という論文を書きました。これは、構想を述べた論文で、具体的な物理現象の理解のメカニズムが解明されているわけではないのですが、彼が構想したような理解のメカニズムを使って、物理の問題を解くというような野心的な研究を是非進めてほしいなーと希望する次第です。


 私とて、斬新なアイデアがあるわけでもなく、言語処理や言語理解に関しては昔機械翻訳を研究するチームに属していたことがあるという程度なので、偉そうなことは何も言えませんが、ニューラルネットを利用した言語処理、言語理解の試みを入試問題を理解して実際に解くという、「総合的な」知的営みにまで積み上げる努力を本気ですることが必要なのではないかと感じています。
 東ロボ君は、たくさんの研究者の努力でじわじわと偏差値を上げてきていて、東大に入れる偏差値70とかいう目標も不可能ではないかもしれません。ですが、それよりも人間と同じように物理の問題を読んだら、図も見て、実際の物理現象を想像し、理解し、そこから方程式を立てるというように「真の理解」に基づいて問題を解くという研究をしてほしいと思うのです


 その研究に深層学習など新しいニューラルネットの研究が役に立つかどうかは未知数ですが、少なくともシンボライザ的な処理機構を組み込んで、それと言語理解を結びつけるというような研究は興味深いし、トライすべきだと思われるのです。

ベスト新書『アルファ碁はなぜ人間に勝てたのか』より抜粋