人工知能「東ロボくん」が、東大をあきらめる日

2016年11月9日の朝日新聞の見出しに、「AIに東大合格は『不可能』」と掲載された。なぜ、東大合格ロボットの、合格は絶望的なのか。ベスト新書『アルファ碁はなぜ人間に勝てたのか』(斉藤康己著)より紹介する。

◆中学生の2割の言葉理解は、悪い意味でAIとかわらない

11月9日の朝日新聞の15面で、新井紀子氏は以下のように述べている。

――「東ロボくん」は、高校3年生の上位2割程度の実力です。でも、東大合格 は無理。今後も不可能でしょう。5年育て、AIにできることと、出来ないことがあるのがわかりました。(中略)

人間は会話中に、省略されている言葉を補って理解しますが、AIは一文ごとの対訳データから選ぶだけで、省略を埋められないのです。東ロボくんに限らず、どのAIも基本的に言葉のパターンを見て、統計的に妥当そうな答えを返しているにすぎません。言葉の意味を理解しているわけではないのです。――

にもかかわらず、「東ロボくん」の相対的な成績が良い理由は、中学生の約2割は主語と目的語が何かという基礎的読解ができておらず、内容を読み取れずに機械的にキーワードを覚えているからではないか、と新井氏は推測する。

ベスト新書『アルファ碁はなぜ人間に勝てたのか』で、京都大学の斉藤康己教授は以下のように述べている。

東大合格ロボットは、頭が良いと言えるのか? 

 自然言語理解の分野は、AIの中でも一番難しい分野とされ、機械翻訳などは長年の夢でした。しかし、最近グーグルやフェイスブックなどがインターネット上で提供するソーシャルネットワークサービス(SNS)では、言語を適切に処理して答えを返してくれるたぐいのサービスが増えてきています。

 それらにはニューラルネットや深層学習など、最近の新しい手法がうまく使われています。この方向で言語理解も新しいレベルへと進化するのでしょうか?
 一つの例として、NII(国立情報学研究所)で研究が進んでいる東ロボくんのことを考えてみましょう。
 このプロジェクトは「ロボットは東大に入れるか?」という挑発的なテーマのもと、大学入試センター試験などの試験問題(当然自然言語や図を使って書かれています)を、AIが問題を理解して解くことができるかという課題に挑戦しているプロジェクトです。新井紀子率いる100人以上の研究者が、寄ってたかって計算機に予備校の模試やセンター試験の試験問題をなんとか解かせようと努力しているのですから、不思議なプロジェクトといえば不思議なプロジェクトです。
 第5世代プロジェクトの時の失敗(客観的に評価可能な評価軸を設定せずに、あやふやな成果で終わってしまった)を繰り返さないために、人工知能のベンチマークとしての役割を果たそうという趣旨はよくわかります。また、入試にはたくさんの科目があるので、それぞれに別々のアプローチで試験への対策を進めることで、幅広いAI技術の分野でのブレークスルーも得られるかもしれません。

 しかし、世の中に現れる記事を読む限り、新しいAIの手法を使って「文章理解」というAI長年の難問に正面から取り組んでいるようには見えないのが残念です。どちらかというと、「真の理解」という難題は横へ置いておいて、姑息(失礼!)な手段でまずは成果を出そうとしているように見えるからです。姑息と言っているのは、例えば国語の問題で、問題文のある部分と同じ趣旨の要約文を選択肢の中から選べというような問題に答えるのに、文中のキーワードの出現分布とか頻度とかを使う
とそれだけである程度正解が導けるというような手法のことです。

 これでは、予備校でいわゆる「受験テクニック」と称して、時間がなくて急ぎ答えを出したいときにはこうせよと教えているような方法となんら変わらず、「真の理解」は棚上げしちゃっているように思えるからです。

次のページ ◆「真の理解」に基づく研究を