AI 「読解力」がなかなか向上しません
人工知能「東ロボくん」 東大を断念
11月8日 18時09分
東京大学合格を目指し、毎年、センター試験の模試を受けてきた人工知能の「東ロボくん」が、東大合格を諦め、進路変更することを開発チームの国立情報学研究所のグループが明らかにしました。
東大合格を目指す「東ロボくん」は、国立情報学研究所の新井紀子教授らを中心に大手の情報通信企業などが参加して開発してきた人工知能です。ことし有名私立大学に合格し、2022年春までに東京大学に合格するのが目標で、去年のセンター試験の模試では470余りの大学で「合格率80%以上」を示すA判定を獲得しました。
これまで順調に成績を伸ばしてきた東ロボくんですが、教科書などの情報と検索技術によって正解にたどりつく世界史などは得意な一方、文章の意味を理解して、問題文を読み解く「読解力」がなかなか向上しませんでした。このため国語や英語などの科目では、今後の成績向上に限界があり東大合格の水準にあたる偏差値70以上にまで成績を上げることは現在の技術では難しいと判断したということで、ことしで東大合格は諦め、“進路変更”を決めました。
チームでは、「東ロボくん」よりもセンター試験模試の偏差値が低い受験生がいる背景には、読解力の問題がある可能性があると見ていて今後は、東ロボくんの研究成果を中高生の「読解力」を養う教育分野の研究などに生かしていくとしています。
新井教授は「有名私立大学に合格できる自信は出来た。東ロボくんはこのあたりで“浪人”を終わりにして合格した大学に入学するのがよいのではないかと思う。今後、人工知能の社会への導入は必至で、人間が人工知能に勝るのは読解力だ。人工知能に負けない子どもたちを育てる教育を提案する研究に力を入れていきたい」と話していました。
合格を阻む壁は
東ロボくんの東大合格を阻んだのは、人間のように問題文の意味を理解する難しさです。東ロボくんは、蓄積した知識や論理を扱う問題が多い「世界史」や「数学」といった科目は得意です。
一方、人間では当たり前の常識や問題文に書かれていないことを推測し、人間のように意味を理解することができません。例えば、センター試験模試の英語の問題で2人の会話のやり取りを読み、空欄部分について与えられた単語を並べ替えて会話を成立させる問題です。
「こんなに暑いのに歩いたの!」という問いかけに対し、「はい。とてものどが乾いた。だから」に続く文章を6つの単語で作ります。この時、東ロボくんは6つの単語の並び替えをインターネット上の文章で検索し、候補として、「冷たいものが飲みたい」、「寒いので何か飲みたい」という2つの文章を作りました。
通常、人間であれば「暑いのだから冷たいものが飲みたいだろう」と状況を理解し、当然、「冷たいものが飲みたい」と解答します。しかし、暑いとは何か、暑いと何が飲みたいのか、という知識は教科書に記載されていません。
このため東ロボくんは、「寒いので何か飲みたい」といった間違った解答を選んでしまうのです。
自然言語処理の現状は
問題文の意味を理解して解答することが苦手な東ロボくん。一方、私たちの身の回りにある人工知能の中には、一見、言葉を理解しているかのようにふるまうものもあります。いずれも自然言語処理という技術が使われていますが、人間と同じレベルで言葉の意味を理解しているわけではありません。
例えば、マイクロソフトが運営する「りんな」という人工知能がLINEを使って会話に応じるサービスでは、検索エンジンの技術を応用し、インターネット上の膨大な情報の中からユーザーどうしのやり取りが長く続いた言葉などを統計的に選んだうえで文章を作り出していて、人間のように会話の意味を理解して答えているわけではありません。
また、医師でも診断がつけられなかった難しい白血病を見抜き、注目を集めたIBMのワトソンも、蓄積した論文などの情報からデータベースを作り、患者の遺伝子の情報と照らし合わせることで病気の原因の候補などを抽出しています。そして、あらかじめ医師の下で学習した結果などをもとに候補の優先度を計算しているのです。
言語処理学会の会長で東京工業大学の徳永健伸教授は「現在の人工知能は、外見上では言葉を理解して会話しているように見えるが、必ずしも人間のような理解をしているわけではなく、内部では統計的な処理を行い、確率の高そうな答えを導いている」と話しています。
そのうえで、東ロボくんの東大受験から見える人間と人工知能の違いについて「入試問題を解くには文中に書かれていない情報も利用する必要があるが、人間は問題文に書かれたことだけでなく、常識のような知識も利用して問題を解いている。今後、人間が意味を理解するレベルに人工知能を近づけるには、人間の常識をはじめとした教科書に書かれていない知識をどのように習得し、習得した知識を目の前の問題とどのように関連づけられるかという技術が必要だ。
そういう意味では、今すぐに人間と全く同じようにすべての問題に適切に解答する人工知能を作るのは難しい。ただ、ディープラーニングの技術が開発されて大きなブレークスルーが起きたように、多くの研究者がこの壁を突破しようとしており、人と同じように言葉を理解する人工知能の誕生は、着実に近づいていると思う」と話しています。