« クイズ王と対戦したIBM ワトソン(Watson)のすごいところ | トップページ | 国際会議WWW2010論文感想その8 (SNS,プライバシー,機械学習,UI) »

クイズ王と対戦したIBM ワトソン(Watson) 技術的詳細

情報処理学会誌 Vol.52, No.7
Watson:クイズ番組に挑戦する質問応答システム(金山 博 氏・武田浩一 氏)
http://www.bookpark.ne.jp/cm/ipsj/mokuji.asp?category1=Magazine&vol=52&no=7
に,
アメリカのクイズ番組「Jeopardy!(ジョパディ!)」で,二人のクイズ王と対戦し,勝利を収めた
IBMの質問応答システムWatsonの技術的詳細が載っていました.これを読んでのメモと感想です.

・番組中では,問題は最初に全文が一度に表示される.(司会者の読み上げは,視聴者向けのもので,Watsonを含む回答者はテキストで与えられる)
 一見,公平に思えたが,Watsonは与えられた瞬間から構文解析し,解の探索の処理を開始できるが,人間は文字を知覚するのに時間がかかる(詳しくは,S.K. Cardらの人間の情報処理モデル参照).まぁ,これを含んでの戦いということになるんでしょうけど.

・Watsonは,回答する際には,物理的にボタンを押す.
 ここは,公平ですね.

・質問は,ファクトイド(factoid)型の質問.
 ファクトイド型と言っても難しい.まずは,ここから始めるのは納得.

・処理手順
「質問の解析」→「解候補の生成」→「解答の根拠探し」→「確信度の計算」
これらをどう組み合わせるかが,システムの完成度に影響しそう.

・「質問の解析」
構文解析の上,照応解析も行っているとのこと.

・「解候補の生成」
質問に含まれる語との共起語などを,解候補にしているよう.一般には,Aprioriアルゴリズムが使われるが,組み合わせ数が多くなると,組み合わせ爆発を起こしてしまう.どの程度の組み合わせまで見て,解候補を選んでいるのか興味のあるところ.また,単に共起だけを見ているのか,係り受けまで見て,重みを設定したりしているのかも興味のあるところ.

・「根拠探し」
解候補の語句を問題文の該当箇所に埋め込んだものと同じ内容が,情報源のどこかに書かれているかを探すとのこと.ベクトル空間モデル?合致のさせ方を「観点」と呼んでおり,この観点を複数用意している.ここが研究開発の核であったとのこと.後の例では,「型が同じである(県とか市とか)」や,「条件の一部が一致(最も西にある)」などが観点として紹介されていたが,ややドメイン依存である上,正確な構文解析も必要そうで,ちょっと疑問.ここで,Power7アーキテクチャの2,880コアを用いた並列処理を行ったとのこと.

・「確信度の計算」
「観点」に重みを付け,確信度を求める.重みは,機械学習(ロジスティック回帰)で行ったとのこと.回答ボタンは,最大の確信度を持った解候補が,閾値を越えたときとなるとのこと.

・情報源
ニュース記事,百科事典,シェイクスピアの戯曲,聖書,歌の歌詞など
シェイクスピアの戯曲,聖書ってところが,いかにも欧米人らしい.
最終的には70GBとのこと.メモリに載せられる量と書いてあるところが,うらやましい.
うちも大量にメモリの乗ったマシンを保有しているが,64GB超というのはさすがに...

・前処理
事前に構文解析し関係抽出を行っておく.さすがに,リアルタイムで生のテキストを解析するようなことは行ってないらしい.私の研究も,この処理(情報抽出)を行っており,それゆえワトソンには非常に関心がある.

・人間らしさとコンピュータらしさ
記事の後半には,ワトソンが失敗した例が多く載っている.なるほどと思うことばかりであったが,最後の一文に共感するとともに,鉄腕アトムの実現は諦めなければならないのか?という残念感も感じた.
「見方を変えれば,人間とコンピュータは互いに補完的であるといえる.」

はたして,本当にそうなのだろうか?果てなき挑戦に期待したい.

(参考文献)
・金山 博,武田浩一:Watson:クイズ番組に挑戦する質問応答システム,情報処理,Vol.52, No.7, pp.840-849, 2011.
・S.K. Card: The Psychology of Human Computer Interaction, Lawrence Erlbaum Associates, 1983

|

« クイズ王と対戦したIBM ワトソン(Watson)のすごいところ | トップページ | 国際会議WWW2010論文感想その8 (SNS,プライバシー,機械学習,UI) »

Web研究」カテゴリの記事