« 2011年11月 | トップページ | 2012年3月 »

2011年12月

国際会議WWW2010論文感想 その10(検索エンジン・Nグラム)

Jian Huang, Jianfeng Gao, Jiangbo Miao, Xiaolong Li, Kuansan Wang, Fritz Behr, C. Lee Giles: Exploring web scale language models for search query processing, Proc. of WWW 2010, 2010.
http://dl.acm.org/citation.cfm?id=1772737

<キーワード>
検索エンジン,言語モデル,Nグラム,アンカー,検索クエリ,本文,タイトル,スペル修正,ブラケティング,クエリ分割

<概要>
Microsoft Researchの研究.大規模なWebスケールのNグラムモデルを生成している.Bグラムモデルの生成は,文書全体に適用するだけではなく,Webページのタイトル,アンカー,本文,さらに検索クエリに分けて,構築する.データセットは検索エンジンのBingが保持するデータである.その後,いくつかのアプリケーションに対して,各データソースごとのNグラムモデルが有効に働くかどうかを調べている.

最初のアプリケーションはスペル修正である.スペル修正は,ユーザの入力する検索語に対して行っている.precision@1(rank 1のスペル提案が正しい時のパーセンテージ)を使って評価する.アンカーを使ったNグラムモデルでは,データ数が少ない時は2グラムが最も良いが,データ数が多くなるにつれて,3グラム,4グラムの方が,良くなっている.データソース間は,3グラムで比較すると,検索クエリが最もよく,ついでアンカー,タイトル,本文の順になっている.

次のアプリケーションは,クエリのブラケティングタスクである.ブラケティングとは,名詞合成物(ひとまとまりになっているのは名詞に限らないが)に対して,さらにどういう名詞のまとまりでくくるかを言う.例えば,以下の例が挙げられる.痛い歯の治療は,Left bracketingである必要がある.
Left bracketing: [sore gum] treatment
right bracketing: sore [gum treatment]
Nグラムに対して,条件付き確率(CP),相互情報量(PMI),カイ二乗検定統計(kai)のどれかを適用し,ブラケティングの予測を行う.各手法の比較を行う.その結果,本文を使ったPMIを用いた手法がもっともよかった.これは,アプリケーションによって,有効なデータソースが変わることを意味する.

最後は,長いクエリの分割タスクである.こちらは,データソース間の比較では,アンカー,タイトル,本文の順になっている.

(総評)
商用の検索エンジンが持つデータを使って,WebスケールのNグラムモデルを,データソースの種類ごとに構築し,異なるアプリケーションに対して,その特性を明らかにしたことは評価に値する.ただ,検索エンジンのデータを使ったことが評価されたところもあるので,またデータ自慢かという気もする.

|

WISS2011 参加メモ(3日目)

WISS2011(二日目午後)の参加メモです.

WISS2011(第19回インタラクティブシステムとソフトウェアに関するワークショップ)に参加してきましたので,参加メモを公開します.
http://www.wiss.org/WISS2011/

私の感想も書いておりますが,あくまで個人的な意見ですので,ご了承ください.また,発表内容の要約は私の理解した範囲内での記述ですので,ご了承ください.

3日目 デモ
B07:形状・軟らかさが可変なディスプレイ: 佐藤 俊樹,的場 やすし,高橋 宣裕,小池 英樹 (電通大)
ビーズ?を下に敷き詰め,その上から布をかぶせて,ユーザがそれを押したり集めたりすることで,3次元の形状を作り,そこに絵を書くことができるシステム.KINECTを使い三次元形状を取得している.

Pc030061

B08:WrinkleSurface?: しわを作って入力できる柔らかいマルチタッチインタフェース: 坂本 侑一郎,吉川 拓人,大江 龍人,志築 文太郎 (筑波大),福本 雅朗 (NTT ドコモ),田中 二郎 (筑波大)
登壇発表でもあったシステム.しわを作ってというのが面白い.思ったよりしわを作るのに力がいった.

Pc030064

B13:絵楽器の設計段階におけるプロトタイピング支援システムの設計と実装:竹川 佳成(神戸大),福司 謙一郎(東工大),Machover Tod(MIT Media Lab.),寺田 努,塚本 昌彦 (神戸大)
絵楽器.絵楽器なので,絵を書いてそれを楽器にするのだが,導電性のある物質(花や水など)ならなんでも楽器になるのがよく分かった.実際の者を触って音を出してみると感動する.

Pc030066

B16:学習機能をもったアイコン整理システム: 大河原 昭,坂本 大介 (東大/JST),五十嵐 健夫 (東大)
人間がいくつかのファイルからクラスタを作っておく.新しいファイルがあれば,テキスト情報のベクトル空間モデルにより,近いクラスタに割り当ててくれる.その分類が間違っていれば,ドラッグアンドドロップで違うクラスタに修正することができる.
もう一つは,デスクトップへの並べ替えを学習してくれるものもあった.これは,例示プログラミングの考え方を用いており,例えば3回縦方向にアイコンを並べたら,さらに下方向に並べるであろうとか,???1.txt,???2,.txtのようなファイルを並べていれば,同じように???[1-9].txtを続けて並べることを推薦してくれる.
学習と人間によるフィードバックをうまく組み合わせた研究と言える.

Pc030069

B18:スイッチバックカーソル:重なりあったウィンドウ間を移動可能なマウスカーソ ル操作手法: 山中 祥太 (明治大),宮下 芳明 (明治大/JST)
実際に使ってみると思ったのだが,これを違和感なく使うには,ウィンドの重なりに三次元方向への奥行きがあることを意識しておく必要がある.そのためには,Windowsの[Windows]ボタン(だったかな?)を押した時に出る三次元のウィンドウ表現のような奥行き方向の可視化が必要であると思った.

Pc030070

B19:人物の共起性を配置に反映した大量個人写真ブラウザ: 安田 理紗,五味 愛,伊藤 貴之 (お茶大)
Google Picassaによる顔認識を応用した,写真のクラスタリングとブラウジングシステム.同じ顔による探索などができる.

Pc030074

B21:TubTouch?: 湯水の影響や自由形状への適用を考慮した浴槽タッチUI環境: 榊原 吉伸,平井 重行 (京産大)
浴槽に液晶プロジェクタでタッチボタンを投影.浴槽の光の拡散により,アンビエントなボタンが表示されるのが面白い.タッチしたことは,浴槽の裏につけたセンサーで感知している.

Pc030076

B24:片手用キーボードを用いた高速な文字入力手法: 片山 拓也,村尾 和哉 (神戸大),寺田 努 (神戸大/JST),塚本 昌彦 (神戸大)

この研究は,全てのデモ発表の中で,最も面白いと思った研究である.キーボードの半分だけを用いて,両手でキーボードを打つことにより,取得できなかった片手分の文字がなくとも,TRY木による予測を用いて,入力単語を予測するシステム.打たなかった打鍵間隔を用いることにより,打たなかった文字が何文字あるかを予測し提示する.予測入力として文字入力をサポートしている点が面白い.

Pc030081
B25:MusiCube: 特徴量空間における対話型進化計算を用いた楽曲提示インタフェース: 斉藤優理,伊藤貴之(お茶大)

MIDIデータを対象に,音楽特徴に基づき,音楽データの探索ができるシステム.対話型遺伝的アルゴリズムを用いて,ユーザに視聴・評価付けしてもらうのに良い音楽データを学習している.この際,音楽データに対して主成分分析を行い,次元削減を行っている.2次元画面上で,ユーザが任意に軸を指定することで,好き/嫌いの分布を見つつつ,音楽データの探索ができるようになっている.

Pc030079

|

WISS2011 参加メモ(2日目午後)

WISS2011(二日目午後)の参加メモです.

WISS2011(第19回インタラクティブシステムとソフトウェアに関するワークショップ)に参加してきましたので,参加メモを公開します.
http://www.wiss.org/WISS2011/

私の感想も書いておりますが,あくまで個人的な意見ですので,ご了承ください.また,発表内容の要約は私の理解した範囲内での記述ですので,ご了承ください.

13:30-14:50 セッション4「Web」(座長:三浦 元喜/チャット座長:岡部 誠)

    Gorotte:情報の消費者ではなく生産者になるための試み
        大坪五郎((株)ネクスト)

難解すぎて,ノート書けませんでした.

    視聴者のコメントに基づく動画検索および推薦システムの提案
        佃洸摂(京大),中村聡史(京都大学),田中克己(京大)

鏡音レンが最初から最後まで活躍していて泣ける動画が見たいとかが見れる.登場人物の活躍度のグラフが表示される.鏡音レンが活躍していて,途中で初音ミクが脇役で出てくるような動画が検索できる.
インデックスの作成.キャラクター,活躍パターン,動画の印象をインデックスをつける.動画につけられたコメントから,これらを推測する.活躍シーンは,登場人物の名前が出てくる前後k秒.活躍度は,その期間のコメント数.印象は,コメント中の印象語辞書(筆者らが作成したもの)を利用している.登場人物名は集合知的に登録してもらう試みも実施.

    smoon: Webの実体化による行動支援とその試作
        渡邊恵太(JST),佐藤彩夏(お茶の水女子大),松田聖大(JST),稲見昌彦(慶應大),五十嵐健夫(東大)

レピシのデータに連動しモーターで体積を変更する.すりきり一杯で適量が得られる.Webの情報から,その内容を直接実行できるように(自分でその内容を正確に理解しなくても使えるようにしたい)したい.料理に限って,計量行為を実施できるようにした.しかし,この壮大な思想を実現するには,全てのWeb情報に,直接実行のための計算機可読なデータを付与し,それをデバイスに転送する必要がある.その点について,どのように解決していくのか説明が欲しかった.また,すべてのドメインに対して,この考え方を実行するには,ドメインごとにデバイスを作らないといけない.それも現実的ではないと思った.
ただ,直接実行できるようにしたいという思想は評価したい.それに対するアプローチは一つではないはずで,今回のプレゼンはスプーンが前面に出てき過ぎてしまっているので,この思想の可能性を狭めてしまうのではないかと思った.

    DataWiki?を活用した社会的アプリケーションの構築
        江渡浩一郎(産総研),濱崎雅弘(産総研),沢田洋平(産総研)

以前に特別講演でご一緒したことがあるので,メモなし.(すみません)

15:10-16:30 セッション5「コミュニケーション」(座長:小池 英樹/チャット座長:中野 倫靖)
    笑顔は人を幸せにするのか?笑顔促進支援システム
        辻田眸(東京大学),暦本純一(東京大学/ソニーCSL)

笑顔を認識して,日常生活のあらゆる場面でフィードバックさせることを考えている.冷蔵庫に設置し,笑顔にならないと簡単に開かないようにして,10日間被験者に使ってもらい,笑顔の変化を見ている.赤ちゃんにも適用.笑わないとおもちゃが動かない.社会を幸せにする研究だと思った.小難しく方法論を考えている自分を思わず振り返ってしまった.

    Sharedo: To-doリストによる人-ロボット間のタスク共有
        加藤淳(東大/JSPS),坂本大介(東大/JST ERATO),五十嵐健夫(東大)

Todoを書いておき,それをエージェント(ロボット)と共有.エージェントは,その情報を基に,情報を推薦.インタラクティブにさらに絞り込みができる.人がやらないといけないタスクは,人がやる.タスクは,事前に定義しているのだろうか?また,タスクの絞り込みや詳細化を行うには,人間の指示することのセマンティクスを理解しないといけないが,どうしているのか?汎用性は?タスクは,買い物と掃除だけ?などいろいろ疑問に思った.
人がやることとロボットができること,ロボットがどこまでできるのかということを,意識しないで使えるところが良いと思った.この点は,非常に高く評価できる.

    身体性を考慮した着ぐるみ装着者支援システム
        岡崎辰彦(神戸大),寺田努(神戸大),塚本昌彦(神戸大)

つかぼーが出てきた.着ぐるみ支援インタフェースを考えた.着ぐるみの以下の3つの問題を解決.1.自分の姿勢が分からない.2.自分の視界が狭い.3.実際には鼻や口か視界を得ているので,自然に視線を合わせるのが難しい.目標となる画像と,今の自分の画像をHMD上に重畳表示している.顔の周囲に5つのカメラを設置.それをHMD上に表示.

Pc020057

    文の構造を明示的に指定・表示することによる異言語間コミュニケーション
        五十嵐健夫(東大)

機械翻訳は完全ではない.小さいまとまりは,機械翻訳に頼る.長い文は,構造を見せて人に判断を任せる.もともと複雑な条件や結論を持つことを,一文で説明するのは,そもそもそれを書く人間にとっても,大変なはず.人は,考えていることを木構造で分けて書いておいて,そのフレーズごとに機械翻訳をすれば,機械翻訳も失敗しない.非常に面白いアイディアである.
ただ,多義語の問題には弱いと思った.多くの自然言語処理はコーパスに基づく確率ベースで処理を行っているので,多義語にどの意味を紐づけるのかは,文全体を見ていることが多い.そこの問題はサポートしてやらないといけないと思った.

|

WISS2011 参加メモ(2日目午前)

WISS2011(二日目午前)の参加メモです.

WISS2011(第19回インタラクティブシステムとソフトウェアに関するワークショップ)に参加してきましたので,参加メモを公開します.
http://www.wiss.org/WISS2011/

私の感想も書いておりますが,あくまで個人的な意見ですので,ご了承ください.また,発表内容の要約は私の理解した範囲内での記述ですので,ご了承ください.

二日目
(デモ)
A03:Contextual Photo Browser: 写真参与者と周辺状況に基づく写真ビューア: 徳網 亮輔,河野 恭之 (関学),中村 聡史 (京大)
Wifiアクセス端末の信号やBluetoothの信号を用い,写真を撮影された場所で,どのような名前のアクセスポイントがあるかを記録し,写真を撮ったコンテキストを思い出させるシステム.

A06:表紙生成エンジンを用いた Web キュレーションの実現: 重田 桂誓,松村 敦,宇陀 則彦 (筑波大).
あるテーマに関して,初心者にも分かりやすいWebコンテンツ群を雑誌の表紙のように配置するためのシステム.Webページの代表的な画像を取ってきて(既存手法を流用)し,二次元にマッピングしている.Web キュレーションというなら,もうひと押し欲しかった.誰でもWebキュレーションに慣れているわけではないので,そこの支援があると良いと思った.

Pc020032

A20:RefrigeMeter?: 冷蔵庫における保存状況の手軽な検出/提示システム: 三久保 莉也,塚田 浩二,椎尾 一郎 (お茶大)
アクリル板に備えたLEDにより,冷蔵庫に何がどれだけの期間入っているのかを表示するシステム.バターのような長期保存可能な食材とお肉のように長期保存が不可能な食材と分けれると良いと思った.それを行うには画像認識を行うしかないが,新しいハードウェアと認識方式を導入するのは避けたいところ.もっと,冷蔵庫からユーザに働きかけ(「早く食べてくださいよ」みたいな)を行い,そのユーザの反応を取っておいて,働きかけを無視する食材には強く働きかけたり,それでも無視するなら長期保存が可能なものと判断したりと言った,インタラクションモデルを導入し,ソフト的に解決するのが良いと思った.

Pc020046_2

A10:チームプレゼン!: 永瀬 翔 (明治大),栗原 一貴 (産総研),宮下 芳明 (明治大/JST)
A19:自動でスライドを分割・統合して時間を調整するプレゼンテーションツール: 矢田 裕基 (明治大),栗原 一貴 (産総研),宮下 芳明 (明治大/JST)
両方ともパワーポイント(のような)によるプレゼンに対する支援.A10は,プレゼンしている裏側で,それを支援するユーザがいて,発表中にリアルタイムに修正やスライド順番の入れ替えなどができるシステム.A19は,発表時間の残り時間に応じて,スライドの内容を統合したり分割したりできるシステム.面白い試みである.A19は,あらかじめスライドの部分(オブジェクト)に対して,優先度を付けておき,優先度に応じて削除を行っている.手法が単純で,もうひと押し欲しいと思った.

Pc020035

Pc020045

A16:使用金額認識財布を用いたマネーログの記録・編集インタフェース: 韮澤賢三,志築文太郎,田中二郎(筑波大)
財布にLEDセンサーをつけておき,お札の透かし部分を使って,お札が何枚入っているかが分かるようになっている.試みとしては面白い.お札をきれいに重ねて入れていないと何枚か計測できなかったり,微妙な照明条件により誤差が出るのではないかと思った.どれだけ装置の小型化ができるかが重要であろう.

Pc020040

A17:例示による携帯プログラミングの拡張:瀬戸 優之 (明治大),宮下 芳明 (明治大/JST)
例示プログラミングで携帯端末向けのアプリケーションを作成できるシステム.デモでは,例示は,携帯端末を振った時の強さであったが,携帯端末で他にこのような例示ができる操作がどれだけあるのか興味のあるところ.iPhoneのようなタッチパネル式の入力が主流になってきており,それをうまく使った例示プログラミングができると面白い.

Pc020042
11:00-12:20 セッション3「入力・創作支援」(座長:園山 隆輔/チャット座長:江渡 浩一郎) †
    インタラクティブなビーズデザインと制作支援
        五十嵐悠紀(筑波大/JSPS),五十嵐健夫(東大/JST ERATO),三谷純(筑波大/JST ERATO)

3次元ビーズ作品のデザイン・政策を助ける.ビーズデザインのための,三次元のmの出リングを行う.モデルを作った後,どのようにビーズを通せばよいのかも教えてくれる.デザインモデルから構造モデルを構築し,ワイヤーグラフを作る.そして,一本の糸からそのモデルを作成するためのオイラーグラフを構築する.

Pc020051

    数式の予測入力インタフェースの開発
        堀江圭介(阪大),土方嘉徳(阪大),西田正吾(阪大)

自分の発表.デモまで長く,申し訳ありませんでした.

    絵楽器の設計段階におけるプロトタイピング支援システムの設計と実装
        竹川佳成(神大),福司謙一郎(東工大),Machover Tod(MIT Media Lab),寺田努(神戸大),塚本昌彦(神戸大)

絵にした楽器で演奏できる.導電性インクを使って,実現.ウィジェットと音とのマッピングはどうやるんだろう?ピンに事前に音が割り振らていて,それをウィジェットに接続することでマッピングしている.しかし,子供が使うことを考えると,ちょっと無理があるような...ウィジェットの形状により,音の長さやビブラートなどが制御できると面白い.

Pc020053
    スイッチバックカーソル:重なりあったウィンドウ間を移動可能なマウスカーソル操作手法
        山中祥太(明治大),宮下芳明(明治大/JST)

非常に言葉での説明が難しい研究.マウスのボタンを同時に置いて,その状態でカーソルがアクティブウィンドウから離れると,その下にあるウィンドウを操作にできる.また,どちらかのボタンを押しておいて,現在の操作ウィンドウを外れると,一つ上のウィンドウを操作できる.ウィンドウの半透明機能をうまく使っている.

|

WISS2011 参加メモ(1日目)

WISS2011の参加メモです.

WISS2011(第19回インタラクティブシステムとソフトウェアに関するワークショップ)に参加してきましたので,参加メモを公開します.
http://www.wiss.org/WISS2011/

私の感想も書いておりますが,あくまで個人的な意見ですので,ご了承ください.また,発表内容の要約は私の理解した範囲内での記述ですので,ご了承ください.

1日目
14:45-16:05 セッション1「デバイス・センシング」(座長:塚田 浩二/チャット座長:宮下 芳明)
においに基づくコンテキストアウェアシステムの設計と実装
    寺田努(神戸大),小林泰貴(神戸大),塚本昌彦(神戸大)
空気の汚れセンサー,メタンガスセンサー,二酸化炭素ガスセンサーを使って,状況認識.機械学習で認識.決定木とk-NNを合わせて利用.決定木のみでは,A群(室内・室外)とB群(食事,トイレ,喫煙)に認識するのはそれぞれ90%ぐらいの正確さで認識している.その後の,継続判定がある場合では,それぞれのコンテキストを80%~90%ぐらいの正確さで認識している.

WrinkleSurface?: しわを作って入力できる柔らかいマルチタッチインタフェース
    坂本侑一郎(筑波大),吉川拓人(筑波大),大江龍人(筑波大),志築文太郎(筑波大),福本雅朗(NTTドコモ),田中二郎(筑波大)

ウレタンゲルシートを用いた新しい入力デバイスを開発している.プッシュ(指で押す),スラスト(押したまま一定方向に移動)だけでなく,ツイスト(押したまま,指を回転させる)ことも検出できる.また,入力時にできたしわは保存することが可能で,そのしわを用いてグラフィックスの編集ができたりする.入力面と画像の出力面を同じ面にすることができ,面白い.赤外線LEDを当て,赤外線センサ画像を用いて,上記の入力を判定している.アイディアが面白い.識別率はプッシュは100%だが,スラストとツイストは70-80%.

Wrinklesurfaces

PINOKY:ぬいぐるみを駆動するリング型のデバイス
    杉浦裕太(慶応大学 / JST),LeeCalista?(慶大),尾形正泰(慶大/JST),牧野泰才(慶大),坂本大介(東大/JST ERATO),稲見昌彦(慶應大),五十嵐健夫(東大)

家においてあるぬいぐるみの手やしっぽに,開発したリングをつけると,手を振ったり,しっぽを振ったりしているように見える.フォトリフレクター(画像センサー?)も備えており,学習した動きを再現することもできる.ずっと動かない姿を見てきた馴染みのぬいぐるみが,動いている姿が見られるのはこれまでにない体験だと思う.

ニンジャトラック:形状と柔軟性が変化する構造体をもちいたインタラクション技法
    勝本雄一朗(シンガポール国立大学),徳久悟(慶大),稲蔭正彦(慶大)

普段しなやかに曲がる物体でも,まっすぐかちかちにすることができるデバイスを開発.アプリケーションの説明に多くの時間を割いていて,どうやって柔軟な状態とかちかちな状態を技術的に実現しているのか,分からなかった.

16:25-17:45 セッション2「閲覧支援」(座長:伊藤 貴之/チャット座長:橋本 直)
動画の極限的な高速鑑賞のためのシステムの開発と評価
    栗原一貴(産総研)
字幕のあるところを拘束再生,字幕のないところをすっとばして再生できるシステム.ビデオファイルをドラッグ&ドロップすることで,高速再生用のファイルを作成してもらえる.前処理でDVDから動画ファイルをと字幕ファイルを取り出す.これらを実装システムに入力すれば,高速再生用のファイルを作成してもらえる.音声では内容を認識できなくとも,字幕で言語理解を行えば,動画干渉ができる.CinemaGazerという名前.

物語の要約を支援するインターフェース
    田中翔太郎(電通大),岡部誠(電気通信大学 / JST PRESTO),尾内理紀夫(電通大)

人手で小説の要約を作ることを支援するシステムを開発.各章ごとに重要語が出てくるので,その語をクリックすると,それに関係する記述が列挙される.記述をクリックするとそれを要約に含めることができる.Simpson係数で共起語も取ってくる.システムを使用して作成した要約と,本を読んで作成した要約を,他の被験者に読んでもらい評価実験をしている.本を読んで作った要約よりも,システムを使用して作成した要約の方が良いということが分かった.キーワードはTFIDFで選択

ネタバレを見ずにレビュー文を閲覧できるシステムの開発
    池田郁(阪大),土方嘉徳(阪大),岩井秀成(阪大),西田正吾(阪大)

自分の発表.

構造を持つ時系列情報に関する3次元可視化フレームワーク
    伊藤正彦(東大),豊田正史(東大),喜連川優(東大)

発表直後で,ちゃんと聞けず...

|

« 2011年11月 | トップページ | 2012年3月 »