« WebDBフォーラム2011参加報告(1日目) | トップページ | WISS2011 参加メモ(1日目) »

WebDBフォーラム2011参加報告(2日目)

WebDBフォーラム2011に参加してきました.
http://db-event.jpn.org/webdbf2011/index.html

期日     2011年11月4日(金)、5日(土)
会場     工学院大学 新宿キャンパス

以下,2日目の参加報告です.

ユーザモデリングと応用(3G-1)
  11/5(土) 9:30-10:45    座長:中村聡史(京都大学)

    ユーザの購買予定金額を考慮したブランド選択モデルの提案
     長野翔一, 市川裕介, 高屋典子, 内山匡(NTT)

事情により聴講できず.

    レシピ閲覧・摂食履歴を用いた嗜好の抽出
     上田真由美(京都大学), 高畑麻理, 中島伸介(京都産業大学)

閲覧したが調理しなかったら,その食材は嫌い.レシピの得点を,食材に対するスコアを足し合わせて出す.ただし,似ている料理は連続しないように得点付する.このような推薦方式を被験者実験で評価.被験者10名.正解データ.食材に対して好き嫌いを聞いている.

見たという行為と,調理したという行為を分けているのは面白い.これは,一見,他の行動にも適用できそうな気がする.例えば,見たという行為と,購入したという行為などである.しかし,調理と言うのは,たまたま嫌いな食材が入っていたなどの原因から,単に見たと作ったの間に,手間と言う障壁があるだけではなく,嗜好に関する障壁がある点が異なる.

目の付け所は面白い.あとは,これをどう普遍的な知見として昇華させるかについて考えてもらいたい.

    ホテル業界におけるクチコミ情報に基づいた顧客満足度予測モデルの構築とポジショニング分析
     藤井絵美子(関西学院大学), 植野剛, 中元政一, 東高宏(JST ERATO 湊離散構造処理系プロジェクト), 加藤直樹(京都大学), 羽室行信(関西学院大学)

ホテルに関する口コミの評価表現分析をしている.評価表現を抽出した後,各表現を類似性からひとまとめにする.これは,各表現をノードと見なし,その関連性からグラフ構造を作り,極大クリークを求める.その後,被覆率から極大クリークをまとめ,最後にコレスポンデンス分析をして,表現のポジショニングを二次元平面上で確認している.
まっとうなやり方だが,結果を情報科学の分野でどう利用するかについて,議論があると良い.経済学では,ここまでで良いかもしれないが,工学的にどう利用していけるのかについての指針を示してもらいたかった.

テキストマイニングと応用(4G-1)
  11/5(土)11:00-12:15    座長:天笠俊之(筑波大学)

    ウェブのリンク構造と語の共起を利用したキーワード抽出に基づく情報検索結果の概念構造化
     吉永直嗣, 延原肇(筑波大学)

クエリから検索したWebページからキーワード抽出し,コンテキスト作成を行い,概念生成を行い,それを可視化表示する.キーワード抽出は,検索結果のページ群から,文字数が閾値以上であれば解析文書とする.文字数が閾値以下であれば,リンク先のページで類似度の高いページを解析文書とする.nグラムで頻出後集合を作る.

プレゼンの前半を聞き逃したため,コンテキストの抽出や概念の抽出方法などが分からなかった.検索支援において二次キーワードを提示するシステムはいっぱいあり,それを可視化するようなシステムもいくつか提案されていたような気がする.それとの差がどこにあるのか,よく分からなかった.

    電子書籍小説の効率的な選別のための興味喚起度に基づく「立ち読み」インタフェース
     村井聡一, 牛尼剛聡(九州大学)

Google books:20%以内で閲覧可能.クエリを含む個所が「立ち読み」開始ポイント.
専門書は良いが,小説には向かない.読者の関心を引きそうなところを「立ち読み」開始ポイントとする.興味喚起度マップを見せる.

どうやって作るのか?興味喚起度の高い語の出現密度を表示.レビューから興味を持つ部分を取ってこれる.

同じ小説のレビューに出現する頻度は高い
他の小説のレビューに出現する頻度が低い

これは,うまい.しかも,ちゃんとその小説の内容を表す単語が取れているのも面白い.今後が非常に楽しみな研究である.

    Analyzing Collective Memory: Towards Computational History
     Adam Jatowt(京都大学), Ching-man Au Yeung(Astri)

20年分の新聞記事から,過去200年に起こったことを,その出現頻度から可視化表示している.国別に,何が歴史的に重要トピックであったかなどを示していた.結果は面白いと思ったが,過去20年分の累積を出しており,これは必ずしもその当時に注目されていたこととは異なる.この点に注意は必要である.

論文賞セッション
  11/5(土)13:15-14:50    座長:中島伸介(京都産業大学)

    品詞n-gramを用いた著者推定手法 -話題に依存しない頑健性の評価-
     井上雅翔, 中島泰(早稲田大学), 山名早人(早稲田大学,国立情報学研究所)

品詞n-gramによって著者推定を行う.文章の話題によって文体(n-gram)が変化しにくい.
話題によって文体が違うと言っていたのは,語尾とか,そのレベルの話なのか?

話題相違によって提案手法がどれぐらい頑健性を持つのかを見る.実験によって,話題によっても提案手法が高い精度を誇っていることを示している.

提案手法そのものは新しいものではないが,品詞n-gramを用いれば話題が異なっても,高い精度を保てることを示したことには価値があると思われる.

    推薦システムにおけるユーザ関与とユーザ満足度に関する研究
     土方嘉徳, 甲斐裕樹, 西田正吾(大阪大学)

自分の発表なので,メモは取っていません.

ネットワーク機能コミュニティ抽出法の提案
 伏見卓恭, 斉藤和巳(静岡県立大学), 風間一洋(NTT)

機能コミュニティ(ゲートキーパー同士とか).PageRank影響度曲線の類似度によってクラスタリング.影響度曲線をベクトルにしている.

機能コミュニティという考え方は面白い.提案手法の評価は,やはり他の評価指標を用いたクラスタリング結果と比較してもらいたい.Hub, Authority, Betweenessなど.今後の展開が楽しみな研究である.

|

« WebDBフォーラム2011参加報告(1日目) | トップページ | WISS2011 参加メモ(1日目) »

Web研究」カテゴリの記事