図情メディア研究科パンフレット2015
41/56

統計的言語モデル 計算機が文書から知識を獲得するというのは、与えられたデータのすべてを記憶するのではなく、内容を要約し、全体の傾向を簡潔にまとめた構造として捉えるということです。統計的言語モデルではこの構造を確率的なものと捉え、文書における単語の出現が従う離散的な確率分布のパラメータを機械学習によって推定します。 モデルにはデータとして観測されない潜在的な「意味」を表す変数を加えることもできます。より人間の認知に近い意味を獲得するような、高度な機械学習の研究に取り組んでいます。意味を考慮した画像検索 従来の画像検索システムでは色彩や形状の類似に基づいて検索を行っていましたが、「何が映っているか」という意味を統計的な手法で推定した上で検索を行うことで、より精度の高い検索システムを目指す研究を行っています。ライフログ検索システム 日常会話には時折大変面白い話題が出ることがありますが、記録を取っていなければ忘れてしまいます。残念な思いをしないで済むように、会話の内容を記録し、後から再利用できるようにするシステムを開発しています。実用的な検索機能を実現するには音声認識の精度向上が必要です。統計的言語モデルを用い、音声認識エンジンに単語間の意味的距離を計算させ、音韻的には似ているが意味的には関連性が薄い認識結果を検出し、修正させる形で改善を図っています。ローカル情報検索 特定の空間領域を対象としてウェブ検索を行う地域情報検索(ローカル検索)のシステムが近年、大きな注目を集めています。ユーザが入力したクエリに特に関連が深い地域を提示するなど、新たな形での地域情報検索システムを開発しています。39教育研究分野手塚・若林グループデータからの知識獲得 電子書籍やデジタルライブラリ、ウェブ上のコンテンツなど、電子的な文書の蓄積が急速に進んでいます。これらのデータを人間が読むのではなく、計算機に読み込ませ、知識を獲得させることで、情報検索や情報推薦など、幅広い応用が可能になります。適切な知識獲得のためには計算機が言葉の「意味」を理解しなくてはなりませんが、データ自体を利用して意味を学習させる統計的言語モデルという手法を使い、データから知識を取得するシステムを構築する研究を行っています。

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer10.2以上が必要です