図書館情報メディアパンフ2017
40/56

研究室紹介 (メディア創造)38研究室紹介 (メディア創造)手塚研究室データからの知識獲得 人間の行動履歴やセンサー記録、ウェブ上のコンテンツなど、蓄積された膨大なデータが我々の社会を大きく変革しようとしています。これらのデータを人間が見るのではなく、計算機に読み込ませ、知識を獲得させる研究が盛んに行われています。適切な知識獲得のためには計算機がデータの「意味」を理解しなくてはなりませんが、本研究室ではデータ自体を利用して意味を学習させる統計モデルを用い、知識獲得を行うシステムの研究を行っています。神経細胞の活動データの解析 神経細胞間ではほとんどの情報が活動電位(スパイク)によって伝えられるとされており、脳における情報表現の理解においてスパイク系列の解析は欠かせません。スパイク系列の間に類似度や距離を定義する研究は以前から行われていますが、近年では正定値カーネルをスパイク系列上で定義する手法が提案されています。これによって機械学習において広く使われているカーネル法がスパイク系列に対して適用できるようになります。従来の単独のスパイク系列に対するカーネルを拡張し、多数のスパイク系列(多チャネルスパイク系列)上のカーネルについて研究を行っています。統計的言語モデル 計算機が文書から知識を獲得するにあたっては、与えられたデータのすべてを記憶するのではなく、内容を要約し、全体の傾向を簡潔にまとめた構造として把握する必要があります。統計的言語モデルではこの構造を確率的なものと捉え、文書における単語の出現が従う離散的な確率分布のパラメータを機械学習によって推定します。モデルにはデータとして直接的に観測されない潜在的な「意味」を表す変数を加えることもできます。より人間の認知に近い意味を獲得するような、高度な機械学習の研究に取り組んでいます。ライフログ検索システム 日常会話には時折興味深い話題が出ることがありますが、記録を取っていなければ忘れてしまいます。残念な思いをしないで済むように、会話の内容を記録し、後から再利用できるようにするシステムを開発しています。実用的な検索機能を実現するには音声認識の精度向上が必要です。統計的言語モデルを用い、音声認識エンジンに単語間の意味的距離を計算させ、音韻的には似ているが意味的には関連性が薄い認識結果を検出し、修正させる形で改善を図っています。意味を考慮した画像検索 従来の画像検索システムでは色彩や形状の類似に基づいて検索を行っていましたが、「何が映っているか」という意味を統計的な手法で推定した上で検索を行うことで、より精度の高い検索システムを目指す研究を行っています。

元のページ  ../index.html#40

このブックを見る