テキストと映像の類似度を用いた映像要約

Abstract

安価なカメラの普及により映像撮影および映像をインターネット上で公開することが一般的となった.近年,そのような映像の利用方法として,ビデオブログが注目されている.しかし,ピデオブログ制作において,大量の映像からユーザの意図に沿った映像に編集する作業には膨大な手間がかかる.本研究では,このような映像編集にかかる労力を削減するため,新たな映像要約手法を提案する.提案手法は,ユーザがブログ記事のために執筆したテキストに類似した内容の要約映像を生成することで,そのブログ記事に合った映像を生成する.そのために,映像要約を映像とテキストの類似度に関する最適化問題として定式化する.実験では,20 人の被験者に対するユーザスタディにより,ビデオブログのための映像作成支援として提案手法が有効であることを確認する.