テキスト記述を用いてユーザ意図を反映する映像要約