2ヶ月前
テキストセグメンテーションからスマートチャプタリングへ:ビデオトランスクリプションの構造化に向けた新しいベンチマーク
Fabian Retkowski; Alexander Waibel

要約
テキスト分割は、自然言語処理における基本的なタスクであり、文書を連続したセクションに分割します。しかし、この分野の従来の研究は、規模が小さかったり、合成されたものだったり、または構造化された文書のみを含むといった制限のあるデータセットによって制約されていました。本論文では、これらの制限に対処するために、話されたコンテンツに焦点を当てた新しいベンチマーク YTSeg を導入します。話されたコンテンツは本来的に非構造的であり、トピックや構造において多様性を持っています。本研究の一環として、効率的な階層分割モデル MiniSeg を紹介します。このモデルは最先端の基準モデルを上回る性能を示しています。最後に、テキスト分割の概念をより実践的な「スマートチャプタリング」タスクへと拡張します。「スマートチャプタリング」は非構造化コンテンツの分割だけでなく、意味のあるセグメントタイトルの生成やモデルのリアルタイム応用も含む課題です。