HyperAIHyperAI

Command Palette

Search for a command to run...

テキストセグメンテーションからスマートチャプタリングへ:ビデオトランスクリプションの構造化に向けた新しいベンチマーク

Fabian Retkowski Alexander Waibel

概要

テキスト分割は、自然言語処理における基本的なタスクであり、文書を連続したセクションに分割します。しかし、この分野の従来の研究は、規模が小さかったり、合成されたものだったり、または構造化された文書のみを含むといった制限のあるデータセットによって制約されていました。本論文では、これらの制限に対処するために、話されたコンテンツに焦点を当てた新しいベンチマーク YTSeg を導入します。話されたコンテンツは本来的に非構造的であり、トピックや構造において多様性を持っています。本研究の一環として、効率的な階層分割モデル MiniSeg を紹介します。このモデルは最先端の基準モデルを上回る性能を示しています。最後に、テキスト分割の概念をより実践的な「スマートチャプタリング」タスクへと拡張します。「スマートチャプタリング」は非構造化コンテンツの分割だけでなく、意味のあるセグメントタイトルの生成やモデルのリアルタイム応用も含む課題です。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています