NeurST: Neural Speech Translation Toolkit

NeurST ist ein Open-Source-Toolkit für neuronale Sprachübersetzung. Der Toolkit konzentriert sich hauptsächlich auf end-to-end-Sprachübersetzung und ist leicht zu bedienen, zu modifizieren und für fortschrittliche Forschung und Produkte im Bereich der Sprachübersetzung erweiterbar. NeurST zielt darauf ab, die Forschung in der Sprachübersetzung für NLP-Forscher zu erleichtern und zuverlässige Benchmarks für dieses Feld bereitzustellen. Er bietet schrittweise Anleitungen für die Merkmalsextraktion, Datenaufbereitung, verteiltes Training und Evaluierung. In diesem Paper stellen wir die Framework-Architektur von NeurST vor und präsentieren experimentelle Ergebnisse für verschiedene Benchmark-Datensätze, die als zuverlässige Baselines für zukünftige Forschungen gelten können. Der Toolkit ist öffentlich unter https://github.com/bytedance/neurst/ verfügbar, und wir werden die Leistung von NeurST kontinuierlich mit anderen Ansätzen und Studien aktualisieren unter https://st-benchmark.github.io/.