TransGPT-pt&sft-Datensatz Zum Verkehrsdialog Vor Dem Training
Datum
Größe
Veröffentlichungs-URL
Kategorien
* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.
Dieser Datensatz ist Teil von TransGPT, dem ersten umfassenden Transportmodell in China, das 2024 von der Beijing Jiaotong University veröffentlicht wurde. Er enthält etwa 346.000 Textdaten im Transportbereich, die für das Vortraining in diesem Bereich verwendet werden, und etwa 58.000 Dialogdaten im Transportbereich zur Feinabstimmung. Die relevanten Papierergebnisse sindTransGPT: Multimodaler generativer vortrainierter Transformer für den Transport".
Zu den Datenquellen zählen ein- und mehrmodale Daten, wie etwa Verkehrszeichen-Enzyklopädien, Fragendatenbanken für Fahrprüfungen, globale Touristenattraktionen usw. Der Datensatz deckt mehrere transportbezogene Branchen ab, darunter Straßenbau, Brückenbau, Tunnelbau, Autobahntransport, Wassertransport, städtischer öffentlicher Verkehr, Transportökonomie, Transportsicherheit usw. und bietet allgemeines Wissen.