TransGPT-pt&sft 交通对话预训练数据集
* 该数据集支持在线使用,点击此处跳转。
该数据集为北京交通大学于 2024 年发布的国内首款综合交通大模型 TransGPT 的一部分,包含了约 34.6 万条交通领域文本数据,这些数据用于领域内预训练,以及约 5.8 万条交通领域对话数据,用于微调。相关论文成果为「TransGPT: Multi-modal Generative Pre-trained Transformer for Transportation」。
数据来源包括单模态和多模态数据,如交通标志大全、驾考题库、全球旅游景点等。数据集覆盖道路工程、桥梁工程、隧道工程、公路运输、水路运输、城市公共交通运输、交通运输经济、交通运输安全等多个交通相关行业,提供通识常识。
TransGPT-pt-sft.torrent
做种 2正在下载 0已完成 48总下载次数 210