Command Palette
Search for a command to run...
TransGPT-pt&sft 트래픽 대화 사전 학습 데이터 세트
이 데이터 세트는 베이징 교통대학에서 2024년에 발표한 중국 최초의 종합 교통 모델인 TransGPT의 일부입니다. 여기에는 교통 분야의 텍스트 데이터 약 346,000개가 포함되어 있으며, 이는 교통 분야의 사전 학습에 사용되고, 교통 분야의 대화 데이터 약 58,000개는 미세 조정에 사용됩니다. 관련 논문 결과는 다음과 같습니다.TransGPT: 교통을 위한 다중 모드 생성 사전 훈련된 변환기". 데이터 소스에는 교통 표지판 백과사전, 운전 시험 문제 은행, 전 세계 관광 명소 등과 같은 단일 모드 및 다중 모드 데이터가 포함됩니다. 데이터 세트는 도로 공학, 교량 공학, 터널 공학, 고속도로 운송, 수상 운송, 도시 대중교통, 교통 경제학, 교통 안전 등을 포함한 여러 교통 관련 산업을 포괄하며 일반적인 지식을 제공합니다.