HyperAI
Command Palette
Search for a command to run...
Updesh インド語合成テキストデータセット
Updesh は、インド言語の大規模言語モデル (LLM) の事後トレーニングを容易にするために、2025 年に Microsoft によってリリースされたインド言語の合成テキスト データセットです。
データセットには、アッサム語、ベンガル語、グジャラート語、ヒンディー語、カンナダ語、マラヤーラム語、マラーティー語、ネパール語、オディア語、パンジャブ語、タミル語、テルグ語、ウルドゥー語の 6,800,000 件の推論データと 2,100,000 件の生成データが含まれています。
Updesh_beta.torrent
シーディング 1ダウンロード中 0完了 78総ダウンロード数 127
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。