📢📢 良いニュースです!朗報です! 📺「Super NeuroTV」がbilibiliでオンラインになりました~
「スーパーニューラルTVステーション」では、AI分野などの実践講座や業界カンファレンスを“7×24時間”生中継します。毎週、記事の最後に来週の番組の予告を公開していきます!
クリックしてご覧ください:http://live.bilibili.com/26483094
ささやき、少し前にOpenAIを辞めた技術第一人者のKarpathy氏 リリースされた AI コース「GPT トークナイザーを構築してみよう」は、来週金曜日 (3 月 15 日) 午後 8 時にライブ ブロードキャスト ルームで再生されます。誰もがプロジェクトをより便利に体験できるように、プロジェクト関連リソース minbpe も hyper.ai 公式 Web サイトに掲載されています。ぜひ見て学んでください。
さらに、今週、hyper.ai 公式 Web サイトでは、誰もがダウンロードして使用できる複数のテキスト感情分析データ セットもリリースされました。
3 月 4 日から 3 月 8 日までの hyper.ai 公式 Web サイトの更新の概要:
* 高品質の公開データセット: 10
* コミュニティ記事選択: 4 記事
* 人気のある百科事典のエントリ: 10
公式ウェブサイトにアクセスしてください:ハイパーアイ
公開データセットの選択
1.minbpeリポジトリ
このリポジトリは、Karpathy の minbpe プロジェクト リポジトリで、BaseTokenizer や BasicTokenizer などのクラスベースの Tokenizer 実装が含まれています。これらのクラスは、トレーニング、エンコード、デコードのための基本機能に加え、保存やロードなどのユーティリティ機能を提供するように設計されています。
直接使用します:
2.うつ病診断チャット用D4中国語会話データセット
D4 はうつ病診断チャットの中国語会話データセットです。タスクチャットと呼ばれる新しいタイプの会話です。このデータセットは 1,339 のマルチターン会話で構成されており、会話の概要と診断結果が含まれています。
直接使用します:
3. dmsc_v2 映画レビュー データセット
このデータ セットには、70 万人を超えるユーザーによる 28 本の映画の 200 万件を超える評価またはレビューが含まれています。レコメンデーションシステム、センチメント/意見/コメント、その他の傾向分析タスクなどのタスクに適しています。
直接使用します:
4. Amazon Amazon ユーザーレビューデータセット
このデータセットには、Amazon の 1,100 以上のカテゴリ、52 万の製品に関する 142 万人のユーザーからの 720 万件のレビューまたは評価データが含まれており、推奨システムやセンチメント/意見/レビューの傾向分析などのタスクに使用できます。
直接使用します:
5. 点平点平データセット
このデータ セットには、54 万人のユーザーによる 24 万軒のレストランに関する 440 万件のレビューまたは評価が含まれています。レコメンドシステム、感情・意見・コメント傾向分析などのタスクに使用できます。
直接使用します:
6. Weibo_senti_100k 新浪感情的な Weibo データセット
このデータセットには、感情的な注釈が付いた 100,000 件を超える新浪微博投稿が含まれており、それぞれ約 50,000 件の肯定的なコメントと否定的なコメントが含まれています。
直接使用します:
7. Online_shopping_10_cats 10 カテゴリのオンライン ショッピング レビュー データセット
このデータ セットには、10 のカテゴリ (本、タブレット、携帯電話、果物、シャンプー、給湯器、蒙牛、衣類、コンピュータ、ホテル) のオンライン ショッピング レビューが含まれており、それぞれ肯定的なレビューと否定的なレビューを含む合計 60,000 件を超えるレビュー データが含まれています。約30,000。センチメント/意見/コメントなどの傾向分析タスクに使用できます。
直接使用します:
8. ChnSentiCorp Ctrip ホテルレビューデータセット
このデータ セットには、Ctrip.com からの 7,000 件を超えるホテル レビュー データが含まれており、そのうち 5,000 件以上の肯定的なレビューと 2,000 件以上の否定的なレビューが含まれています。
直接使用します:
9. Waimai_10k フードデリバリープラットフォームユーザー評価データセット
このデータセットは、食品配達プラットフォームによって収集されたユーザー レビューから得たもので、約 4,000 件の肯定的なレビューと約 8,000 件の否定的なレビューが含まれます。感情・意見・コメントの傾向分析に利用できます。
直接使用します:
10. 4 つの形状 4 つの形状のデータセット
データセットには、正方形、星形、円形、三角形の 4 つの形状の 16,000 枚の画像が含まれています。各画像は 200×200 ピクセルです。データは、Garmin Virb 1080p アクション カメラを使用して収集されました。
直接使用します:
今週更新されたその他のデータセットについては、次のサイトをご覧ください。:
注目のコミュニティ記事
1. 精度は91.74%に達します!東南大学が太陽電池の欠陥検出モデルを提案し、神経構造探索を初めて導入
産業分野における欠陥検出の精度と速度の要件を同時に満たすために、東南大学オートメーション学部のZhang Jinxia教授のチームは、神経構造検索と知識蒸留に基づいた太陽電池エレクトロルミネッセンス画像欠陥の自動検出モデルを提案しました。精度は91.74%です。現在、研究成果はarXivで公開されている。
レポート全体を表示します。
2. チュートリアルが含まれています | 音色複製モデルである GPT-SoVITS は、5 秒間の発話で 95% に似た音声を複製できます。
RVC (検索ベースの音声変換) (GitHub アカウント: RVC-Boss) の創設者は、音声クローン プロジェクト GPT-SoVITS をオープンソース化し、開始後大きな人気を博しました。 5 秒間の音声サンプルを提供するだけで、80% ~ 95% の類似性を持つクローン音声を取得できます。現在、HyperAI公式Webサイトでモデルデプロイメントチュートリアルが公開されています。
クリックしてクローン作成を開始します。
3. 2 つのセッション中、テクノロジー大手は、AI4S/人材トレーニング/コンピューティング能力/大規模モデル/業界共通データ セットについて言及しました。
再び「ツーセッション」の時間です!政府活動報告書には「人工知能+」行動を実行する必要性が明記されており、各界の全国人民代表大会議員や中国人民政治協商会議のメンバーもAIに関する提案や戦略を提供している。この記事では、テクノロジー界の著名人からの提案と提案を整理します。
レポート全体を表示します。
4. HyperAI HyperNeural × DT 新材料丨化学・材料科学における AI 技術の応用研究セミナー 参加受付開始
「化学および材料科学研究におけるAI技術応用セミナー」は4月23日から25日まで河南省鄭州で開催され、多くの業界専門家が材料化学分野におけるAI応用の課題、展望、機会に焦点を当てます。 。
興味のある開発者は、下のリンクをクリックして登録してください。
登録リンク:
人気のある百科事典の項目を厳選
1.ラプラシアン
2. ワールドモデリング
3. 1 秒あたりのフレーム数 (FPS)
4. 普及モデル 普及モデル
5. 人間参加型 (HITL)
ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。
超緊張ステーションB生放送予告
日付 | 時間 | コンテンツ |
3月11日 月曜日 | 10:00 | 長年にわたる NVIDIA の記者会見 |
3月12日火曜日 | 10:0018:00 | 機械学習コンピレーション コース Tesla AI Day |
3月13日水曜日 | 10:00 | 長年にわたる Google IO カンファレンス |
3月14日(木) | 10:00 | スタンフォードHAIセミナー |
3月15日金曜日 | 10:0020:00 | MIT Deep Learning コース GPT Tokenizer を構築してみよう |
3月16日土曜日 | 10:00 | ハーバード大学 CS50 コース (2023) |
3月17日日曜日 | 10:00 | ハーバード大学 CS50 コース (2022) |
スーパー ニューラル TV ステーションは、7 時間 24 日中断のない生放送を放送しており、ワンクリックで AI 分野の「電子マスタード」を収穫できます。
http://live.bilibili.com/26483094
上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。
また来週お会いしましょう!
HyperAIについて Hyper.ai
HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。
* 1,200 を超える公開データセットに対して国内の高速ダウンロード ノードを提供
* 300 以上の古典的で人気のあるオンライン チュートリアルが含まれています
* 100 以上の AI4Science 論文ケースを解釈
* 500 以上の関連用語クエリをサポート
*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします
学習の旅を始めるには、公式 Web サイトにアクセスしてください。