PhotoMaker は、テンセントと南開大学が共同開発した AI 画像生成ツールで、人物の顔の特徴を捉えるだけでなく、好みに基づいてリアルな人物画像を生成し、パーソナライズされたカスタマイズを新たなレベルに押し上げます。新しいソーシャル メディア アバターが必要な場合でも、ゲーム用のユニークなキャラクターが必要な場合でも、当社が対応します。
このプロジェクトのワンクリック デモ チュートリアルが、hyper.ai 公式 Web サイトにオンラインで公開されました。、誰もがモデルをより便利かつ迅速に体験できるようにするために、生成速度が高速化された ComfyUI ワークフロー バージョンも開始されました。さらに多くのカスタマイズオプションが利用可能です!ぜひ体験してみてください〜
6 月 17 日から 6 月 21 日までの hyper.ai 公式 Web サイトの更新の概要:
* 高品質の公開データセット: 10
* 高品質なチュートリアルのセレクション: 2
* コミュニティ記事選択: 4 記事
* 人気のある百科事典のエントリ: 5
※6月~7月の提出締切:5日
公式ウェブサイトにアクセスしてください:ハイパーアイ
公開データセットの選択
Tree of Life の 454,000 分類群をカバーする 1,000 万枚以上の画像を含むこのデータセットは、生物有機体画像とそれに関連する分類学的ラベルのこれまでで最大の ML データセットです。この研究論文は CVPR 2024 の最優秀論文に選ばれました。
直接使用します:https://go.hyper.ai/jimyx
このデータセットは、人間の活動の 15 の異なるカテゴリ、約 12,000 枚以上のラベル付き画像 (検証画像を含む) を含むベースであり、各画像には人間の活動カテゴリが 1 つだけあり、人間の行動を理解し、各アクションにラベルを割り当てるように設計されています。
直接使用します:https://go.hyper.ai/3jmf1
このデータセットは、Linux China に関するオリジナルの技術記事 + 翻訳された技術記事のデータセットであり、記事のタイトルや内容など複数のフィールドを提供します。
直接使用します:https://go.hyper.ai/KgFgf
4. DroneVehicle 大型UAV空撮車両検知データセット
データセットはドローンによって収集された合計 56,878 枚の画像で構成されており、その半分は RGB 画像で、残りは赤外線画像です。このデータセットは、スマートな都市交通管理と災害救助をサポートします。
直接使用します:https://go.hyper.ai/KhbuB
5. PianoMotion10M ピアノ演奏ジェスチャー生成データセット
このデータセットは、ピアノ演奏ジェスチャーの生成に焦点を当てたベンチマーク データセットで、鳥瞰図から撮影された 116 時間のピアノ演奏ビデオをカバーし、1,000 万件の注釈付きハンド ジェスチャーが含まれています。これらのデータは、ピアノ音楽と手の動きの関連性を調査するための豊富なリソースを提供します。
直接使用します:https://go.hyper.ai/QAOi8
6. LawInstruct 初の大規模な法的指導データセット
このデータセットは、17 の管轄区域と 24 の言語をカバーする、法務分野初の大規模な指導データセットであり、1,200 万件のトレーニング例が含まれており、質問応答、含意、要約、情報抽出などのさまざまな法的タスクをカバーしています。
直接使用します:https://go.hyper.ai/ARN3n
このデータセットには、さまざまな手話の文字と記号を表す 29 のカテゴリに分類されたアメリカ手話のアルファベットの画像が含まれています。データセット内の画像サイズは一律 200×200 ピクセルで、トレーニング データセットには 87,000 枚の画像が含まれています。
直接使用します:https://go.hyper.ai/IhhZc
このデータセットは、英語の手書き文字画像の大規模なコレクションであり、手書き認識タスク用に特別に設計されており、さまざまな画像認識モデルのトレーニングに使用できます。
直接使用します:https://go.hyper.ai/28lwk
9. CAT データセット 猫の顔特徴アノテーション画像データセット
このデータセットには、顔の特徴が注釈付けされた 9,000 枚を超える猫の画像が含まれています。各画像には猫の頭の注釈が付けられています。猫の頭には 9 つのポイント (口が 1 つ、目が 2 つ、耳が 6 つ) があります。
直接使用します:https://go.hyper.ai/MkmTu
10. Audio Cats and Dogs 猫と犬の音声データセット
データ セットには、数百の猫と犬のオーディオ カテゴリ「wav」ファイルが含まれています。猫用の 164 個の WAV ファイルは 1,323 秒の音声に相当し、犬用の 113 個の WAV ファイルは 598 秒の音声に相当します。すべての「wav」ファイルには 16KHz オーディオが含まれており、長さは可変です。
直接使用します:https://go.hyper.ai/e0RGg
その他の公開データセットについては、以下をご覧ください。
選択された公開チュートリアル
1. PhotoMaker 任意様式化画像生成デモ
PhotoMaker は、カスタマイズされたポートレート写真やポートレート写真に基づいた芸術的な写真を迅速に生成できる、効率的なポートレート カスタマイズ モデルです。キャラクターのパーソナライズされた写真を生成するだけでなく、キャラクターの年齢や性別を変更したり、さまざまなキャラクターの特徴を統合して新しいキャラクター情報を作成したりすることもできる、非常に便利な AI ペイント ツールです。このチュートリアルの環境は、誰もが実行して体験できるようにセットアップされています。
オンラインで実行:https://go.hyper.ai/3B5Rd
2. ComfyUI PhotoMaker ZHO 画像生成ワークフロー
このチュートリアルでは、PhotoMaker の ComfyUI ワークフローを実行する方法について説明します。デモの Gradio バージョンと比較して、ComfyUI ワークフロー バージョンには、生成が高速で、ノード分割とカスタム サイズがサポートされているという利点があります。 Super Neuron はすべての人に適切な環境をセットアップしており、ワンクリックでその環境を複製して実行できます。
オンラインで実行:https://go.hyper.ai/XdSoQ
このチュートリアルでは、ベース モデル HuBERT を使用して、事前トレーニングされたオーディオ モデルを使用してオーディオ分類タスクを実行し、事前トレーニングされたモデルを微調整することで音楽スタイル分類を実現する方法を示します。
オンラインで実行:https://go.hyper.ai/7QjRj
また、Stable Diffusion チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に注目し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりするためにグループに参加してください。
注目のコミュニティ記事
1. AI コンパイラー技術共有セッション: 上海交通大学/中国科学院計算技術研究所/マイクロソフト リサーチ アジア/インテリジェント ソース、彼らはここにいます!
HyperAIは、7月6日(土)に中国科学院計算技術研究所にて第5回「Meet AIコンパイラ技術サロン」オフライン集会を開催する。今回のMeetupは、技術共有とラウンドテーブルディスカッションの2部構成で、ゲストは上海交通大学、計算技術研究所、マイクロソフトリサーチアジア、北京智源人工知能研究所の方々です。新しい集まりは、新しいテクノロジーを収穫し、同じ業界の新しい友達を作ることができます。登録するには「原文を読む」をクリックしてください!
イベントの詳細を表示:https://go.hyper.ai/oAsLQ
2. 華東師範大学上海人工知能金融学部長 邵宜磊氏との対談:AI時代には人文科学に優れた学校が大きなアドバンテージを得る
人工知能と金融の国境を越えた交差点を中心に構築された世界初の教育研究機関、華東師範大学上海人工知能金融研究所が最近正式に発表された。 HyperAI は幸運にも Shao Yilei 学部長と詳細なインタビューをすることができ、新しい大学のビジョンと開発計画についてさらに詳しく知ることができました。
インタビュー全文を見る:https://go.hyper.ai/bp4Po
3. がん細胞の増殖を抑制できる!恵湖薬科大学は天津医科大学と提携し、新しい腫瘍抑制タンパク質分解剤 dp53m を開発
西安交通リバプール大学恵湖薬学部のWu Sijin教授と、天津医科大学総合病院のXie Songbo教授およびZhong Diansheng教授のチームは、選択的p53-R175H分解剤、dp53mを開発しました。変異体 p53-R175H タンパク質とその標的分解は、明らかな毒性作用を伴わずに顕著な抗腫瘍効果を示します。 dp53m は、がん治療に不可欠な化学療法薬シスプラチンに対するがん細胞の感受性を高めることもできます。この記事は、研究の詳細な解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/k80er
4. 武漢の住宅価格を正確に予測!浙江大学の GIS 研究室は、複雑な空間プロセスと地理現象を正確に記述する osp-GNNWR モデルを提案しました。
浙江大学 GIS 研究所の研究者は、観測点間の複数の空間近接測定値を非線形結合して最適化された空間近接測定値を取得するニューラル ネットワーク手法を導入しました。これにより、住宅価格の予測におけるモデルの精度が向上しました。この研究ではまた、OSP と地理的ニューラル ネットワーク重み付け回帰法を組み合わせて、osp-GNNWR モデルを構築し、従属変数と独立変数の間の空間非定常回帰関係を解くことでニューラル ネットワークのトレーニングを実現します。この記事は、研究の詳細な解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/kWmHC
人気のある百科事典の項目を厳選
1. 関数呼び出し 関数呼び出し
2. スパイキング ニューラル ネットワーク SNN
3. コンテキスト位置エンコーディング CoPE
4. ロシアのマトリョーシカ人形はMRLの学習を表す
5. コルモゴロフ・アーノルド表現定理
ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。
ステーションBのライブブロードキャストプレビュー
Jeff Dean は、Google の上級研究員兼コンピュータ サイエンティストであり、MapReduce や TensorFlow の開発など、分散システムと人工知能における先駆的な業績で知られており、Google テクノロジーの開発における重要人物の 1 人です。今週、スーパー ニューロ TV はジェフ ディーンのスピーチとインタビューを生中継します。
次の表は、編集者が全員に向けて選択したコンテンツのプレビューです↓↓↓
日付 | 時間 | コンテンツ |
6月24日月曜日 | 18:00 | ジェフ・ディーンが機械学習の 5 つの主要トレンドについて語る |
6月25日火曜日 | 18:00 | AI をすべての人に提供しましょう |
6月26日水曜日 | 18:00 | AI の将来に対するジェフ ディーンの前向きな見解 |
6月27日(木) | 18:00 | スタンフォード医療ビッグデータカンファレンスでのジェフ・ディーン氏の講演 |
6月28日(金) | 18:00 | ディープラーニングに関するジェフ・ディーン氏の講演 |
6月29日土曜日 | 18:00 | Google Brain と Brain Residency |
6月20日(日) | 18:00 | ディープラーニングを使用して問題を解決する方法 |
スーパー ニューラル TV ステーションは、7 時間 24 日中断のない生放送を放送しており、ワンクリックで AI 分野の「電子マスタード」を収穫できます。
http://live.bilibili.com/26483094
上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。
また来週お会いしましょう!
HyperAIについて Hyper.ai
HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。
* 1,300 を超える公開データセットに対して国内の高速ダウンロード ノードを提供
* 400 以上の古典的で人気のあるオンライン チュートリアルが含まれています
* 100 以上の AI4Science 論文ケースを解釈
* 500 以上の関連用語クエリをサポート
*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします
学習の旅を始めるには、公式 Web サイトにアクセスしてください。