PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

PhotoMaker は、テンセントと南開大学が共同開発した AI 画像生成ツールで、人物の顔の特徴を捉えるだけでなく、好みに基づいてリアルな人物画像を生成し、パーソナライズされたカスタマイズを新たなレベルに押し上げます。新しいソーシャルメディアアバターが必要な場合でも、ゲーム用のユニークなキャラクターが必要な場合でも、当社が対応します。

このプロジェクトのワンクリックデモチュートリアルが、hyper.ai 公式 Web サイトにオンラインで公開されました。、誰もがモデルをより便利かつ迅速に体験できるようにするために、生成速度が高速化された ComfyUI ワークフローバージョンも開始されました。さらに多くのカスタマイズオプションが利用可能です!ぜひ体験してみてください〜

6 月 17 日から 6 月 21 日までの hyper.ai 公式 Web サイトの更新の概要:

* 高品質の公開データセット: 10

* 高品質なチュートリアルのセレクション: 2

* コミュニティ記事選択: 4 記事

* 人気のある百科事典のエントリ: 5

※6月～7月の提出締切：5日

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. TreeOfLife-10M 生体画像データセット

Tree of Life の 454,000 分類群をカバーする 1,000 万枚以上の画像を含むこのデータセットは、生物有機体画像とそれに関連する分類学的ラベルのこれまでで最大の ML データセットです。この研究論文は CVPR 2024 の最優秀論文に選ばれました。

直接使用します:https://go.hyper.ai/jimyx

2. HAR 15 人間の行動認識データセット

このデータセットは、人間の活動の 15 の異なるカテゴリ、約 12,000 枚以上のラベル付き画像 (検証画像を含む) を含むベースであり、各画像には人間の活動カテゴリが 1 つだけあり、人間の行動を理解し、各アクションにラベルを割り当てるように設計されています。

直接使用します:https://go.hyper.ai/3jmf1

3. Linux China 原文データセット

このデータセットは、Linux China に関するオリジナルの技術記事 + 翻訳された技術記事のデータセットであり、記事のタイトルや内容など複数のフィールドを提供します。

直接使用します:https://go.hyper.ai/KgFgf

4. DroneVehicle 大型UAV空撮車両検知データセット

データセットはドローンによって収集された合計 56,878 枚の画像で構成されており、その半分は RGB 画像で、残りは赤外線画像です。このデータセットは、スマートな都市交通管理と災害救助をサポートします。

直接使用します:https://go.hyper.ai/KhbuB

5. PianoMotion10M ピアノ演奏ジェスチャー生成データセット

このデータセットは、ピアノ演奏ジェスチャーの生成に焦点を当てたベンチマークデータセットで、鳥瞰図から撮影された 116 時間のピアノ演奏ビデオをカバーし、1,000 万件の注釈付きハンドジェスチャーが含まれています。これらのデータは、ピアノ音楽と手の動きの関連性を調査するための豊富なリソースを提供します。

直接使用します:https://go.hyper.ai/QAOi8

6. LawInstruct 初の大規模な法的指導データセット

このデータセットは、17 の管轄区域と 24 の言語をカバーする、法務分野初の大規模な指導データセットであり、1,200 万件のトレーニング例が含まれており、質問応答、含意、要約、情報抽出などのさまざまな法的タスクをカバーしています。

直接使用します:https://go.hyper.ai/ARN3n

7. ASL アルファベット手話データセット

このデータセットには、さまざまな手話の文字と記号を表す 29 のカテゴリに分類されたアメリカ手話のアルファベットの画像が含まれています。データセット内の画像サイズは一律 200×200 ピクセルで、トレーニングデータセットには 87,000 枚の画像が含まれています。

直接使用します:https://go.hyper.ai/IhhZc

8.「.csv形式」のAZ手書き文字データセット

このデータセットは、英語の手書き文字画像の大規模なコレクションであり、手書き認識タスク用に特別に設計されており、さまざまな画像認識モデルのトレーニングに使用できます。

直接使用します:https://go.hyper.ai/28lwk

9. CAT データセット猫の顔特徴アノテーション画像データセット

このデータセットには、顔の特徴が注釈付けされた 9,000 枚を超える猫の画像が含まれています。各画像には猫の頭の注釈が付けられています。猫の頭には 9 つのポイント (口が 1 つ、目が 2 つ、耳が 6 つ) があります。

直接使用します:https://go.hyper.ai/MkmTu

10. Audio Cats and Dogs 猫と犬の音声データセット

データセットには、数百の猫と犬のオーディオカテゴリ「wav」ファイルが含まれています。猫用の 164 個の WAV ファイルは 1,323 秒の音声に相当し、犬用の 113 個の WAV ファイルは 598 秒の音声に相当します。すべての「wav」ファイルには 16KHz オーディオが含まれており、長さは可変です。

直接使用します:https://go.hyper.ai/e0RGg

その他の公開データセットについては、以下をご覧ください。

https://hyper.ai/datasets

選択された公開チュートリアル

1. PhotoMaker 任意様式化画像生成デモ

PhotoMaker は、カスタマイズされたポートレート写真やポートレート写真に基づいた芸術的な写真を迅速に生成できる、効率的なポートレートカスタマイズモデルです。キャラクターのパーソナライズされた写真を生成するだけでなく、キャラクターの年齢や性別を変更したり、さまざまなキャラクターの特徴を統合して新しいキャラクター情報を作成したりすることもできる、非常に便利な AI ペイントツールです。このチュートリアルの環境は、誰もが実行して体験できるようにセットアップされています。

オンラインで実行:https://go.hyper.ai/3B5Rd

2. ComfyUI PhotoMaker ZHO 画像生成ワークフロー

このチュートリアルでは、PhotoMaker の ComfyUI ワークフローを実行する方法について説明します。デモの Gradio バージョンと比較して、ComfyUI ワークフローバージョンには、生成が高速で、ノード分割とカスタムサイズがサポートされているという利点があります。 Super Neuron はすべての人に適切な環境をセットアップしており、ワンクリックでその環境を複製して実行できます。

オンラインで実行:https://go.hyper.ai/XdSoQ

3. HuBERTに基づいた曲スタイル分類の実装

このチュートリアルでは、ベースモデル HuBERT を使用して、事前トレーニングされたオーディオモデルを使用してオーディオ分類タスクを実行し、事前トレーニングされたモデルを微調整することで音楽スタイル分類を実現する方法を示します。

オンラインで実行:https://go.hyper.ai/7QjRj

また、Stable Diffusion チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に注目し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりするためにグループに参加してください。

注目のコミュニティ記事

1. AI コンパイラー技術共有セッション: 上海交通大学/中国科学院計算技術研究所/マイクロソフトリサーチアジア/インテリジェントソース、彼らはここにいます!

HyperAIは、7月6日（土）に中国科学院計算技術研究所にて第5回「Meet AIコンパイラ技術サロン」オフライン集会を開催する。今回のMeetupは、技術共有とラウンドテーブルディスカッションの2部構成で、ゲストは上海交通大学、計算技術研究所、マイクロソフトリサーチアジア、北京智源人工知能研究所の方々です。新しい集まりは、新しいテクノロジーを収穫し、同じ業界の新しい友達を作ることができます。登録するには「原文を読む」をクリックしてください！

イベントの詳細を表示:https://go.hyper.ai/oAsLQ

2. 華東師範大学上海人工知能金融学部長邵宜磊氏との対談：AI時代には人文科学に優れた学校が大きなアドバンテージを得る

人工知能と金融の国境を越えた交差点を中心に構築された世界初の教育研究機関、華東師範大学上海人工知能金融研究所が最近正式に発表された。 HyperAI は幸運にも Shao Yilei 学部長と詳細なインタビューをすることができ、新しい大学のビジョンと開発計画についてさらに詳しく知ることができました。

インタビュー全文を見る:https://go.hyper.ai/bp4Po

3. がん細胞の増殖を抑制できる！恵湖薬科大学は天津医科大学と提携し、新しい腫瘍抑制タンパク質分解剤 dp53m を開発

西安交通リバプール大学恵湖薬学部のWu Sijin教授と、天津医科大学総合病院のXie Songbo教授およびZhong Diansheng教授のチームは、選択的p53-R175H分解剤、dp53mを開発しました。変異体 p53-R175H タンパク質とその標的分解は、明らかな毒性作用を伴わずに顕著な抗腫瘍効果を示します。 dp53m は、がん治療に不可欠な化学療法薬シスプラチンに対するがん細胞の感受性を高めることもできます。この記事は、研究の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/k80er

4. 武漢の住宅価格を正確に予測！浙江大学の GIS 研究室は、複雑な空間プロセスと地理現象を正確に記述する osp-GNNWR モデルを提案しました。

浙江大学 GIS 研究所の研究者は、観測点間の複数の空間近接測定値を非線形結合して最適化された空間近接測定値を取得するニューラルネットワーク手法を導入しました。これにより、住宅価格の予測におけるモデルの精度が向上しました。この研究ではまた、OSP と地理的ニューラルネットワーク重み付け回帰法を組み合わせて、osp-GNNWR モデルを構築し、従属変数と独立変数の間の空間非定常回帰関係を解くことでニューラルネットワークのトレーニングを実現します。この記事は、研究の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/kWmHC

人気のある百科事典の項目を厳選

1. 関数呼び出し 関数呼び出し

2. スパイキングニューラルネットワーク SNN

3. コンテキスト位置エンコーディング CoPE

4. ロシアのマトリョーシカ人形はMRLの学習を表す

5. コルモゴロフ・アーノルド表現定理

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://hyper.ai/wiki

ステーションBのライブブロードキャストプレビュー

Jeff Dean は、Google の上級研究員兼コンピュータサイエンティストであり、MapReduce や TensorFlow の開発など、分散システムと人工知能における先駆的な業績で知られており、Google テクノロジーの開発における重要人物の 1 人です。今週、スーパーニューロ TV はジェフディーンのスピーチとインタビューを生中継します。

次の表は、編集者が全員に向けて選択したコンテンツのプレビューです↓↓↓

日付	時間	コンテンツ
6月24日月曜日	18:00	ジェフ・ディーンが機械学習の 5 つの主要トレンドについて語る
6月25日火曜日	18:00	AI をすべての人に提供しましょう
6月26日水曜日	18:00	AI の将来に対するジェフディーンの前向きな見解
6月27日（木）	18:00	スタンフォード医療ビッグデータカンファレンスでのジェフ・ディーン氏の講演
6月28日（金）	18:00	ディープラーニングに関するジェフ・ディーン氏の講演
6月29日土曜日	18:00	Google Brain と Brain Residency
6月20日（日）	18:00	ディープラーニングを使用して問題を解決する方法

スーパーニューラル TV ステーションは、7 時間 24 日中断のない生放送を放送しており、ワンクリックで AI 分野の「電子マスタード」を収穫できます。

http://live.bilibili.com/26483094

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。

また来週お会いしましょう！

HyperAIについて Hyper.ai

HyperAI（hyper.ai）は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1,300 を超える公開データセットに対して国内の高速ダウンロードノードを提供

* 400 以上の古典的で人気のあるオンラインチュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai

HyperAI

PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

2年前

6 月 17 日から 6 月 21 日までの hyper.ai 公式 Web サイトの更新の概要:

* 高品質の公開データセット: 10

* 高品質なチュートリアルのセレクション: 2

* コミュニティ記事選択: 4 記事

* 人気のある百科事典のエントリ: 5

※6月～7月の提出締切：5日

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. TreeOfLife-10M 生体画像データセット

直接使用します:https://go.hyper.ai/jimyx

2. HAR 15 人間の行動認識データセット

直接使用します:https://go.hyper.ai/3jmf1

3. Linux China 原文データセット

直接使用します:https://go.hyper.ai/KgFgf

4. DroneVehicle 大型UAV空撮車両検知データセット

直接使用します:https://go.hyper.ai/KhbuB

5. PianoMotion10M ピアノ演奏ジェスチャー生成データセット

直接使用します:https://go.hyper.ai/QAOi8

6. LawInstruct 初の大規模な法的指導データセット

直接使用します:https://go.hyper.ai/ARN3n

7. ASL アルファベット手話データセット

直接使用します:https://go.hyper.ai/IhhZc

8.「.csv形式」のAZ手書き文字データセット

直接使用します:https://go.hyper.ai/28lwk

9. CAT データセット猫の顔特徴アノテーション画像データセット

直接使用します:https://go.hyper.ai/MkmTu

10. Audio Cats and Dogs 猫と犬の音声データセット

直接使用します:https://go.hyper.ai/e0RGg

その他の公開データセットについては、以下をご覧ください。

https://hyper.ai/datasets

選択された公開チュートリアル

1. PhotoMaker 任意様式化画像生成デモ

オンラインで実行:https://go.hyper.ai/3B5Rd

2. ComfyUI PhotoMaker ZHO 画像生成ワークフロー

オンラインで実行:https://go.hyper.ai/XdSoQ

3. HuBERTに基づいた曲スタイル分類の実装

オンラインで実行:https://go.hyper.ai/7QjRj

注目のコミュニティ記事

イベントの詳細を表示:https://go.hyper.ai/oAsLQ

2. 華東師範大学上海人工知能金融学部長邵宜磊氏との対談：AI時代には人文科学に優れた学校が大きなアドバンテージを得る

インタビュー全文を見る:https://go.hyper.ai/bp4Po

3. がん細胞の増殖を抑制できる！恵湖薬科大学は天津医科大学と提携し、新しい腫瘍抑制タンパク質分解剤 dp53m を開発

レポート全体を表示します。https://go.hyper.ai/k80er

4. 武漢の住宅価格を正確に予測！浙江大学の GIS 研究室は、複雑な空間プロセスと地理現象を正確に記述する osp-GNNWR モデルを提案しました。

レポート全体を表示します。https://go.hyper.ai/kWmHC

人気のある百科事典の項目を厳選

1. 関数呼び出し 関数呼び出し

2. スパイキングニューラルネットワーク SNN

3. コンテキスト位置エンコーディング CoPE

4. ロシアのマトリョーシカ人形はMRLの学習を表す

5. コルモゴロフ・アーノルド表現定理

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://hyper.ai/wiki

ステーションBのライブブロードキャストプレビュー

次の表は、編集者が全員に向けて選択したコンテンツのプレビューです↓↓↓

日付	時間	コンテンツ
6月24日月曜日	18:00	ジェフ・ディーンが機械学習の 5 つの主要トレンドについて語る
6月25日火曜日	18:00	AI をすべての人に提供しましょう
6月26日水曜日	18:00	AI の将来に対するジェフディーンの前向きな見解
6月27日（木）	18:00	スタンフォード医療ビッグデータカンファレンスでのジェフ・ディーン氏の講演
6月28日（金）	18:00	ディープラーニングに関するジェフ・ディーン氏の講演
6月29日土曜日	18:00	Google Brain と Brain Residency
6月20日（日）	18:00	ディープラーニングを使用して問題を解決する方法

http://live.bilibili.com/26483094

また来週お会いしましょう！

HyperAIについて Hyper.ai

* 1,300 を超える公開データセットに対して国内の高速ダウンロードノードを提供

* 400 以上の古典的で人気のあるオンラインチュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai

PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

2年前

6 月 17 日から 6 月 21 日までの hyper.ai 公式 Web サイトの更新の概要:

* 高品質の公開データセット: 10

* 高品質なチュートリアルのセレクション: 2

* コミュニティ記事選択: 4 記事

* 人気のある百科事典のエントリ: 5

※6月～7月の提出締切：5日

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. TreeOfLife-10M 生体画像データセット

直接使用します:https://go.hyper.ai/jimyx

2. HAR 15 人間の行動認識データセット

直接使用します:https://go.hyper.ai/3jmf1

3. Linux China 原文データセット

直接使用します:https://go.hyper.ai/KgFgf

4. DroneVehicle 大型UAV空撮車両検知データセット

直接使用します:https://go.hyper.ai/KhbuB

5. PianoMotion10M ピアノ演奏ジェスチャー生成データセット

直接使用します:https://go.hyper.ai/QAOi8

6. LawInstruct 初の大規模な法的指導データセット

直接使用します:https://go.hyper.ai/ARN3n

7. ASL アルファベット手話データセット

直接使用します:https://go.hyper.ai/IhhZc

8.「.csv形式」のAZ手書き文字データセット

直接使用します:https://go.hyper.ai/28lwk

9. CAT データセット猫の顔特徴アノテーション画像データセット

直接使用します:https://go.hyper.ai/MkmTu

10. Audio Cats and Dogs 猫と犬の音声データセット

直接使用します:https://go.hyper.ai/e0RGg

その他の公開データセットについては、以下をご覧ください。

https://hyper.ai/datasets

選択された公開チュートリアル

1. PhotoMaker 任意様式化画像生成デモ

オンラインで実行:https://go.hyper.ai/3B5Rd

2. ComfyUI PhotoMaker ZHO 画像生成ワークフロー

オンラインで実行:https://go.hyper.ai/XdSoQ

3. HuBERTに基づいた曲スタイル分類の実装

オンラインで実行:https://go.hyper.ai/7QjRj

注目のコミュニティ記事

イベントの詳細を表示:https://go.hyper.ai/oAsLQ

2. 華東師範大学上海人工知能金融学部長邵宜磊氏との対談：AI時代には人文科学に優れた学校が大きなアドバンテージを得る

インタビュー全文を見る:https://go.hyper.ai/bp4Po

3. がん細胞の増殖を抑制できる！恵湖薬科大学は天津医科大学と提携し、新しい腫瘍抑制タンパク質分解剤 dp53m を開発

レポート全体を表示します。https://go.hyper.ai/k80er

4. 武漢の住宅価格を正確に予測！浙江大学の GIS 研究室は、複雑な空間プロセスと地理現象を正確に記述する osp-GNNWR モデルを提案しました。

レポート全体を表示します。https://go.hyper.ai/kWmHC

人気のある百科事典の項目を厳選

1. 関数呼び出し 関数呼び出し

2. スパイキングニューラルネットワーク SNN

3. コンテキスト位置エンコーディング CoPE

4. ロシアのマトリョーシカ人形はMRLの学習を表す

5. コルモゴロフ・アーノルド表現定理

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://hyper.ai/wiki

ステーションBのライブブロードキャストプレビュー

次の表は、編集者が全員に向けて選択したコンテンツのプレビューです↓↓↓

日付	時間	コンテンツ
6月24日月曜日	18:00	ジェフ・ディーンが機械学習の 5 つの主要トレンドについて語る
6月25日火曜日	18:00	AI をすべての人に提供しましょう
6月26日水曜日	18:00	AI の将来に対するジェフディーンの前向きな見解
6月27日（木）	18:00	スタンフォード医療ビッグデータカンファレンスでのジェフ・ディーン氏の講演
6月28日（金）	18:00	ディープラーニングに関するジェフ・ディーン氏の講演
6月29日土曜日	18:00	Google Brain と Brain Residency
6月20日（日）	18:00	ディープラーニングを使用して問題を解決する方法

http://live.bilibili.com/26483094

また来週お会いしましょう！

HyperAIについて Hyper.ai

* 1,300 を超える公開データセットに対して国内の高速ダウンロードノードを提供

* 400 以上の古典的で人気のあるオンラインチュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai

PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

関連ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

関連ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

関連ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

関連ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

Command Palette

PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

Command Palette

PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

関連 ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

Command Palette

PhotoMaker Tencent が新しいレベルのパーソナライズされた画像生成を開始、LawInstruct の最初の大規模な法的指導データセットがオンライン化

関連 ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

関連 ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

関連 ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

関連ニュース

関連ニュース

関連ニュース

関連ニュース