ワンクリックで Phi 3.5 mini+vision を展開します。マルチモーダル読み取りベンチマーク データ セット MRR-Benchmark はオンラインであり、550 の質問と回答のペアが含まれています

特色图像

‍‍小さなモデルがまた巻き上げられました! Microsoft の 3 つのオープンソース リリース! Phi 3.5 は、さまざまなタスクに対応する 3 つのモデルを一度にリリースし、複数のベンチマークで他の同様のモデルを上回りました。

その中で、Phi-3.5-mini-instruct は、メモリや計算能力が限られているデバイス向けに特別にリリースされており、小さなパラメーターで強力な推論機能を発揮できるため、コード生成や多言語理解などのタスクを簡単に処理できます。 Phi-3.5-vision-instruct は、マルチモーダル分野のリーダーであり、テキストと視覚情報を同時に処理でき、画像理解やビデオ要約などのタスクを処理できます。

HyperAI Super Neural は、モデル展開チュートリアルのミニ バージョンとビジョン バージョンを開始しました。記事をドロップダウンしてリンクを取得してください~

9 月 2 日から 9 月 6 日までの hyper.ai 公式 Web サイト更新の概要:

* 高品質なチュートリアルのセレクション: 3

* 高品質の公開データセット: 10

* コミュニティ記事の選択: 3 記事

* 人気のある百科事典のエントリ: 5

※9月締切:5日

公式ウェブサイトにアクセスしてください:ハイパーアイ

オンラインでの学術共有活動を皆さんにお勧めしたいと思います。上海交通大学の博士研究員、Zhou Ziyi 氏が「タンパク質言語モデルの小サンプル学習法」というテーマについて議論します。興味深い情報を共有して、クリックして予約して視聴してください⬇️

https://hdxu.cn/6Bjom

選択された公開チュートリアル

1. Phi-3.5-mini-instruct のワンクリック展開

Phi-3.5-mini-instruct は、128K トークンのコンテキスト長をサポートしており、コード生成、数学的問題解決、ロジックベースの推論などのタスクの実行に適しています。このモデルは、多言語および複数ターンの対話タスクで優れたパフォーマンスを発揮し、RepoQA ベンチマークでは同クラスの他のモデルを上回っています。このチュートリアルでは、モデルのワンクリック デモ デプロイメントを提供します。コンテナーを複製して起動し、生成された API アドレスを直接コピーするだけで、モデルの推論を体験できます。

直接使用します:https://go.hyper.ai/F7smR

2. ワンクリックで Phi-3.5-vision-instruct をデプロイします

Phi-3.5-vision-instruct モデルには、広範な画像理解、光学式文字認識 (OCR)、チャートと表の解析、複数画像またはビデオ クリップの要約などの機能が備わっており、さまざまな AI 駆動型アプリケーションに最適です。画像およびビデオ処理に関連するベンチマークで大幅なパフォーマンスの向上を実証しました。モデルと環境がデプロイされているので、チュートリアルのガイドラインに従って、推論生成に大規模なモデルを直接使用できます。

直接使用します:https://go.hyper.ai/zN9Bx

3. オンライン チュートリアル | 10,000 ワードのサスペンス小説を 1 分で生成、LongWriter-glm4-9b が長いテキスト出力のボトルネックを突破

LongWriter は、清華大学によって開発されたオープンソース プロジェクトで、ロングコンテキストのラージ言語モデル (LLM) を使用して非常に長いテキスト (10,000 ワード以上) を生成します。このチュートリアルでは、モデルのワンクリック デモ デプロイメントを提供します。コンテナーを複製して起動し、生成された API アドレスを直接コピーするだけで、モデルの推論を体験できます。

直接使用します:https://go.hyper.ai/p6SiO

公開データセットの選択

1. MRR-Benchmark マルチモーダル読み取りベンチマーク データ セット

マルチモーダル リーディング (MMR) ベンチマークは、テキスト、フォント、視覚要素、境界ボックス、空間関係、グラウンディングを含む 11 の異なるタスクにおける 550 の注釈付きの質問と回答のペアで構成されており、慎重に設計された評価指標が使用されます。

直接使用します:https://go.hyper.ai/deAmf

2. EveDentify瞳孔径推定データセット

データセットには、51 人の参加者からの合計 212,073 枚の画像が含まれています。研究チームは、Tobii アイ トラッカーを使用して正確な瞳孔径の測定値を収集し、顔のビデオをキャプチャするために内蔵の Web カメラを使用しました。このデータセットは、瞳孔径の推定に一般的な Web カメラ画像を利用する場合に利用可能なデータセットの不足に対処することを目的としています。

直接使用します:https://go.hyper.ai/iHjxC

3. 道路障害物検出 ポーランドの交通道路障害物検出データ セット

このデータセットには、物体検出タスク用に特別に編成された、ポーランドの道路の注釈付き画像 11,000 枚が含まれています。データは、主にクラクフのポーランドの道路で車載カメラを使用して収集されました。画像は、さまざまな道路タイプやさまざまな照明条件 (昼と夜) など、さまざまなシーンをキャプチャします。

直接使用します:https://go.hyper.ai/Sl0k5

4. C2A災害シナリオにおける人体検知データセット

C2A (アプリケーションに結合) データセットには、4 つの災害現場タイプ (火災/煙、洪水、倒壊した建物/瓦礫、交通事故) と 5 つの人間の姿勢カテゴリ (かがむ、ひざまずく、横になる、座る) が含まれており、合計 10,215 の高解像度データセットが含まれています。直立の画像)、画像解像度は 123 × 152 ~ 5184 × 3456 ピクセルの範囲で、360,000 を超える注釈付き人間インスタンスが含まれます。

直接使用します:https://go.hyper.ai/15dMR

5. Skin Conditionsmage Dataset 6 つの肌状態データセット

このデータセットには、ニキビ、がん、湿疹、角化症、稗粒腫、酒さの 6 つの異なる皮膚疾患の強化画像が含まれています。各カテゴリには 399 枚の画像が含まれており、合計 2,394 枚の画像が含まれています。

直接使用します:https://go.hyper.ai/tWO7x

6. Penn-Fudan の歩行者検出およびセグメンテーション データセット

このデータセットには、ビデオ シーケンスからキャプチャされた 170 個の高解像度 RGB 画像が含まれており、各画像には 0 ~ 6 個の歩行者オブジェクトが含まれています。各歩行者の位置は長方形のボックス (マスク) によって正確にマークされ、境界ボックスの座標情報が提供されるため、ターゲット検出のトレーニングとテストが容易になります。

直接使用します:https://go.hyper.ai/1CqaN

7. Tecnalia 電気機器廃棄物のハイパースペクトル データ セット

Tecnalia ハイパースペクトル データ セットには、銅、真鍮、アルミニウム、ステンレス鋼、白銅など、電気および電子機器の廃棄物からのさまざまな非鉄金属部分が含まれており、画像にはスペクトル範囲 [415.05 nm、1008.10 nm] 内に均一に分布した 76 の波長が含まれています。 ]。

直接使用します:https://go.hyper.ai/1TBGz

8.自動車衝突予測自動車衝突または予測データセット

このデータセットには 10,000 の車載カメラ画像が含まれており、それらはすべて 100,000 の車載カメラ ビデオからのものです。データセットには、衝突と衝突なしの 2 つのクラスが含まれており、xlsx ファイルには注釈も提供されます。

直接使用します:https://go.hyper.ai/jV1hL

9. PKU-Market-PCB プリント基板欠陥データセット

PKU-Market-PCB は、6 種類の欠陥 (漏れ、ネズミの噛み込み、開回路、短絡、浮遊、浮遊銅) を含む 1,386 枚の画像を含む公開合成 PCB データセットであり、画像の検出、分類、および登録タスクに使用できます。

直接使用します:https://go.hyper.ai/VnbpT

10. PKU-Market-Phone 携帯電話画面表面欠陥セグメンテーション データ セット

このデータ セットには、油、傷、斑点の 3 種類の表面欠陥が含まれています。欠陥の種類ごとに 400 枚の画像があり、合計 1.2k 枚の画像があります。この欠陥は、産業環境をシミュレートするために研究チームによって作成されました。画像は、解像度 1920×1080 の産業用カメラによって収集されます。データセットはトレーニング:検証:テスト=6:2:2に分かれており、データセット形式はPASCAL VOCを採用しています。

直接使用します:https://go.hyper.ai/K6u2o

その他の公開データセットについては、以下をご覧ください。

https://hyper.ai/datasets

注目のコミュニティ記事

1. AlphaFold 3 の超完全な解体、上海交通大学の Zhong Bozitao: データを極端に使用してすべての生体分子の構造を原子の精度で予測しますが、それは完璧ではありません

最近、上海交通大学 AI for Bioengineering サマー スクール イベントで、Zhong Bo Zitao 博士は、「AlphaFold 3: 原理、応用、展望」というタイトルで自身の学習経験を体系的に整理し、科学研究コミュニティからの情報を広範囲にまとめました。彼は多くの関連する研究結果を全員と共有し、AlphaFold 3 に対する深い洞察を共有しました。この記事が講演の中核となる内容です。

レポート全体を表示します。https://go.hyper.ai/Ln2Yv

2. 米国科学アカデミー紀要の表紙記事!中国チームがウェーハレベルで製造可能な人工知能適応型マイクロ分光計をリリース

復丹大学のチームは、従来の分光計と計算再構成分光計の利点を組み合わせた新しい小型再構成分光計の設計を提案しました。統合された自己参照狭帯域フィルタリング チャネルを通じて、人工知能アルゴリズムを高次元のパラメータ空間で実行できます。スペクトルとアルゴリズムのパラメータ。この記事は研究論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/GEKE4

3. 700万件の質問と回答データをカバーし、GPT-4に匹敵する専門的な機能を備えた上海AIラボがChemlLMをリリース

上海人工知能研究所は化学大規模言語モデル ChemLLM をリリースしました。 ChemLLM は、スムーズな会話対話を通じて化学分野のさまざまなタスクを実行することに優れており、コア タスクでは GPT-4 に匹敵するパフォーマンスを示し、一般的なシナリオでは同様のサイズの LLM に匹敵するパフォーマンスを示します。この記事は研究論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/3bdMW

人気のある百科事典の項目を厳選

1. 相互ソーティング融合 RRF

2. 学習率 学習率

3. 核の規範

4. パレートフロント パレートフロント

5. データの拡張

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://go.hyper.ai/wiki

主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。

また来週お会いしましょう!

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1,300 を超える公開データセットに対して国内の高速ダウンロード ノードを提供

* 400 以上の古典的で人気のあるオンライン チュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai