日付

9ヶ月前

サイズ

285.11 MB

ライセンス

MIT

論文URL

1. チュートリアルの概要

マイクロソフトリサーチが2025年4月に発表したBitNet-b1.58-2B-4Tは、人工知能分野における重要な進歩を表しています。オープンソースのネイティブ1ビット大規模モデルとしては世界初となるこのモデルは、従来の量子化技術の限界を克服し、低精度モデルでも性能を維持しながら計算リソースの消費を大幅に削減できることを実証し、エッジデバイスへのローカルAI展開への道を切り開きました。関連研究論文は以下の通りです。 BitNet b1.58 2B4T 技術レポート。

このチュートリアルでは、デモとして BitNet-b1.58-2B-4T を使用し、イメージには PyTorch 2.6-2204 を使用し、コンピューティングリソースには RTX 4090 を使用します。

2. コア機能

効率的なアーキテクチャ: 3 値量子化重み (-1、0、+1) を使用すると、各重みに必要なストレージは 1.58 ビットのみになります。 8ビットのアクティベーション値（W1.58A8構成）と組み合わせると、非埋め込みメモリの使用量わずか0.4 GBとなり、同様のモデル（Gemma-3 1Bの1.4 GBなど）よりもはるかに低くなります。
トレーニングのイノベーション: ゼロからのトレーニング (ポスト量子化ではない)、BitLinear レイヤー、2乗 ReLU アクティベーション関数、および RoPE 位置エンコーディングを導入して、低精度トレーニングの安定性を確保します。
エネルギー消費の利点: CPU 推論のレイテンシは 29 ミリ秒と短く、エネルギー消費はわずか 0.028 ジュール/トークンで、Apple M2 などの CPU での効率的な操作をサポートします。

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. 機能デモンストレーション

交流とディスカッション

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行

日付

9ヶ月前

サイズ

285.11 MB

ライセンス

MIT

論文URL

2504.12285

1. チュートリアルの概要

このチュートリアルでは、デモとして BitNet-b1.58-2B-4T を使用し、イメージには PyTorch 2.6-2204 を使用し、コンピューティングリソースには RTX 4090 を使用します。

2. コア機能

効率的なアーキテクチャ: 3 値量子化重み (-1、0、+1) を使用すると、各重みに必要なストレージは 1.58 ビットのみになります。 8ビットのアクティベーション値（W1.58A8構成）と組み合わせると、非埋め込みメモリの使用量わずか0.4 GBとなり、同様のモデル（Gemma-3 1Bの1.4 GBなど）よりもはるかに低くなります。
トレーニングのイノベーション: ゼロからのトレーニング (ポスト量子化ではない)、BitLinear レイヤー、2乗 ReLU アクティベーション関数、および RoPE 位置エンコーディングを導入して、低精度トレーニングの安定性を確保します。
エネルギー消費の利点: CPU 推論のレイテンシは 29 ミリ秒と短く、エネルギー消費はわずか 0.028 ジュール/トークンで、Apple M2 などの CPU での効率的な操作をサポートします。

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. 機能デモンストレーション

交流とディスカッション

Ovis-Image: 高品質画像生成モデル

2ヶ月前

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

2ヶ月前

Dia2-TTS: リアルタイム音声合成サービス

2ヶ月前

Krea-realtime-video: リアルタイムビデオ生成モデル

3ヶ月前

ROCKET-2: 3Dゲームゼロショット転送

2ヶ月前

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

3ヶ月前

ジェスチャー認識に基づく3Dクリスマスツリー

2ヶ月前

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

3ヶ月前

Depth-Anything-3: あらゆる視点から視覚空間を復元する

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

BitNet b1.58 2B4Tは、エッジAI展開のための大規模言語モデルを可能にします

1. チュートリアルの概要

2. コア機能

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 機能デモンストレーション

交流とディスカッション

AIでAIを構築

HyperAI Newsletters

Command Palette

BitNet b1.58 2B4Tは、エッジAI展開のための大規模言語モデルを可能にします

1. チュートリアルの概要

2. コア機能

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 機能デモンストレーション

交流とディスカッション

関連 ノートブック

Ovis-Image: 高品質画像生成モデル

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

Dia2-TTS: リアルタイム音声合成サービス

Krea-realtime-video: リアルタイムビデオ生成モデル

ROCKET-2: 3Dゲームゼロショット転送

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

ジェスチャー認識に基づく3Dクリスマスツリー

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

Depth-Anything-3: あらゆる視点から視覚空間を復元する

AIでAIを構築

HyperAI Newsletters

Command Palette

BitNet b1.58 2B4Tは、エッジAI展開のための大規模言語モデルを可能にします

1. チュートリアルの概要

2. コア機能

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 機能デモンストレーション

交流とディスカッション

関連 ノートブック

Ovis-Image: 高品質画像生成モデル

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

Dia2-TTS: リアルタイム音声合成サービス

Krea-realtime-video: リアルタイムビデオ生成モデル

ROCKET-2: 3Dゲームゼロショット転送

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

ジェスチャー認識に基づく3Dクリスマスツリー

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

Depth-Anything-3: あらゆる視点から視覚空間を復元する

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

Ovis-Image: 高品質画像生成モデル

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

Dia2-TTS: リアルタイム音声合成サービス

Krea-realtime-video: リアルタイムビデオ生成モデル

ROCKET-2: 3Dゲームゼロショット転送

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

ジェスチャー認識に基づく3Dクリスマスツリー

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

Depth-Anything-3: あらゆる視点から視覚空間を復元する

関連 ノートブック

Ovis-Image: 高品質画像生成モデル

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

Dia2-TTS: リアルタイム音声合成サービス

Krea-realtime-video: リアルタイムビデオ生成モデル

ROCKET-2: 3Dゲームゼロショット転送

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

ジェスチャー認識に基づく3Dクリスマスツリー

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

Depth-Anything-3: あらゆる視点から視覚空間を復元する

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック