HyperAI Super Neural X Apache|コミュニティ・オーバー・コード アジア2025 AI特集

7月25日から27日まで、Apache Software Foundation (ASF) の公式グローバルカンファレンスシリーズである Community Over Code Asia 2025 が、北京の中関村国家独立イノベーション実証区の会議センターで開催されます。
本カンファレンスのAIトピックは、OpenBayes Bayesian Computingの創設者兼CEOである王晨漢氏、Apache Software Foundationのメンバーである譚忠義氏、そしてDatastratoの創設者兼CEOである杜俊平氏が共同で専門プロデューサーとして発表します。7月25日14:00から17:15まで、Apacheコミュニティの構築と発展における最新情報と最先端の実践例をお届けします。 HyperAIは協力コミュニティとしてこのイベントに参加し、マーケットブースを出店します。皆様、ぜひ遊びに来てくださいね~
特集
AIフォーラムは、人工知能(AI)技術とApacheオープンソースプロジェクトの融合に焦点を当てた専門的なコミュニケーションプラットフォームです。世界中の開発者、研究者、業界ユーザーを集め、オープンソースエコシステムにおけるAI技術の応用と開発について議論し、最先端技術を紹介し、実践経験を共有し、様々な業界におけるオープンソースAIソリューションの導入を促進することを目的としています。
このフォーラムに適したトピックは次のとおりです。
- Apache Foundation 傘下の AI 関連プロジェクト (例: Apache TVM、Mahout、Singa、SystemML などのオープンソース AI フレームワークと基本ライブラリ プロジェクトに重点を置く)
- AI シナリオ (Spark MLib、Flink ML など) での Apache 単一プロジェクトの最適化
- 複数のApacheプロジェクトを組み合わせた産業シナリオ向けAIソリューション(例:ある企業のAIビジネス構築手法)
プロデューサー

ワン・チェンハン
OpenBayes Bayesian Computingの創設者兼CEO。Apache TVM中国語ドキュメントの翻訳者であり、天津大学ベイズコンピューティング共同研究センターの副所長。ウォルト・ディズニー・インタラクティブ・メディア・グループやAVOS Systemsなどのテクノロジー企業で勤務し、オープンソース組織CLUE Benchmarks Foundationの事務局長を務めた。

タン・ジョンイー
COPU の副事務局長、20 年以上のオープンソースのベテラン、Apache Software Foundation のメンバー。

杜俊平
Datastrato創設者兼CEO、LF AI & DATA Foundationディレクター、Apache Software Foundationメンバー、ビッグデータ技術とオープンソースの専門家、Apache Open Source Foundationメンバー、Apache Hadoop、OZone、YuniKornなどのプロジェクトのコミッター兼PMC、Apache Gravitino、NuttXなどのプロジェクトのメンター。Fortune 500企業のオープンソース委員会元委員長、ビッグデータプラットフォームR&Dディレクター、オープンソースビジネスゼネラルマネージャー、Hortonworks Hadoopコンピューティングチーム元責任者など。
議題のハイライト
📅 7月25日 14:00 – 17:15
講演テーマ: クラウドネイティブな方法で異機種GPUの利用率を最大化する | HAMiのパワーを解き放つ
シェアタイム:7月25日 14:00~14:30
トピック紹介:AIの普及に伴い、KubernetesはAIインフラストラクチャのデファクトスタンダードとなっています。しかし、複数のAIデバイス(NVIDIA、Intel、Huawei Ascend、Haiguang、Muxi、Cambrian、Tianshu Zhixin、Suiyuanなど)を含むクラスターの増加は、大きな課題をもたらしています。AIデバイスは高価であり、リソース利用率を向上させるにはどうすればよいでしょうか?K8sクラスターとの統合を改善するにはどうすればよいでしょうか?異機種AIデバイスを統一的に管理し、柔軟なスケジューリング戦略をサポートし、可観測性を実現するにはどうすればよいでしょうか?これらはすべて多くの課題に直面しています。そこでHAMiプロジェクトが誕生しました。本講演では、以下の点について解説します。
- Kubernetes が異種の AI デバイスを管理する方法 (統合スケジューリング、可観測性)
- GPU共有によるデバイス利用率の向上
- GPU共有シナリオにおける高優先度タスクのQoSの確保
- 柔軟な GPU スケジューリング ポリシー (NUMA アフィニティ/アンチアフィニティ、パッキング/分散など) をサポートします
- 他のプロジェクトとの統合 (Volcano、スケジューラ プラグインなど)
- 実稼働レベルのユーザーによる実例共有
- 現在の課題と将来の計画
講演者:

Xiao Zhang|dynamia.ai創設者、クラウドネイティブ愛好家、コミュニティメンテナー。AIインフラに注力
Xiao Zhangは、dynamia.ai(インフラストラクチャ、AI、マルチクラスタ管理、クラスタライフサイクル管理(LCM)、Open Container Initiative(OCI)に注力)の創設者です。コミュニティへの積極的な貢献者であり、クラウドネイティブ技術の熱心な支持者でもあります。現在、Kubernetes/Kubernetes Special Interest Group(Kubernetes-sigs)のメンバーであり、Karmada、kubean、cloudttyプロジェクトのメンテナーを務めています。さらに、GitHub ID wawa0210を使用して、CNCF HAMiプロジェクトの共同スポンサー兼メンテナーも務めています。

Yu Yin|プロダクトオーナー@dynamia.ai、オープンソースメンテナー@HAMi、KubernetesにおけるGPU仮想化とAIインフラのイノベーションを推進
Yu Yinは、dynamia.aiのプロダクトオーナーであり、Kubernetes上のGPU仮想化とヘテロジニアスコンピューティングのためのオープンソースプロジェクトであるHAMiのコアメンテナーです。AIインフラストラクチャ構築の実務経験を持つYuは、マルチアーキテクチャ環境におけるスケーラブルなGPU共有、デバイスプーリング、インテリジェントスケジューリングの実現に注力しています。物流、通信、金融などの分野のエンタープライズユーザーが、本番環境でヘテロジニアスリソース管理を導入できるよう支援してきました。同時に、Yuは中国におけるオープンソースアプリケーションの積極的な提唱者でもあり、HAMiコミュニティの国際化を主導しています。
講演テーマ:Apache DorisのAI分野における探求と実践
シェアタイム:7月25日 14:30~15:00
トピック紹介:人気のOLAPリアルタイム分析データベースであるApache Dorisは、AIの波が急速に変化する現代において、ベクトル検索、MCP、RAGなどの機能モジュールなど、AI関連機能や周辺コンポーネントを既に構築、あるいは計画しています。本講演では、コミュニケーションとデモンストレーションを通して、AI分野におけるDorisの現在の進歩について発表します。
講演者:

YiJia Su|Apache Dorisコミッター、SelectDBソリューションアーキテクト、PowerDataスポンサー
Apache Doris コミッター、Apache Doris コミュニティの伝道者、Doris-MCP コントリビューター、SelectDB シニア ソリューション アーキテクト、PowerData コミュニティ イニシエーターとして、Apache Doris コミュニティの何百もの企業がリアルタイム データ ウェアハウスの構築と最適化の進化を完了できるよう支援してきました。
講演テーマ:Apache Gravitino | AI時代のメタデータ管理ソリューション
シェアタイム:7月25日 15:00~15:30
トピックの紹介:
メタデータ管理はAI時代の礎となっています。本講演では、Apache Gravitinoが大規模な非構造化データとモデル管理をどのように実現するか、そしてXiaomiが大規模言語モデル(LLM)データ処理とモデルライフサイクル管理にGravitinoをどのように活用しているかを探ります。
スピーチの概要:
1. AIワークフローにおけるデータセットとモデル管理の課題、そしてGravitinoがファイルセットカタログ(構造化AIデータセットガバナンス)とモデルカタログ(統合モデルライフサイクル管理)を通じてこれらの問題にどのように対処するか
2. Gravitinoのタグ付けシステム、系統追跡、資格情報管理機能を活用して、運用効率とガバナンスコンプライアンスを最大化します。
3. Xiaomiのデータ処理におけるFilesetの活用:AIシナリオにおけるデータ処理は、ダウンロード、抽出、フィルタリング、重複排除、トレーニングといった複数の段階を経ます。Filesetを活用することで、データとAIエンジン間のパイプライン効率が向上し、エンドツーエンドのデータセット管理が実現し、統一されたメタデータビューが確立されます。
4. Xiaomi AIビッグモデル管理の実践:Xiaomiがビッグモデルのメタデータを管理し、モデルサービスを展開する方法、そしてGravitinoとの統合に関する将来の計画
講演者:

Xiaojing Fang|Apache Gravitino PPMC & Datastrato ソフトウェアエンジニア
データと AI インフラストラクチャ システムに重点を置く Apache Gravitino PPMC メンバー。

Han Zhang|Xiaomi のソフトウェア R&D エンジニア
Apache Gravitino の貢献者であり、Xiaomi AI 開発プラットフォームの研究開発を担当しています。
講演テーマ: コンテキストとしてのカタログ | メタデータを使用して AI 開発の次の波を推進および管理する
シェアタイム:7月25日 15:45~16:15
トピック紹介:強力なAIツールの開発が今年のテーマであり、インテリジェントエージェントと基本モデルは様々な分野で大きな進歩を遂げています。しかし、核心的な疑問は依然として残っています。これらのアプリケーションに効果的に機能するデータを提供するにはどうすればよいでしょうか?エンタープライズレベルのスケールを実現するにはどうすればよいでしょうか?コンテキストの本質とは何でしょうか?本講演では、ビッグデータ・エコシステムの現状、AIデータプラットフォームが直面する課題、そしてデータカタログとメタデータが効率的で制御可能なAI開発への唯一の現実的な道である理由を探ります。オープンソースフレームワークApache Gravitinoを例に挙げ、なぜこのようなソリューションがベンダー中立でなければならないのかを説明します。
講演者:

ジェリー・シャオ|Datastrato CTO
Jerry ShaoはDatastratoの共同創設者兼CTOであり、オープンソース・ビッグデータの分野で10年以上活躍しています。Apacheメンバーとして、Apache SparkとApache InlongのコミッターおよびPMCメンバーを務め、Apache Gravitino(インキュベーション)プロジェクトの創設者でもあります。
講演テーマ:データからAIへ | Apache Cloudberryをベースとした統合分析プラットフォームの構築
共有時間:7月25日 16:15~16:45
トピックの紹介:
今日の企業は、断片化されたデータシステム、非効率的な処理フロー、そして分析と機械学習のギャップにより、AIの潜在能力を最大限に引き出すことが困難になっています。オープンソースのMPPデータウェアハウスであるApache Cloudberryは、データ処理とAI機能を深く統合することでこのパラダイムを再定義し、障壁を取り除き、イノベーションを加速します。
この講演では、Cloudberry がどのように次のことができるかを紹介します。
- 統合実行: ネイティブ AI/ML モデル (PyTorch、Scikit-learn など) をデータ ウェアハウス上で直接実行します。
- マルチモーダル分析: 構造化データと非構造化データ (PDF、画像など) を統一されたフレームワークで処理します。
- インテリジェント データ アプリケーション: RAG 強化の質問応答システム、会話型 BI、マルチモーダル検索の構築
データとインテリジェンスを統合プラットフォームに統合して、アーキテクチャを簡素化しながら AI ワークロードを拡張する方法を学びます。
講演者:

Chuanxin Bian|HashData、データ、AI エンジニア
Chuanxin Bian博士は、ディープラーニング、自然言語処理、時系列モデリングを専門とするデータサイエンティスト兼応用数学者です。香港理工大学で応用数学の博士号を取得しています。現在はHashDataに勤務し、HashMLやChatDataなどのAIツールやAIGCアプリケーションの開発を主導しています。また、BaiduではシニアR&Dエンジニアとして、Wenxinビッグモデルの開発、PaddleTSに基づく時系列モデルの構築、ユーザーポートレートシステムのアップグレード推進などに携わりました。Pythonとディープラーニングフレームワークに精通しており、理論と実践を結びつけてAIイノベーションを推進することに長けています。
講演テーマ: Apache Dorisハイブリッド検索技術の分析
シェアタイム:7月25日 16:45~17:15
トピックの紹介:
Apache Doris のハイブリッド検索機能は、従来の全文検索(キーワードベースの辞書検索)とベクター検索(セマンティックベースの検索)を組み合わせることで、より正確な検索結果を提供します。この機能は、eコマース、コンテンツ推奨、ナレッジベース検索など、キーワードマッチングとセマンティック理解の両方を必要とする複雑な検索シナリオに特に適しています。
1. ハイブリッド検索の基本原則
ハイブリッド検索は、両方の検索方法の利点を最大限に活用します。
- 全文検索(BM25):転置インデックスとキーワードマッチングに基づき、ユーザーが入力したクエリ用語を正確に一致させることに優れています。Dorisは、ドキュメントとクエリ間の関連性スコアを計算するために、構造化テキスト検索に適したBM25アルゴリズム(デフォルト)を使用します。
- ベクトル検索(セマンティック検索):テキストをベクトル(埋め込み)に変換し、機械学習モデルを用いてクエリと文書間のセマンティックな類似度を計算します。クエリの意図とコンテキストを理解するのに優れています。
- 融合メカニズム: 特定のスコアリングおよびランキング手法 (相互ランク融合/RRF や凸型組み合わせ/CC など) を使用して、2 つの方法の検索結果を統合し、語彙の関連性と意味の関連性のバランスをとります。
2. 技術実装アーキテクチャ
Doris ハイブリッド検索は、次の技術コンポーネントとワークフローに依存しています。
1. フィールドタイプのサポート
- テキストフィールド: 単語セグメンテーションを通じて逆インデックスを生成し、全文検索をサポートします。
- ベクトル場:モデルを使用してテキストをベクトル型ストレージに変換します
2. 総合指数
- テキストフィールドとベクターフィールドの両方の保存をサポート
- ハイブリッドクエリ機能を有効にする
3. クエリ実行プロセス
- 辞書クエリ: 一致クエリを使用して、キーワードに一致するドキュメントを取得します (BM25 アルゴリズムに基づく)
- ベクトル クエリ: knn クエリまたは ANN インデックスを使用して、意味的に類似したドキュメントを取得します (コサイン類似度などに基づいて)
- ハイブリッドクエリ: 2つのクエリを並列に実行し、融合アルゴリズムを通じて結果を結合します。
4. 結果融合戦略
- RRF(リバースランキングフュージョン):さまざまなクエリ結果における文書のランキングに基づいて総合スコアを計算し、複数の検索方法で上位にランクされている文書を強調します。
- CC(凸結合):BM25とベクトルクエリスコアを加重和で統合し、手動で重みバランスを調整する
- script_score または Rerank モデルによる結果ランキングのさらなる最適化をサポートします。
講演者:

リー・ハッペン|SelectDB シニアRD
Apache Doris PMCメンバー
📅 7月26日 14:00 – 16:45
講演テーマ: 大規模言語モデルの CI/CD パイプラインへの統合 | Apache プロジェクトのコード品質向上のための実践事例
シェアタイム:7月26日 14:00~14:30
トピックの紹介:本講演では、Apacheプロジェクトのコード品質とセキュリティを向上させるために、大規模言語モデル(LLM)をGitHub Actionsに体系的に統合する方法について考察します。内容はapache/brpc#2911の実際の事例に基づいています。コード品質を確保するために、AIエージェントを設計、実装、デプロイするための、実践的で低オーバーヘッドな戦略を探している開発者やメンテナーに特に役立ちます。
私たちは、聴衆に次の点について考えてもらうように導きます。
- 人間と機械のコラボレーション:従来の「副操縦士」モデル(人間主導、同期)とパイプラインにおける非同期AIエージェントワークフローを比較し、効率性の向上とトレードオフを強調する
- 実践: RAG、微調整、MCP に依存せずに、LLM を使用して、リソース制約下でのコード堅牢性スキャンや CVE 検出などの対象タスクを実行する方法を学びます。
講演者:

Yi Yuan|ソフトウェア開発者
CNCF kepler プロジェクトのメンテナー。主にプロジェクト パイプライン関連の作業を担当。
講演テーマ:ランス|マルチモーダルAIの最先端に向けたデータフォーマット
シェアタイム:7月26日 14:30~15:00
トピックの紹介:マルチモーダルモデルの最先端の学習には、動画、画像、長文テキストなどを含むPBレベルのマルチモーダルAIデータの処理が必要です。新たなAIデータの複雑さと規模は、既存のデータインフラストラクチャにとって課題となります。
ApacheライセンスのLanceフォーマットは、Apache ArrowとApache Datafusionをベースに構築されており、コア部分はRustで記述されています。開発チームは、Apache Hadoop、Apache HBase、Apache Iceberg、Apache Arrow、Delta LakeのPMCメンバーで構成されています。Lanceフォーマットは、AIに特化した新しい列指向のストレージフォーマットおよびテーブルフォーマットで、Apache Parquet、Apache Iceberg、Apache Hudiプロジェクトから深い影響を受けています。Lanceフォーマットの顕著な特徴は、ランダムアクセスとゼロコストのスキーマ進化であり、これらはAIエンジニアに人気の高い2つの機能です。これらの特徴は、Apache Parquet、Apache ORC、Apache Icebergとは異なるLanceの特徴であり、マルチモーダルAIの特徴エンジニアリングやトレーニングにより適しています。
Lance フォーマットは、MidJourney、WorldLabs、Runway ML、Character AI など、多くの大手 AI 企業に採用されています。
このカンファレンスは、LanceDB CTO の Xu Lei 氏 (Apache Hadoop PMC メンバー) と ByteDance Volcano Engine の専門家 Yang Hua 氏 (Apache Hudi PMC メンバー) が共同で発表します。
- 最先端のマルチモーダルAI企業におけるワークロードを支えるインフラストラクチャの課題
- Lanceフォーマットの背後にあるコア設計原則
- ByteDance Volcano EngineがLanceフォーマットに基づいてLanceデータレイクを構築し、世界トップクラスのAI企業をサポートする方法
講演者:

徐磊|CTO @ LanceDB
LanceDBの最高技術責任者。Apache Hadoop/HDFS PMCのメンバー。以前はCruise Automationで機械学習プラットフォームおよびデータインフラストラクチャチームを率いていた。

Vino Yang: Volcano Engine 技術専門家、Lance コミッター。
Volcano Engine の技術専門家、Lance コミッター。Apache Hudi/Kyuubi PMC メンバー。
講演テーマ:量子AI|超知能時代の幕開け
シェアタイム:7月26日 15:00~15:30
トピック紹介:量子コンピューティングと人工知能(AI)の統合は、古典コンピューティングの限界を打ち破り、超知能の時代を到来させようとしています。量子強化モデルが指数関数的な学習を実現し、複雑な問題を数秒で解決し、意思決定プロセスを再定義できるようになると、AIが人間の理解を超える新たな時代が到来するのでしょうか?
この講演では、以下の点に焦点を当てて人工知能の次のフロンティアを探ります。
量子機械学習(QML):AIが量子力学を活用して前例のない問題解決能力を実現する方法
量子ニューラル ネットワーク: AI は想像を絶する規模で学習できるか?
量子重ね合わせと並列性: AI は順次推論から多次元思考へと進化するのでしょうか?
理論的インスピレーション: 量子 AI は人工超知能 (ASI) の基礎となるでしょうか?
AI 主導の科学的発見、ポストヒューマン知能、そして潜在的な知識の特異点へと向かう中で、この講演では従来の AI パラダイムに疑問を投げかけ、AI がもはや人間のように考えず、人間よりもはるかに優れた思考をできるようになる可能性を探ります。
講演者:

Prakul Hiremath|ヴィシュヴェシュヴァラヤ工科大学 技術学部 学士課程学生、BIOLOOP CEO兼創設者
プラクル・ヒレマスは、インドのベラガビ工科大学(VTUベラガビ)の研究者、技術者、そしてイノベーターであり、人工知能、サイバーセキュリティ、システム最適化の交差点で研究を行っています。人工知能、コンピューティングシステム、そして未来のテクノロジーへの深い情熱を持ち、AIを活用したサイバーセキュリティ、医療信号解析、インダストリー4.0のイノベーションに関する研究に積極的に取り組んでいます。
彼の研究は、AIを活用した脅威検知、予測分析、そして高性能コンピューティングを網羅し、特にインテリジェントシステムと自律的意思決定の限界を押し広げることに重点を置いています。また、AIを活用した生命、ポストヒューマン知能、そして知識の進化についても探求しており、未来のテクノロジーへの画期的な洞察を提供することに尽力しています。
AIとサイバーセキュリティの研究に加え、プラクル氏はバイオテクノロジーと人工知能を融合させ、持続可能性、ヘルスケア、産業オートメーションの分野における最先端ソリューションを開発する革新的な研究プロジェクト「Bioloop」にも積極的に参加しています。Bioloopは、生物学的プロセスと技術的プロセスを最適化する新世代のインテリジェントエコシステムを構築することで、バイオAIシステムに革命を起こすことを目指しています。
Community Over Code Asia 2025 で、Prakul 氏は AI の止められない台頭、それがもたらす課題、そしてテクノロジー、社会の発展、人間の知性の将来に対する AI の深遠な影響について議論します。
トピック: MCP を使うべきか、使わないべきか?オープンプロトコルを用いた構成可能な AI システムの設計
シェアタイム:7月26日 15:45~16:15
トピック紹介:AIアプリケーションの多様化に伴い、カスタマイズされたツールやサービスのポイントツーポイント統合は、断片化と高いメンテナンスコストという問題を引き起こしています。オープンプロトコルであるモデルコンテキストプロトコル(MCP)は、標準化された検出、呼び出し、インタラクションプロセスを通じて、AIエージェントと外部ツール間の統一された接続方法を確立します。この共有は、現在のAIエコシステムにおける相互運用性の課題を提示します。llama-nexusを例に挙げ、ネイティブに開発されたMCPサービスを通じて、AIシステムの構成可能性と柔軟なオーケストレーションを実現する方法を示します。最後に、AIシステムの相互接続と相互運用性の促進、統合の複雑さの軽減、イノベーションの促進におけるオープンプロトコルの戦略的意義、そして構成可能なAIエコシステムの将来の発展方向について議論します。github.com/LlamaEdge/llama-nexus
講演者:

Miley Fu|CNCFアンバサダー、オープンソースランタイムWasmEdge創設メンバー
Mileyは、開発者がオープンソースプロジェクトを構築し、貢献できるよう支援することに情熱を注ぐ開発者エバンジェリストです。KubeCon+Open Source Summit 2024とAI Dev China 2024の共同議長兼基調講演者を務めています。CNCFサンドボックスのWasmEdgeランタイムの創設メンバーであり、6年以上プロジェクトに携わってきました。KubeCon、KCD、CloudDay Italy、DevRelCon、Japan Open Source Summit、AWS User Group、Global AI Note、KubeDay Singaporeなどのイベントで講演を行っています。Mileyは技術コンテンツの執筆や、KCD Beijing、KCD Shenzhen、WebAssembly & Rust Taipei、Singaporeなどのミートアップを含む開発者イベントの企画運営も行っています。
スピーチのテーマ: オープンソース AI ゲートウェイが必要な理由
共有時間:7月26日 16:15~16:45
トピック紹介:AIアプリケーション爆発の時代において、APIトラフィックは急増していますが、コスト管理、セキュリティコンプライアンス、マルチモデル管理などの課題は依然として存在します。世界で最も活発なオープンソースAPIゲートウェイであるApache APISIXは、2025年にAIゲートウェイ機能を正式にリリースし、開発者と企業にワンストップソリューションを提供します。
APISIX AI Gateway を選ぶ理由は何ですか?
統合 AI サービス管理: OpenAI、Deepseek、QWen などの主流の大規模モデルに対するリクエストをシームレスにプロキシし、ベンダー ロックインを回避し、動的なトラフィック オーケストレーションを通じてコストとパフォーマンスを最適化します。
セキュリティとコンプライアンス: 組み込みの AI 保護プラグイン (悪意のある入力をフィルタリングする ai-prompt-guard やトークンベースのレート制限を実装する ai-rate-limiting など) により、データのプライバシーとコンプライアンスが確保されます。
開発者ファーストのエクスペリエンス: ホット リロード プラグイン、多言語サポート (Java/Python/Go)、マイクロサービスおよび Kubernetes エコシステムとのネイティブ統合。
開発者でも企業でも、APISIX AI Gateway は AI アプリケーションの実装を加速し、イノベーションの可能性を最大限に引き出します。
講演者:

ワン・ユアンシェン|API7.ai、CTO
Apache APISIX PMC メンバー、Apache Foundation メンバー。
🌟 下のQRコードをクリックしてスキャンし、チケットを購入してください

数量限定ですので、ぜひご参加ください👆
