Command Palette
Search for a command to run...
評価精度は99%を超えました!YOLOv11に基づく陶磁器分類インテリジェントフレームワークは、視覚モデリングと経済分析を組み合わせて、文化遺産の分類と価値推定を実現します。

香港で開催されたPoly Auctionsの2025年春季オークションでは、清朝雍正時代の「誕生祝」模様が施された「花瓷(バラ)と梅竹文様の琺瑯鉢」が、予想価格の880万香港ドルを上回りました。明朝永楽時代の「青白梅花瓶」(竹、石、芭蕉の葉)は、クリスティーズの2025年香港春季オークションで、驚異の7,812万5,000香港ドルという高値で落札されました。また、サザビーズ香港の2017年秋季オークションでは、北宋時代の汝窯青磁釉洗面器が30件以上の入札の末、2億6,000万香港ドルで落札されました。プレミアムを含めると、なんと2億9,400万香港ドルという高値で落札されました。この洗面器は匿名のアジア人個人コレクターの手に渡り、当時の中国磁器オークションの世界記録を樹立しました。
陶磁器の文化遺産が世界中で大きな経済的可能性を秘めていることは容易に理解できる。。同時に、陶磁器は人々の生活のあらゆる分野に浸透し、一般的な食器やタイルに加え、電子製品、医療機器・インプラントなどの分野にも進出しています。統計によると、2017年から2023年にかけて、中国の日用陶磁器の年間生産量は491億個から679億個に増加すると予想されています。世界のセラミック市場規模は、今後も年平均成長率(CAGR)4.4%で拡大し続けると予想されています。陶磁器商品取引の継続的な成長により、膨大な評価ニーズが生まれていますが、従来の陶磁器分類方法では、この作業への非専門家の参加が制限されています。
陶磁器の分類に関する研究の実践をレビューし、従来の陶磁器の分類方法には、適応性や解釈性の欠如などの制限がしばしばあります。経験的鑑定には統一された定量的な基準がなく、「目利き」に大きく依存しています。認識の違いにより、分類が曖昧になる場合があります。同じ陶磁器でも、専門家によって評価が大きく異なる場合があり、模造品の鑑定は不十分です。X 線蛍光法、熱ルミネッセンス年代測定法、スペクトル分析法などの正確な識別は、複雑な機器に大きく依存します。
ディープラーニングとコンピュータービジョン技術の急速な発展により、特徴抽出、画像セグメンテーション、画像強化などの方法に基づくセラミック分類がますます一般的になりつつあります。現在、陶磁器の自動分類の研究では、畳み込みニューラルネットワーク(CNN)、転移学習、カプセルネットワークの使用を実現し、視覚属性を使用して陶磁器を自動的に分析しています。通常、基本的なテクスチャ認識に限定されており、陶磁器の歴史や美観といった評価に影響を与える文化的要因を計算フレームワークに組み込むことは困難です。また、専門家ではない愛好家でも操作できる分類ツールも不足しています。
この文脈では、マレーシア・プトラ大学とニューサウスウェールズ大学シドニー校の研究チームは、高い予測性能と解釈可能性を兼ね備えたYOLOv11モデルに基づくインテリジェントフレームワークを共同で提案しました。視覚モデリングと経済的推論を組み合わせて、陶磁器工芸品の自動分類と市場価値の推定を行います。改良された YOLOv11 モデルは、磁器の工芸属性をランダムフォレスト分類器に入力し、クリスティーズ、サザビーズ、ポリオークション、チャイナガーディアンなどの機関からの長年のオークションデータに基づいて陶磁器の文化遺物を評価できます。
研究成果は「陶磁器工芸品の分類と市場価値予測のためのディープラーニングと機械学習の統合」というタイトルでネイチャー・パートナー・ジャーナルに掲載されました。
研究のハイライト:
* 芸術的特徴と市場データを統合して陶磁器工芸品を正確に評価するための堅牢なデータ駆動型フレームワークが確立され、陶磁器の分類と評価に対するより体系的かつ客観的なアプローチが提供されています。
* YOLO モデルのセラミックの種類の検出と分類のパフォーマンスを強化し、その後のセラミックの分類と評価のタスクにおける YOLO モデルの出力を最適化しました。
* YOLO モデルによって抽出された特徴と構造化されたオークション データを組み合わせて、ランダム フォレスト分類器を使用して価格を予測し、予測結果の精度と解釈可能性を向上させます。

用紙のアドレス:
https://www.nature.com/articles/s40494-025-01886-6
公式アカウントをフォローし、「ceramics」と返信すると、完全なPDFが手に入ります。
AIフロンティアに関するその他の論文: https://go.hyper.ai/owxf6
3段階の統合:データ注釈、セラミック分類、価格予測
この研究で構築された分類フレームワークは、データ注釈、YOLOv11 モデルに基づくセラミック分類、ランダムフォレスト回帰モデルに基づく価格予測という 3 つの連続した段階で構成されています。

データセットのアノテーション: AI前処理と専門家による修正を組み合わせたハイブリッドアノテーションソリューション
本研究では、形状、模様、製造工程の3層構造の陶磁器分類フレームワークに基づき、高品質な陶磁器画像データセットを構築しました。このデータセットには、20種類の窯焼きシステムと装飾技法を網羅した8,213枚の高解像度画像が含まれており、学習データ、検証データ、テストデータに7:2:1の比率で分割されています。
画像データは主に次の 3 つのチャネルから取得されます。1位はクリスティーズ、サザビーズ、ボナムズ、チャイナ・ガーディアン、保利オークション、北京栄宝寨などのオークションハウス(42.6%、3,500点)。2位は故宮博物院、大英博物館、メトロポリタン美術館、中国国家博物館、国際博物館会議データベースなどの博物館および文化財データベース(24.3%、2,000点)。3位は陶芸店および現場の写真作品(33.1%、2,713点)で、主にタオバオ、仙遊、アマゾン、Pixabay、ウィキメディア・コモンズなどのプラットフォームや個人コレクターからのものとなっている。
この研究では、Scrapy フレームワークを使用した自動 Web クロールなどのハイブリッド データ収集方法を採用し、公開データベースから構造化されたセラミック画像データを抽出しました。
データセットの注釈付けフェーズでは、主に AI 自動収集と専門家の修正を組み合わせたラベリング戦略を使用して、高品質のセラミック画像データセットに注釈を付けます。
* AIによる事前ラベル付け:YOLO 事前トレーニング済みモデルを使用して初期材料を検出し、セラミックのアウトラインの境界ボックスを自動的に生成します。
* 手動による注釈と検証:陶磁器の識別専門家とデータ研究者は、LabelImg ツールを使用してラベル付けの結果を最適化し、職人技のスタイル、オブジェクトの形状、装飾パターンに基づいて 3 つのレベルに分類します。



モデルの堅牢性をさらに向上させ、汎化性を評価するため、研究チームは5分割交差検証とK平均法クラスタリングを用いて、様々な陶器の形状に合わせてアンカーボックスのサイズを最適化し、検出精度を向上させました。また、勾配更新を安定化させるために巡回学習率スケジューラを適用し、過学習を防止するために早期停止とモデルチェックポイントを組み合わせました。さらに、空間汎化性を高めるために、Mosaic、GridMask、MixUpといった画像拡張技術を用いて検証を行いました。
YOLOv11モデル: 評価ロジックメカニズムを形成するためのアテンションモジュールの導入
AI で前処理されたデータセットに基づいて、改良された YOLOv11 モデルは、陶器の形状、パターン、製造プロセスに応じて画像を分類します。改良された YOLOv11 モデル アーキテクチャは、ResNet バックボーン ネットワーク、複数の機能強化モジュール、パターン、形状、職人技などのセラミック特性に最適化された検出ヘッドを統合しています。

改良されたYOLOv11モデルは、ResNet50をバックボーンネットワークとして採用しています。本研究では、陶器の視覚的特徴の表現と計算効率を向上させるため、以下の3つの拡張モジュールをモデル構造に導入しました。
* C3k2-EIEMモジュール:このモジュールには、エッジ情報学習、空間特徴保存、特徴融合戦略という3つの主要コンポーネントが含まれています。エッジ情報を明示的にキャプチャし、空間詳細を保存することで、彫刻や碑文などの細粒度の装飾ディテールの検出を強化し、高解像度の空間詳細を維持します。
* 高速空間ピラミッドプーリング(SPPF):多次元プーリングを実行して、さまざまな次元の陶磁器の視覚的特徴を抽出します。
* クロスステージローカルアテンションメカニズム(C2PSA):重みを適応的に調整することで、画像の背景の干渉が軽減され、重要な装飾領域に焦点が当てられ、釉下絵や空彫りなどの複雑な装飾に対するモデルの感度が向上します。
注意強化モジュールの統合により、陶磁器の高価値特徴を識別するモデル能力が向上します。分類出力を従来の評価ロジックと連携させるため、本研究では勾配加重クラス活性化マッピング(Grad-CAM)を導入し、注意強化モジュールの視覚化を生成してその有効性を検証しました。
ランダムフォレスト回帰モデル:視覚的特徴から金銭的価値評価まで
価格予測段階では、ランダムフォレスト(RF)ベースの回帰モデルを構築し、分類ベースの価格予測手法を採用することで、抽出された視覚的特徴に基づいて陶磁器製品の収集価値を体系的に予測しました。ランダムフォレスト回帰モデルによる収集された視覚的特徴の分類プロセスは、以下の4つのポイントに分かれています。
* カテゴリー特性:ワンホットエンコーディングは、装飾パターンや工芸スタイルなどの分類機能を処理し、視覚的な特徴を機械が読み取り可能なデータ表現に変換するために使用されます。
* オークション価格の正規化と外れ値の処理:2000年から2024年にかけて、6大オークションハウスで行われた陶磁器文化財の取引価格は、世界銀行や経済協力開発機構(OECD)などの国際金融データベースが公表している過去の為替レートと消費者物価指数(CPI)データに基づき、2024年の米ドル(USD)に換算・正規化されています。オークション価格データにおける外れ値を除去するため、四分位範囲(IQR)法が用いられています。
* 定量的特性:形状、装飾模様、工芸の複雑さなどの独立変数と、価格帯などの従属変数が含まれ、すべての定量的特性は最小最大尺度法を使用して正規化されました。
* データのエンコーディング:One-Hot Encoding (OHE) を使用して構造化データ エンコーディング戦略を実装し、数値以外の離散値をバイナリ値に変換して、人工的な数値関係を導入せずに回帰モデルでキャプチャできるようにします。
回帰モデルをトレーニングする場合、RF 分類モデルはプロセスをデータの前処理、特徴抽出、アンサンブル トレーニング、予測の 4 つの段階に分割します。トレーニング プロセス中に、複数の決定木が構築され、各決定木はデータのブートストラップ サンプルに基づいてトレーニングされ、データの分散が削減されます。

研究成果:YOLOv11とRFデュアルドライブ、モデル評価精度が向上
本研究では、改良されたYOLOv11モデルとYOLOv11モデルのパフォーマンスを評価し、強化された機能モジュールに対して5段階のクロス検証を実行し、ランダムフォレスト回帰モデルの評価ロジックと精度などのパフォーマンス指標を評価しました。
まず、改良されたYOLOv11モデルとセラミック分類におけるYOLOv11モデルの性能評価結果主要な検出指標には、平均精度(mAP)、再現率、適合率、および最高F1スコア(Best-F1)が含まれます。実験結果によると、改良されたYOLOv11モデルの全体的な検出精度は向上し、形状や釉薬の詳細における偽陰性の検出が減少し、最高F1値は2%によって向上しました。精度はわずかに低下しましたが、偽陽性と偽陰性の結果のバランスをとることで、モデルの汎化能力が向上しました。

C3k2-EIEM強化YOLOv11モデルの堅牢性と汎化能力を確保するため、本研究では5分割交差検証を実施しました。その結果、強化された機能モジュールにより、より一貫性のある分類性能が達成されることが示されました。

ランダムフォレスト回帰モデルの性能評価基準には、精度、適合率、再現率、F1スコア、AUCなどがある。 トレーニングセットでは、モデルは99.65%の精度を達成し、適合率、再現率、F1スコアはすべて99.65%に達しました。独立したテストセットでは、モデルは98.91%の精度を達成し、適合率、再現率、F1スコアもすべて98.91%に達し、陶磁器の市場価値カテゴリーの予測において堅牢なパフォーマンスを示しました。

さらに、ランダム フォレスト回帰モデルは、プロセスの複雑さが市場価値に与える影響を重視しており、その評価ロジックは過去のオークションの傾向と一致しています。

AIがデジタル時代の窯の息吹を生む
AI技術は陶磁器や文化財産業に新たな変革をもたらし続けています。シンガポール出身の中国人、李建塵氏が開発した鑑定システムは、これまで時間と労力を要していた陶磁器の分類を超高速化する新時代を切り開きました。約200万点の文化財のデータを網羅するこのシステムは、マルチスペクトルスキャン技術を活用しており、従来の鑑定士による長年の目視検査とは異なり、釉薬中の気泡の形態と製作年代を比較するだけで陶磁器の年代を特定できるようになりました。
特筆すべきは、このシステムはマルチモーダルスペクトルイメージングにより、修復の痕跡を捉えることも可能であることです。2025年5月、李建塵氏のチームは偶然にも、台北国立故宮博物院所蔵の「早春図」の覆土層の下に北宋時代の銘文の痕跡をスキャンし、この文化財の市場価値を2倍に引き上げました。
2024年には、北京大学考古博物館学院考古学実験室と北京易居科技有限公司が協力し、古代陶磁器のトレーサビリティのためのオンライン分析システムを開発しました。このプロジェクトは、100以上の著名な窯跡を含む古代陶磁器の釉薬成分データベースを網羅し、100万点近くの陶磁器の主元素および微量元素データを収集したと報告されています。易居科技が開発した携帯型XRF古代陶磁器インテリジェント検出システムは、非破壊、携帯性、高速性、高精度などの利点を備えており、多くの重要な考古学遺跡で使用されています。
現在、AIは陶磁器における「経験に基づく交渉」という産業生態を絶えず革新し、陶磁器をアルゴリズム主導型へと移行させています。AIと陶磁器の衝突は、文明を継承し、再構築する技術です。デジタル時代の新たな脈動は、千年紀の陶磁器の韻を、より広大な時空次元へと導くでしょう。
参考リンク:
1. https://www.prnewswire.com/apac/zh/news-releases/2025-302429982.html
2. https://www.sohu.com/a/913181430_121393815
3. https://www.sohu.com/a/199794691_687796
4. https://pff.szzit.cn/2d41
5. https://pff.szzit.cn/2d4A
6. https://ourl.cn/G2FTpz