命中率は91.74%に達します!東南大学が太陽電池の欠陥検出モデルを提案し、神経構造探索を初めて導入

特色图像

世界中から吹く「グリーン開発と低炭素変革」という東風に乗り、21世紀に入ってから、太陽光発電(PV)産業は世界を驚かせるスピードで急速に発展しています。我が国において、太陽光発電はかつてない活況を呈しています。国家エネルギー局が2023年4月に発表した同年1月から3月までの全国電力産業統計によると、同年3月末時点で我が国の太陽光発電の累積設置容量は水力発電を上回り、第2位の電源となった。国で。

太陽光発電の大規模な利用に伴い、太陽光発電の安定供給と持続可能な発展をどのように確保するかが業界研究の重要なテーマとなっています。太陽光発電モジュールは太陽光発電の基本ユニットであり、長い生産チェーンや複雑なアプリケーションシナリオなどのさまざまな外部要因の影響を受け、これらの欠陥のあるモジュールが実際に稼働すると、損傷を受けやすくなります。電源システム全体の電力低下を引き起こし、さらには安全上の問題を引き起こす可能性が非常に高くなります。したがって、太陽光発電の現場でのメンテナンスと故障診断の要件はますます厳しくなっています。

現在、より伝統的な PV の欠陥検出方法には、電流電圧 (IV) 曲線、赤外線サーモグラフィー (IRT) などが含まれます。しかし、認識精度に限界があるため、上記の方法はどれも、マイクロクラックなどの潜在的な危険因子を効果的に特定できません。 。畳み込みニューラル ネットワーク (CNN) は、高解像度エレクトロルミネッセンス (EL) イメージングと組み合わせた強力な特徴キャプチャ機能により、PV 欠陥検出の主流の方法になりつつあります。ただし、CNN ベースのモデル パラメーターは通常大きく、ハードウェア リソースに対する厳しい要件があるため、実際の産業プロジェクトで大規模に導入するのは困難です。

産業分野における欠陥検出の精度と速度の要件を同時に満たすために、東南大学オートメーション学部の Zhang Jinxia 教授のチームは、ニューラルアーキテクチャ検索(NAS)と知識蒸留(Knowledge Distillation)に基づく新しい軽量で高性能の太陽電池エレクトロルミネッセンス(EL)画像欠陥自動検出モデルを提案した。

現在、研究成果は「ニューラルアーキテクチャ検索と知識蒸留に基づくエレクトロルミネッセンス画像における太陽電池欠陥検出のための軽量ネットワーク」と題してarXivで公開されている。

研究のハイライト:

* 91.74% という高い精度を備えた太陽電池欠陥検出用の軽量モデルを提案。
* 自動化された軽量ネットワーク設計のために太陽電池セルの欠陥検出の分野に初めて NAS が導入され、手動設計の作業負荷が軽減されます。
※知識蒸留の導入により、さまざまな事前知識が活用され、欠陥のある太陽電池セルの特定能力の向上にこの設計の有効性が実験で証明されています。

論文リンク:
https://arxiv.org/abs/2302.07455
公式アカウントをフォローし、バックグラウンドで「太陽電池」と返信すると論文をダウンロードできます

データセットとデータ拡張

この研究のデータセットは、単結晶タイプと多結晶タイプの両方を含む、解像度 300 x 300 ピクセルの 2,624 個の太陽電池 EL 画像を含む公開太陽電池データセットです。研究チームは、サンプルを機能サンプルと欠陥サンプルに分ける閾値として0.5を使用し、その中から75%画像、つまり1,970枚の画像をトレーニングセットとしてランダムに選択し、残りの654枚の画像をテストセットとした。トレーニング セットはさらに、検索トレーニング セットと検索テスト セットに分かれます。すべての画像は 150 x 150 ピクセルにサイズ変更されます。

データセットのパーティショニング

データ拡張とは、元のデータからより多くの表現を取得し、データをわずかに増加させながら元のデータの品質を向上させ、それによってモデルのコストを削減することです。過学習、堅牢性を高めます。データ拡張操作には、ランダムな水平反転、ランダムな垂直反転、(-2°、2°) の範囲内のランダムな回転、{0°、90°、180°、270°} の範囲内のランダムな回転、およびランダムが含まれます。アフィン変換

本研究で提案したモデルはNormalセルとReductionセルを積層したものであり、探索アルゴリズムにより得られた内部構造を以下の図に示します。

公開PVデータセットの検索に基づく内部構造

NASと知識の蒸留に基づいた欠陥検出手法

軽量ネットワーク設計アーキテクチャを次の図に示します。研究者らは、NAS アルゴリズムを通じて設計された探索空間内に軽量ネットワークを自動的に取得し、既存の事前学習済み大規模モデルが知識蒸留を通じて取得した事前知識を最大限に活用してモデルのパフォーマンスを向上させました。

軽量ネットワーク設計アーキテクチャ

まず、研究チームは連続勾配ベースの NAS フレームワーク DARTS を採用し、DARTS の高速検索特性に基づいて太陽電池欠陥検出用のモデルを自動的に設計し、PV 欠陥の視覚的なマルチスケール特性をさらに検討し、設計しました。さまざまなサイズの欠陥の特徴認識を強化するための適切な検索スペース。

軽量の欠陥分類ネットワーク用に設計された検索スペース。

軽量ネットワークで使用されるサーチスペースは、主に 5 つの通常セルと 4 つのリダクション セルの 2 つの単位構造を積み重ねて構成されます。通常セルは入力サイズを維持するように設定され、リダクションセルはダウンサンプリング機能を持つように設定されます。上の図に示すように、各ユニットは、最初の 2 つのユニットとは異なるスケールを持つ 2 つの特徴を融合します。最初の通常セルは、同じ特徴を 2 つの入力として受け取ります。

軽量ネットワークの詳細構造

最初の 3 つのリダクション セルはダウンサンプリングとチャネル拡張を実行し、最後のリダクション セルのチャネル数は変更されません。提案された軽量ネットワークは、入力太陽電池を機能的または欠陥のあるものとして分類します。

第二に、知識の蒸留は、教師-生徒モデルを使用して教師モデルから生徒モデルに知識を転送する最も効果的なモデル圧縮方法の 1 つです。事前トレーニング済みモデルの事前知識を利用できないネットワーク アーキテクチャでは、Teacher ネットワークの知識を学習することでパフォーマンスを向上させることができます。この実験では、軽量ネットワークは最初からしかトレーニングできないため、知識の蒸留を使用することで、事前の知識をトレーニングにさらに活用できます。

研究者らは、太陽電池の欠陥検出タスクに対する蒸留効果を高めるために、注意情報、特徴情報、ロジット情報、タスク指向情報という 4 つの異なる知識事前情報を転送しました。

知識の蒸留の概要

卓越したモデル性能

研究チームは、ネットワーク アーキテクチャの有効性をさらに証明するために、提案された軽量モデルを Teacher モデルやその他の研究と比較し、プライベート データ セットでテストしました。

研究チームは、同じ 200 エポックで、手動で設計された 6 つのニューラル ネットワークと教師モデルを公開データ セットと比較しました。結果は次の図に示されています。

精度/バランス精度/精度/リコール/F1スコアの比較

結果は次のようになります。この研究で提案された軽量モデルの精度は、テスト セット上で 91.74% に達し、教師モデル レベルの 1.22% をも上回りました。同時に、この研究で提案されたモデルは、いくつかの古典的な大規模モデルよりもパラメータが小さく、使用するリソースが少なく、実際の端末デバイスへの展開が容易です。

上の図は、欠陥のある太陽電池セルと正常に機能している太陽電池セルを特定するモデルの精度の比較を示しています。欠陥のある太陽電池セルを特定する際の研究者が提案したモデルの精度は、他の方法をはるかに上回っています。

このことから、次のように結論付けられます他の手動で設計されたモデルと比較して、研究チームが提案したモデルは、NASアルゴリズムを通じて自動的に検索することができ、作業負荷が軽減されるだけでなく、比較的軽量なアーキテクチャの下でより高いパフォーマンスを実現し、提案された方法の有効性を証明しました。

提案されたモデルの性能をさらに評価するために、研究チームは、表 4 に示すように、単結晶または多結晶 PV での性能比較も提供しました。

左の表: ELPV 公開データセット内の単結晶太陽電池のみと、同じデータ拡張条件における他の方法との比較
右の表: 同じデータ拡張条件下での、ELPV 公開データセット内の多結晶太陽電池のみと他の手法との比較

単結晶太陽電池では、提案されたモデルのすべての指標が最高レベルに達しており、扱いがより難しい多結晶モデルに関しても、このモデルは他のモデルをはるかに上回っています。

効率性と汎化能力

端末デバイスへの展開には、モデルの規模と計算量を総合的に考慮する必要があり、効率をテストするために、研究チームは CPU プラットフォーム (Intel i9-10980XE 24.75M キャッシュ、3 GHz) でモデルを評価しました。

CPU プラットフォームでの効率の比較

総合的な評価により、このモデルは他の小型モデルや、さらには大型の古典的なモデルよりもはるかに優れていることがわかりました。この軽量モデルは、一部の一般的な低電力組み込みデバイスの導入要件を満たすことができます。Raspberry Pi-4B (4GB、15W、9~10 GFLOPS) や NVIDLA Jetson Nano (4GB、10W、7.368 GEFLOPS FP64) など。

さまざまなデータ ソースでのモデルの汎化パフォーマンスを検証するために、研究チームはプライベートの太陽電池データ セットでモデルをトレーニングしました。ピクセル解像度 256 x 256 の 8,580 枚の画像が、6 x 10、6 x 12、および 6 x 24 の 3 つの仕様の太陽電池から抽出されました。これには、482 個の欠陥サンプルと 8,089 個の正常に機能するサンプルが含まれます。

結果は次のようになります。このモデルは、教師モデルよりもバランス精度と欠陥サンプル精度がそれぞれ約 2.3% と 5.7% 高くなります。他の方法と比較すると、その差は大きいです。欠陥サンプルに対するモデルの精度は、特に現実のシナリオで 94.26% に達し、より優れた欠陥識別機能を示しています。以下に示すように:

100年前に始まった太陽光発電は、今でもグリーンエネルギーの「最愛の人」です

新エネルギーの代表格である太陽光発電技術は、実は100年以上前から研究が進められてきました。 1839年、フランスの物理学者ベクレルが初めて発見した光起電力効果その後、各国の科学者による研究と努力が続けられ、1954年にようやく実用的な太陽電池が誕生しました。今日、太陽光発電産業は再び世界的なグリーン開発のトレンドを利用しており、特に国が「ダブルカーボン」目標を明確に提案して以来、太陽光発電産業の発展には明るい未来があります。

これは、国家エネルギー局が少し前に発表した2023年の全国電力産業統計からも分かる。データによると、12月末現在、国内の累積発電設備容量は約29億2,000万キロワットで、前年比13.9%増加しており、このうち太陽光発電設備容量は年間約6億1,000万キロワットとなっている。前年比55.2%増加。

政策の観点から見ると、2019年5月30日国家エネルギー局は「2019年風力発電・太陽光発電プロジェクトの建設に関する事項に関する通知」を発表した。その中で、補助金なしで手頃な価格のインターネットプロジェクトの構築を促進することを優先し、その後、国の補助金が必要なプロジェクトの競争的配分を行うことが明らかにされた。このことは、我が国の太陽光発電産業が安定発展の成熟期に入ったとはいえ、今後も太陽光発電産業の発展促進が国内のエネルギー構造の転換を実現する上で重要な課題であることを示している。

2023年、国家エネルギー局、国家発展改革委員会、その他の部門はエネルギー事業に関する多数の文書を相次いで発行した。彼ら全員が、太陽光発電が 2023 年のエネルギー業界の主要な方向性になることを明らかにしています。

この研究は、産業レベルから太陽光発電産業の発展に朗報をもたらし、Zhang Jinxia教授のチームの研究結果は、特にNASの導入と知識の蒸留など、実用化の面から太陽電池の欠陥を検出するための効果的なツールを提供します。シナリオ設計モデルは新しいアイデアを提供し、太陽光発電分野での深層学習の応用について業界に新たな啓蒙をもたらし、それによって技術と産業のより良い統合が可能になることが期待されます。