HyperAI超神经

ガンマスペクトロスコピーによる放射性元素検出のためのPython機械学習モデル前回の記事では、現代のスインチレーション検出器を使用してガンマスペクトルから放射性物質の存在と種類を特定できる方法について解説しました。今回は、このスペクトルデータを使って機械学習モデルを作成し、放射性元素を自動検出する手法について紹介します。 1. ガンマスペクトルとは？ガンマスペクトルは、物体から放出されるガンマ線のエネルギー分布を示すグラフです。通常のガイガーカウンターでは、放射性粒子の数しか取得できませんが、スインチレーション検出器は粒子のエネルギーを測定できます。これは重要な違いであり、異なる放射性材料は異なるエネルギーのガンマ線を放出することから、それぞれ特有の「指紋」を持つことがわかります。例えば、中国のショップで購入したペンダントは、放射能レベルが背景放射線の約12倍であり、サーストロニウム-232を含むことが明らかになりました。また、岩石であるウラノナイトは、ウラン酸化物を多く含んでおり、ウラニウムが検出されましたが、サーストロニウムは含まれていませんでした。 2. データの収集データ収集の最初の課題は、サンプルを集めることです。私は原子核研究施設に属していないため、セシウムやストロンチウムのような校正済みのテスト源にはアクセスできません。しかし、アメリピウム（スモークデテクター）、ラジウム（1960年代以前の時計の文字板）、ウラン（1950年代以前のガラス製品）、サーストロニウム（アマゾンから購入可能なトングステンロッド）などが合法的に入手可能であり、それらを使用してデータを収集しました。次に、各サンプルのスペクトルデータを10〜20分間収集し、JSONファイルに保存しました。これには1つのPythonスクリプトを使用し、Radiacode 103Gスインチレーション検出器からデータを読み取りました。 3. モデルの訓練収集されたデータは、JSON形式で保存されます。各ファイルには1,024チャネルのスペクトルデータと校正パラメータが含まれています。これらのデータをMatplotlibで可視化し、特徴量を抽出しました。特徴量抽出では、以下の手順を踏みました：ノイズ低減：Savitzky-Golayフィルターを適用してノイズを低減しました。正規化：データを0〜1の範囲に正規化しました。データ拡張：元のスペクトルにノイズを追加することで、より多くの合成サンプルを作成しました。次に、これらの特徴量を使用して機械学習モデルを訓練しました。具体的には、XGBoostの勾配ブースティングモデルを使用して、最適なハイパーパラメータを探しました。最終的に、以下のように設定しました：学習率: 1.0 ツリーの最大深度: 1 推定器の数: 9 訓練は成功的に行われ、99.474%の精度を達成しました。 4. 実時間でのテスト訓練済みモデルを実際のRadiacodeデバイスで使用して、放射性元素をリアルタイムで予測しました。Pythonスクリプトは1分ごとにスペクトルデータを読み取り、モデルを使用して予測を行います。背景放射線やウランガラスなどのテストサンプルに対して正しい予測が得られました。例えば、1950年代に製造されたヴィンテージウォッチは、ラジウムペイントを文字板に含んでいましたが、放射線量は安全性基準内の水平でした。付属情報読者の中にはRadiacodeデバイスを持っていない人もいると思いますが、Kaggleで全データセットが公開されているので、自分のモデルを訓練してテストすることができます。Radiacodeは比較的安価で高性能なデバイスであり、電子部品の進歩により一般ユーザーでも使用が可能になっています。詳細なソースコードは私のPatreonページで公開されており、読者の支援により将来のテストや機械学習モデルの改善にも活用されます。また、LinkedInを通じて定期的に短い投稿を行っていますので、興味があればフォローしてください。このプロジェクトに関するさらなる改善点としては、より多くのデータサンプルや同位体を追加し、放射線量を特徴量として追加すること、そして他のモデルタイプ（ベクトル検索や深層学習）の検討があります。この記事ではRadiacodeを用いて放射性元素検出のための機械学習モデルを作成・訓練・実時間テストしたプロセスを解説しました。機械学習を使って放射性物質を検知することは、安全性や科学研究において重要な役割を果たします。ありがとうございます。

Related Links