モナシュ大学は、20,000 枚を超える Flickr 画像をクロールして、過去 10 年間に開花した日本の桜の空間的および時間的特徴を再現しました。

1 年前

情報

Yinrong Huang

特色图像

内容の概要:近年、地球規模の気候変動は深刻な状況にあり、それによるバタフライエフェクトは人と自然に深刻な影響を与えています。これに関連して、気候変動が顕花植物にどのような影響を与えるかを理解するために、数百キロメートル、さらには数千キロメートルにわたる開花パターンに関するデータを収集することが、近年の生態学的研究における重要なテーマの 1 つとなっています。しかし、従来の手法ではサンプリング調査に多額の費用と時間がかかるのが一般的で、後方支援にも多くの困難がありました。ジャーナル「フローラ」に掲載された最近の研究は、これらの問題を克服しただけでなく、前例のない詳細を明らかにしました。

キーワード:時空間解析 スマートエコロジー SNSデータ

この記事は、HyperAI Super Neural WeChat パブリック プラットフォームで初めて公開されました~

桜は日本の国花として、大和文化において重要な役割を果たしています。花見は独特の民俗習慣であり、数百年の歴史があります。しかし、日本は緯度が約 20 度あり、場所によって気候が大きく異なります。そのため、桜の開花時期が異なります。桜の季節には、日本の観光ウェブサイトも各地の開花状況を詳細に表示し、観光客が花見の時間を調整できるようにします。近年、気候変動の影響により、日本の桜の開花時期も早まり続けています。

日本の桜の開花パターンを調査し、気候変動が生物季節学に及ぼす影響を理解するために、オーストラリアのモナッシュ大学の研究チームは、Python API とコンピューター ビジョン API を使用して、ソーシャル ネットワーキング サイトを通じて日本の桜の開花状況を監視しました ( SNS)データと実験結果を実際の状況と比較検証しました。この研究は、「ソーシャルネットワークサイト画像の分析によって明らかになった日本全国の桜の開花の時空間的特徴」と題して、雑誌『フローラ』に掲載された。

研究結果は『Flora』誌に掲載されました。

用紙のアドレス:

https://www.sciencedirect.com/science/article/abs/pii/S0367253023001019

実験プロセス: データセットのクローリング、フィルタリング、分析

データセット 

この実験における桜の開花データを収集するプロセスは、次の 2 つのステップに分けられます。

1. ソーシャル ネットワーキング サイトから画像データを抽出します (複数の異なる連続ステージを含む)

2. コンピューター ビジョン API と手動検証方法を使用して、データの相関フィルターを実行します。

API は時間、空間、テキストを同時にフィルタリングする必要があることを考慮して、研究者らはデータ ソースとして Flickr を選択しました。まず、Python API クライアントを使用して、Flickr 上でキーワード「桜」を検索し、地理座標付きの関連画像を収集します。

次に、境界ボックスを 31.186°N ~ 46.178°N、129.173°E ~ 145.859°E に設定します。写真が日本で撮影されたものであることを確認するため。期間は、新型コロナウイルス感染症による世界的な観光客減少のデータへの影響を除外するために、2008 年から 2018 年に設定されています。

次に研究者らは、gadm.org から取得した日本の地理的境界をマスクしてデータをフィルタリングしました。最終的に、80,915 枚の画像が得られました。

2008年1月1日から2018年12月31日まで

Flickrで日本にある「桜」の画像を検索

1月と2月(青)春前の最初の桜の開花を表します。

3月~5月(緑)春の桜の主要な開花時期を記録した写真データの集中を表します。

10月~12月(ピンク)秋、特に11月にピークを迎える興味深い現象が見られます。

Flickr の画像は検索キーワード「桜」で制限されていますが、SNS コンテンツは依然として検索キーワードに誤って関連付けられる可能性があるため、検証が必要です。

この点について、研究者らはすべての画像を Google Cloud Vision AI に送信しました。API は、ビジュアル コンテンツに基づいて各画像の説明的なテキスト ラベルを生成し、それによって個々のデータ ポイントの関連性を自動的に再チェックします。

Google Cloud Vision AI は、事前トレーニングされた機械学習モデルを使用して、事前定義されたカテゴリの画像にラベルを割り当てます。さらに、研究者らは、以下の表に示すように、サンプル データに対して追加の手動チェックを実行しました。

表 1: 東京フィルタリングされたデータセットの各段階の画像データ

列 B:Flickr で「桜」を検索すると、28,875 件の画像が返されました。これらの画像の地理座標はすべて東京エリアの行政区域内にあります。

列 C:このデータセットの Computer Vision API によって返されるテキスト ラベルとその相対頻度。テキスト ラベル フィルターから返された画像のうち、コンピューター ビジョン API によって「桜」とマークされた画像は 21,908 個でしたが、一部の画像には「秋」または「楓」とマークが付けられたため、除外された結果、最終的に 21,633 個が得られました。画像。

D列:手動検査のためにランダムに選択されたサンプルの結果画像

E列:人間による検査により桜と確認された画像の数

F列:月あたりの自動処理方法 (コンピューター ビジョンおよびタグ分析) の推定精度 (E/D として計算)

G列:この精度を利用して、2月、3月、4月に撮影された桜の写真の総数を計算します。計算方法はC*Fです。

評価方法 

桜の開花日を推定するために、研究者らはデータセット内のすべての画像について日単位の時系列を生成し、処理には 7 日幅の三角移動平均インジケーター (三角ローリング平均) を使用します。中心点には単一の重みが割り当てられ、すぐ両側の点には 0.75 の重みが割り当てられます。では、週末 (余暇、写真撮影活動が大幅に増加します) と平日の花を鑑賞する人の数の違いによって引き起こされる写真撮影活動の変動を平滑化するために、次に近い点にそれぞれ 0.5 と 0.25 の重みが割り当てられます。

得られたグラフに示された射撃行動のピークが桜の開花(満開)のピーク時期であると判断した。

比較検証: 予測結果は実際のデータと一致しています

日本での桜の開花に関する最古の記録は西暦 812 年に遡り、公式の観察記録は 1953 年に始まりました。チームの分析手法を検証するために、実験チームは、花見に人気の東京と京都の2都市のデータを選択し、気象庁(JMC)と日本政府観光局(JNTO)が毎年発表する桜の満開日と比較して算出した。実験から得られたピーク日と公式発表日の相違

実験を通して、研究チームは日本全国の桜の花の視覚的時空間データを導き出した, 1月下旬(第3週~第4週)から5月下旬(第3週~第4週)にかけて、桜の開花はまず南の暖地から北へ徐々に進み、最後に南から北へ徐々に後退します。図に示すように:

図 2: 2008 年から 2018 年までの日本の桜の撮影地,

各写真の期間は 2 週間に相当します

AC:桜の写真は日本の南部の暖かい地域で見られ、本州では東京と京都の都市中心部に集中しています。

DF:桜の写真が増え、本州北部にも広がり始める

GI:桜の開花場所は北に広がり、北海道の札幌でも撮影活動が活発です。北海道や本州北部では桜の撮影活動が集中しています。最後に、全国の桜の写真の数は徐々に減り、南から北に遠ざかっていきます。

実験チームは、東京および京都エリアの桜イベント撮影日の処理時系列のピーク値を、JMC/JNTOが公表している日付と比較検証しました。結果は、二乗平均平方根誤差が東京エリアで 3.21 日、京都エリアで 3.32 日であることを示しています。以下に示すように:

図 3: 東京エリアにおける 2 つの評価日の比較

左列:この実験手法により推定された東京の桜の開花時期の年間推移

中央の列:JNTOが報告した東京の桜の見頃時期の推移

右の列: 誤差、つまり 2 つの間の日数の差

図 4: 京都地域における 2 つの評価日の比較

左列:この実験手法により推定した京都の桜の開花時期の年間推移

中段:JNTOが報告する京都の桜の開花時期の推移

右の列: 誤差、つまり 2 つの間の日数の差

実験チームのデータからは、秋に桜が咲く現象も明らかになった。これはJNTOが発表したデータには公式には記載されていません。これは、SNS データが小さな確率の事象を分析し、異常な季節現象を明らかにする能力を持っていることを示しています。これは、花粉や花蜜などの芳香資源の利用可能性を年間を通じて評価する場合や、季節外の開園時間など予期せぬ場合でも評価する場合に非常に重要です。

SNS データ: 生態学的研究に新たな洞察を提供する

世界気象機関が今年4月に発表した論文によると、2022年の世界の平均気温は1850年から1900年の平均より1.15℃高くなるという。人類は気候変動を感知するのが比較的遅く、植物は特に敏感である。地球温暖化の影響で、日本の桜だけでなく、我が国各地の草花にも被害が及んでいます。

武漢大学の桜の観察データによると、1960年代から武漢大学の桜の開花時期は大幅に早まり、2000年以降は記録を更新し続け、一時は3月下旬から2月下旬まで早まった。

山東省菏沢市の牡丹の開花時期は、1990年代以前は主に4月下旬に集中していましたが、2010年頃からは4月中旬に早まり、4月上旬にも開花が見られます。

菜の花の開花時期も大幅に早まり、今年は2月22日に菜の花が咲き始め、3月13日に菜の花の開花時期がピークを迎えた。 3月中旬。

Kepios が発表したレポートによると、2023 年 4 月の時点で、世界のソーシャル メディア ユーザーの数は 48 億人に達し、世界の総人口の 59.9% を占めており、1 人当たりのソーシャル メディア アプリケーションの使用時間は平均して 2 時間 24 分です。日。大規模なソーシャル ネットワーク データを生成することで、生態学的研究に新たな洞察が得られると期待されています。

この論文で著者が提案したSNS分析技術は、公的データの欠落部分を補い、研究者が顕花植物に対する気候変動のさまざまな程度の影響を理解するのに役立ち、ミツバチなどの重要な花粉媒介者の行動を理解するのに積極的な意義がある。そして昆虫。

参考記事:

[1]https://www.sciencedirect.com/science/article/abs/pii/S0168192320303117

[2]https://link.springer.com/chapter/10.1007/978-4-431-66899-2_8

[3]http://sh.cma.gov.cn/sh/qxkp/qhbh/zhykp/202304/t20230425_5464832.html

[4]https://datareportal.com/social-media-users

この記事は、HyperAI Super Neural WeChat パブリック プラットフォームで初めて公開されました~