ペルーの4人からなる調査チームが2年ぶりに汚職対策AIを発表

ボルヘスの小説のひとつ『情報通のフネス』では、並外れた観察力と記憶力を持つ天才フネスについて描写している。
落馬後、若いフネスは驚くべき記憶力と観察力を獲得しました。彼は過去の経験や本の中のあらゆる言葉を細部まで思い出すことができます。新しい芽の成長や花びらの散りなど、生命や自然の微妙な変化を観察することもできます。
小説の中のフネスは、目が開かれたようなもので、すべてを観察し、記憶し、理解し、解釈する能力を持っています。
腐敗した AI Funes: 契約の不正の手がかりを明らかにする
この小説は、ペルーのデジタル調査機関である ojo-publico にインスピレーションを与えました。彼らは、ボルヘスのフネスは今日のアルゴリズムのようなもので、水面下の多くの隠された未知の秘密を明らかにできると信じています。
同庁の調査ジャーナリスト、機械学習の専門家、法律顧問が協力して、ペルー政府が開示した24万5000件の政府調達、建設、選挙寄付契約と会計詳細に基づいて報告書を作成した。
契約書の汚職や不正行為の手がかりを検出できる契約レビュー用の AI モデルのトレーニングには 2 年かかりました。調査チームは、このアルゴリズムにはすべての詳細を観察してレビューする超能力があると考え、モデルを Funes と名付けました。

フネス氏の綿密な検証作業により、これまでに合計11万件(計24万5,000件)の問題のある契約が検証され、金額は570億新ソレス(ペルーの通貨単位、約1,009億元)に上る。
これらの問題のある契約からの手がかりに基づいて、記者チームはより詳細な調査と検証を実施し、多くのペルー大手企業が関与し、総額1,000億ユーロ近くに上るペルー政府による数々の腐敗した違法な政府調達慣行を明らかにした。関与した。
調達のコツ、AIの鋭い目
これには、ペルーで近年発生した以下のようないくつかの重大な汚職事件が関係しています。
- ペルーの国営石油精製・加工会社ペトロペルーは、4年間で複数の州・省の公共入札に参加し、政府調達プロジェクトで24億元近くを獲得した。その中で、90% プロジェクトは入札に参加した唯一の企業として落札されましたが、これはペルー政府調達の規制に重大な違反を負い、市場の通常の競争にも影響を与えました。
フネス氏はまた、24万件の政府調達契約とデータから、設立から20日未満の企業に数千万ドルの財政支出が支払われていたことも発見した。
- たとえば、ケータリング会社 Melcesca は 2015 年 10 月 23 日に登録されました。設立から 2 週間も経たないうちに、ペルーの国立サンアントニオ アバド クスコ大学 (Unsaac) から公募を受け、同校の食堂サプライヤーとなりました。 。 (今回の調達入札には16社が応札)

ペルー国内で大きな注目を集めた。
フネス氏は同様の不正行為や危険な契約を多数発見した。 Funes の鋭い洞察力と非常に高い判断力は、成熟したビジネス調査と成熟したアルゴリズム サポートから得られます。
公共政策と社会学の研究分野では、多くの学者が政府の情報公開と汚職問題の研究に専念しています。 Funes のアルゴリズムは、上級学者である Mihaly Fazekas の研究結果にも基づいています。
Mihaly Fazekas はケンブリッジ大学の人文科学、社会科学、政治科学の博士研究者であり、彼の研究には政府調達契約と会計フローの一連の汚職検出アルゴリズムがあります。彼は、違反や汚職の場合の突破口となる明らかな特徴を備えた契約の種類がいくつかあることを発見しました。この特徴を押さえておけば、膨大な書類の中からこれらの契約書や関連資料を見つけることができます。
これらの特徴には次のようなものがあります。
- 非公開入札。
- 入札情報の公表期間は明らかに短い。
- 入札者の間には、規模と力に明らかな差があります。
- 調達契約には多数の変更が含まれています。
- 落札決定までの時間が短すぎる、または長すぎる。
これらの判断に基づいて、彼は評価モデルを設計し、汚職リスク指数として CRI (Corruption Risk Index) を定義しました。

ここで、CRIi は契約 i の汚職リスク指数を表し、
CIji は、契約 i の入札で観察された j 番目の基本的な破損指標を表します。
wj は、j 番目の基本破損インジケーターの重みを表します。
CRI=0 は破損リスクが最も低いことを表します。
CRI=1 は、観測された最大の破損リスクを表します。

このうち、i 番目の契約の入札者が 1 人のみの場合は 1 人、それ以上の場合は 0 になります。
Zi は単一入札契約である契約の対数を表し、β0 は回帰定数です。
Rij は、広報期間の長さなど、i 番目の契約の j 個の汚職「危険信号」マトリックスです。
Cim は、宣伝期間の長さなど、i 番目の契約の m 個の制御変数の行列を表します。
Cim は、i 番目の契約の m 個の制御変数の行列を表します。
市場の競合他社。εi は誤差項です。
β1j と β4m は係数、説明変数、制御変数のベクトルを表します。
Mihaly Fazekas のアルゴリズムに基づいて、アルゴリズム チームはスペイン語契約のテキスト認識を改善し、ペルーの国情に基づいてリスク指標を調整し、非常に良い結果を達成しました。
データをオープンにし、透明性を実現し、イノベーションを促進する
清華大学行政学部の3人の学者はかつて「政府データのオープン性と汚職防止:英国の実践とインスピレーション」を研究し、次のように指摘した。オープンデータは社会的監視を促進し、一般大衆はオープンデータを通じて汚職を発見することができます。
政府データを公開することは、政府の透明性を向上させ、経済発展と社会革新を促進するのに役立ちます。この点に関しては、EU と英国が現在最前線にいます。
2015年、欧州委員会は「オープンデータの利用強化による汚職削減のための欧州戦略に向けて」(TACOD)を立ち上げ、英国はこのプロジェクトのパイロット国の1つとなった。
TACOD調査チームは、最も多くの汚職を暴露したのは法執行機関(34%)であり、次いで調査ジャーナリスト(25%)、情報公開請求(14%)、内部告発者(13%)、オープンデータ(7%)であることを発見した。
現在、オープンデータを通じて暴露された汚職は 7% のみですが、特定の重要なデータが早期に公開されれば、多数の汚職を早期に発見、検出できるようになり、オープンな政府データは汚職対策の重要なツールとなる可能性があります。 。
たとえ政府情報が公開されたとしても、複雑な契約や膨大な取引データを処理するための敷居が高くなります。 2009年、イギリス国会議員による個人請求の返済に公的資金を悪用したスキャンダルが相次いでメディアに暴露された。英国の3大政党と300人以上の国会議員が関与している。国会議員からの膨大な数の償還証書や申請書類に直面し、デイリー・テレグラフ、ガーディアンなどのメディアはインターネット上で大量のデータを公開し、「クラウドソーシング」を通じて英国国民に調査への参加を呼びかけた。

ペルー国内で大きな注目を集めた。
一般の人々がデータに疑問を見つけた場合は、Web サイト上で該当するデータにマークを付けることができ、調査チームは引き続き追跡調査を行います。しかし、クラウドソーシングには多くの問題があり、調査訓練を受けていない人はこれらのタスクを効率的かつ正確に完了することができません。
Funes の登場により、政府の公開データを通じて汚職を摘発するという画期的なベストプラクティスが実現し、データサイエンティスト、調査記者、法律専門家からなる 4 人チームは、人間と AI の強力な調査能力を効果的に実証しました。
フネスはまだ活動中
フネスは今日に至るまで、オープンで正確な調査ツールとしてペルーの調査報道の最前線で活躍し続けている。
それだけでなく、Funesを創設したデジタル捜査機関であるojo-publicoは昨年以来、新型コロナウイルス感染症の流行下での政府調達プロジェクトの検証にFunesを利用している。