페루, 4인 조사팀 2년 만에 반부패 AI 공개

보르헤스의 소설 중 하나인 '학자이자 저명한 인물인 푸네스'에서는 뛰어난 관찰력과 기억력을 지닌 천재 푸네스가 묘사됩니다.
어린 푸네스는 승마 사고 이후 놀라운 기억력과 관찰력을 얻었습니다. 그는 자신의 과거 경험에 대한 모든 세부 사항과 책에 있는 모든 단어를 기억할 수 있었습니다. 새로운 꽃봉오리가 자라거나 꽃잎이 지는 등 삶과 자연의 미묘한 변화도 관찰할 수 있습니다.
소설 속 푸네스는 모든 것을 관찰하고, 기억하고, 이해하고, 해석할 수 있는 제3의 눈을 가진 사람과 같습니다.
부패 AI Funes: 계약 위반 단서 찾기
이 소설은 페루의 디지털 조사 기관인 오호-퍼블리코(ojo-publico)에 영감을 주었습니다. 그들은 보르헤스의 푸네스가 오늘날의 알고리즘과 같다고 믿으며, 표면 아래에 숨겨져 있고 알려지지 않은 많은 비밀을 발견할 수 있다고 말합니다.
해당 기관의 조사 기자, 머신 러닝 전문가, 법률 고문은 페루 정부가 공개한 정부 조달, 엔지니어링 건설, 선거 기부에 대한 245,000건의 계약 및 계좌 세부 정보를 바탕으로 연구를 진행했습니다.
계약서의 부패와 위반 사항을 감지할 수 있는 계약 검토용 AI 모델을 훈련하는 데 2년이 걸렸습니다. 조사팀은 이 알고리즘이 모든 세부 사항을 관찰하고 검토할 수 있는 초능력을 가지고 있다고 믿었고, 그래서 이 모델에 푸네스라는 이름을 붙였습니다.

지금까지 푸네스의 꼼꼼한 검증 작업을 바탕으로 총 245,000건의 계약 중 총 110,000건의 문제가 있는 계약을 찾아냈으며, 총 가치는 570억 솔(페루 화폐 단위, 약 1,009억 위안)에 달합니다.
이런 문제가 있는 계약의 단서를 바탕으로, 기자단은 보다 심층적인 조사와 검증을 실시하여 페루 정부의 여러 부패하고 불법적인 정부 조달 행위를 폭로했습니다. 여기에는 많은 페루 대기업이 연루되었고, 총액은 거의 1,000억 유로에 달했습니다.
AI는 조달 과정에서의 속임수를 발견할 수 있습니다.
이 사건에는 최근 몇 년 동안 페루에서 발생한 여러 주요 부패 사건이 포함되었습니다.
- 페루의 국영 석유 정제 및 처리 기업인 페트로페루는 4년 동안 여러 주와 지방에서 공개 입찰에 참여하여 정부 조달 프로젝트에서 약 24억 위안을 획득했습니다. 이 중 90% 프로젝트는 해당 기업이 유일한 입찰 기업으로 낙찰받았는데, 이는 페루 정부 조달 규정을 심각하게 위반했을 뿐만 아니라 정상적인 시장 경쟁에도 영향을 미쳤습니다.
푸네스는 또한 24만 건의 정부 조달 계약과 데이터를 통해 설립된 지 20일도 안 된 회사에 수천만 달러에 달하는 재정 지출이 이루어졌다는 사실을 발견했습니다.
- 예를 들어, 케이터링 회사인 멜체스카(Melcesca)는 2015년 10월 23일에 등록되었습니다. 설립된 지 2주도 채 되지 않아 페루의 산안토니오 아바드 쿠스코 국립대학교(Unsaac)가 실시한 공개 입찰에서 낙찰을 받아 학교 카페테리아 공급업체가 되었습니다. (이 조달 입찰에는 16개 입찰자가 있습니다)

페루에서는 엄청난 대중의 관심을 끌었습니다.
푸네스는 이와 비슷한 불법적인 거래와 위험한 계약을 많이 발견했습니다. 푸네스의 예리한 통찰력과 높은 판단력은 성숙한 사업 조사와 정교한 알고리즘 지원에서 비롯됩니다.
공공정책과 사회학 연구 분야에서는 많은 학자들이 정부 정보 공개와 부패에 대한 연구에 전념하고 있습니다. 푸네스의 알고리즘은 또한 수석 학자 미하이 파제카스의 연구 결과를 기반으로 합니다.
미하이 파제카스는 케임브리지 대학교에서 인문학, 사회학, 정치학 분야의 박사 학위를 취득한 연구원입니다. 그의 연구에 따르면, 그는 정부 조달 계약과 계정 흐름에 대한 일련의 부패 탐지 알고리즘을 개발했습니다. 그는 위반 및 부패 사건의 돌파구가 되는 명확한 특징을 지닌 여러 유형의 계약이 있다는 것을 발견했습니다. 이러한 특징을 이해한다면, 방대한 양의 문서에서도 이러한 계약서와 관련 정보를 찾을 수 있습니다.
이러한 특징은 다음과 같습니다.
- 비공개 입찰
- 입찰 정보의 공개 기간이 상당히 단축되었습니다.
- 입찰자들 사이에는 규모와 역량 면에서 뚜렷한 차이가 있었습니다.
- 조달 계약에는 여러 가지 수정 사항이 포함되어 있습니다.
- 승패를 결정하는 데 걸리는 시간이 너무 짧거나 너무 깁니다.
그는 이러한 판단을 바탕으로 평가모형을 설계하고 부패위험지수(CRI)를 부패위험지수로 정의했다.

여기서 CRIi는 계약 i의 부패 위험 지수를 나타냅니다.
CIji는 계약 i에 대한 입찰에서 관찰된 j번째 기본 부패 지표를 나타냅니다.
wj는 j번째 기본 부패 지표의 가중치를 나타냅니다.
CRI=0은 부패 위험이 가장 낮음을 나타냅니다.
CRI=1은 관찰된 최대 부패 위험을 나타냅니다.

여기서 단일 입찰자는 i번째 계약에 대해 입찰자가 한 명뿐인 경우 1과 같고, 입찰자가 더 많은 경우 0과 같습니다.
Zi는 단일 입찰 계약의 로그를 나타냅니다. β0는 회귀상수이다.
Rij는 i번째 계약의 j번째 부패 "위험 신호" 행렬이며, 여기에는 공시 기간의 길이가 포함됩니다.
Cim은 i번째 계약에 대한 m개의 제어 변수(예: 공시 기간의 길이)로 구성된 행렬을 나타냅니다.
Cim은 i번째 계약에 대한 m개의 제어 변수의 행렬을 나타냅니다.
시장의 경쟁자 εi는 오차항입니다.
β1j와 β4m은 계수, 설명 변수, 통제 변수의 벡터를 나타냅니다.
알고리즘 팀은 미하이 파제카스의 알고리즘을 기반으로 스페인 계약의 텍스트 인식을 개선하고 페루의 상황에 맞춰 위험 지표를 조정했으며, 푸네스는 매우 좋은 성과를 달성했습니다.
투명성 확보 및 혁신 촉진을 위한 오픈 데이터
청화대학교 공공행정학원의 세 명의 학자들은 그들의 연구 "정부 데이터 개방성과 부패 방지: 영국의 실천과 영감"에서 다음과 같이 지적한 바 있다.오픈 데이터는 사회적 감독을 촉진할 수 있으며, 대중은 오픈 데이터를 통해 부패를 발견할 수 있습니다.
정부 데이터를 공개하면 정부 투명성이 향상되고 경제 발전과 사회적 혁신이 촉진됩니다. 이런 측면에서는 현재 EU와 영국이 선두에 서 있다.
2015년에 유럽 위원회는 오픈 데이터 활용 강화를 통한 부패 감소를 위한 유럽 전략(TACOD)을 시작했으며, 영국은 이 프로젝트의 시범 국가 중 하나가 되었습니다.
TACOD 연구팀은 부패 노출의 가장 많은 출처가 법 집행 기관(34%)이며, 그 다음으로는 수사 기자(25%), 정보 공개 요청(14%), 고발(13%), 오픈 데이터(7%) 순이라는 사실을 발견했습니다.
공개된 데이터를 통해 드러나는 부패는 71%에 불과하지만, 특정 핵심 데이터를 조기에 공개한다면 많은 양의 부패를 조기에 발견하고 감지할 수 있습니다. 공개 정부 데이터는 부패와의 싸움에서 중요한 도구가 될 수 있는 잠재력을 가지고 있습니다.
정부 정보가 공개되더라도 복잡한 계약과 방대한 거래 데이터를 처리하기 위한 문턱은 높아졌습니다. 2009년에는 영국 국회의원들이 개인 지출을 변제하기 위해 공적 자금을 남용한 스캔들이 언론에 의해 잇따라 폭로되었습니다. 영국의 3대 정당과 300명이 넘는 국회의원이 참여했습니다. 의원들의 막대한 경비상환증과 신청서류를 접하고,데일리 텔레그래프와 가디언 등의 언론매체는 인터넷에 방대한 양의 데이터를 공개하고 영국 시민들에게 "크라우드소싱" 방식으로 설문 조사에 참여해 줄 것을 요청했습니다.

페루에서는 엄청난 대중의 관심을 끌었습니다.
만약 대중이 데이터에서 의심스러운 부분을 발견하면, 대중은 해당 데이터를 웹사이트에 표시할 수 있으며, 조사팀은 계속해서 후속 조치를 취하게 됩니다. 그러나 크라우드소싱에도 많은 문제점이 있습니다. 조사 훈련을 받지 않은 사람은 이러한 업무를 효율적이고 정확하게 완료할 수 없습니다.
푸네스의 등장은 정부 공공 데이터를 활용해 부패를 폭로하는 획기적인 사례이자 모범 사례가 되었습니다. 데이터 과학자, 수사 기자, 법률 전문가로 구성된 4인 팀은 인간과 AI의 강력한 수사 역량을 강력하게 입증했습니다.
Funes는 여전히 활동 중입니다
오늘날까지도 푸네스는 페루의 탐사보도의 최전선에서 정확한 탐사 도구로서 활약하고 있습니다.
그뿐만 아니라, Funes를 만든 디지털 조사 기관인 ojo-publico는 작년부터 Funes를 사용하여 COVID-19 팬데믹 기간 동안 정부 조달 프로젝트를 검증해 왔습니다.