Fei-Fei Li의 AI4S 팀이 제공하는 최신 통찰력: 생물학/소재/의료/진단을 아우르는 16가지 혁신 기술…

요전,스탠포드 대학의 인간 중심 인공지능(HAI) 연구 센터가 "2024 인공지능 지수 보고서"를 발표했습니다.스탠포드 HAI의 7번째 걸작인 이 502페이지 분량의 보고서는 2023년 글로벌 인공지능의 발전 추세를 포괄적으로 추적합니다. 이전 연도와 비교하여 연구 범위가 AI 기술, AI 기술에 대한 대중의 인식, 개발을 둘러싼 정치적 역학 등 기본 추세를 포괄하도록 확대되었으며, 미래 AI 발전 추세에 대한 예측도 제시되었습니다.

철학자 존 에체멘드(왼쪽) 공동 리더
이 보고서에서 가장 눈길을 끄는 부분은 새로 추가된 장입니다.과학과 의학에 있어서 인공지능의 심오한 영향에 대해 알아보세요.이 보고서는 2023년 과학 분야에서 AI가 이룬 뛰어난 성과와 SynthSR, ImmunoSEIRA와 같은 획기적인 기술을 포함하여 의료 분야에서 AI가 달성한 중요한 혁신적 결과를 소개합니다. 또한 이 보고서는 AI 의료기기에 대한 FDA 승인 추세를 면밀히 분석하여 업계에 귀중한 참고 자료를 제공합니다.
공식 계정을 팔로우하고 "HAI2024"라고 답글을 달면 전체 보고서를 다운로드할 수 있습니다.
AI: 과학 연구를 가속화하는 엔진
2024년 인공지능 지수 보고서는 다음과 같이 명시하고 있습니다.2023년에 업계에서 51개의 유명한 머신러닝 모델이 탄생한 반면, 학계에서는 15개만 기여했습니다. 또한, 새롭게 출시된 기본 모델 중 108개가 업계에서 나왔고 나머지 28개는 학계에서 나왔습니다.
학계의 발전 속도가 산업계보다 현저히 느리지만, AI가 과학적 발견 분야에 공식적으로 사용된 것은 2022년이라는 점을 기억하는 것이 중요합니다. 알고리즘 정렬 효율성을 최적화하는 AlphaDev부터 소재 발견 프로세스에 혁명을 일으키는 GNoME까지, 우리는 더욱 중요하고 관련성 있는 AI 애플리케이션이 등장하는 것을 목격하고 있습니다.
오늘날 AI는 재료과학, 기후 변화, 컴퓨터 과학 등의 분야에서 꽃을 피웠습니다. 다행히도 중국이 이러한 변화를 선도하고 있습니다.중국과학기술정보연구원과 과학기술부 차세대 인공지능 개발연구센터가 편찬한 "중국 AI 과학혁신 지도 연구 보고서"에 따르면, 우리나라는 AI 기반 과학연구 논문 발표 건수에서 1위를 차지하고 있으며, 국산 AI 과학연구 기초 소프트웨어도 나날이 성숙해져 연구자들에게 풍부한 데이터 세트, 기본 모델, 전문 도구를 제공하고 있습니다.
일반적으로 과학 분야에서 AI의 응용은 다양하며, 전례 없는 속도로 과학의 발전과 진보를 촉진하고 있습니다. 그러나 과학을 위한 AI의 현재 개발 단계에서는 다음과 같은 점에 유의해야 합니다.종합적 인재 부족, 기술적 솔루션의 재활용 어려움, 수직 학문 분야의 연구 데이터 품질 저하 등의 문제가 점차 드러났습니다.
예를 들어, "AI 인재는 과학 연구에 참여해야 할까, 아니면 과학 연구 인재는 AI를 배워야 할까"라는 논의에서 학제간 지식 배경을 가진 연구자들이 두드러지게 나타납니다. 그들은 과학 연구 분야에 대한 깊은 통찰력을 가지고 있을 뿐만 아니라, 다양한 AI 도구와 기술을 빠르게 익힐 수 있습니다. 하지만 그 희소성은 상상할 수 있는 수준이며, 종합적인 재능을 기르는 일은 하룻밤 사이에 이룰 수 있는 일이 아닙니다. 따라서 AI와 과학 연구 간의 소통을 신속하게 구축하는 방법은 과학을 위한 AI의 대규모 홍보와 관련된 중요한 문제입니다.
동시에, 과학 연구가 다루는 풍부한 분야에 대해 자세히 설명할 필요는 없습니다. 연구 방향이 약간씩 다르기 때문에 각 연구 그룹은 AI 도구에 대한 요구 사항이 다를 수 있습니다. 모든 팀이 학제간 배경을 가진 연구자를 확보하기 어려울 때, AI 도구 사용에 대한 기준을 낮추고 모델 미세 조정 프로세스를 간소화하는 것 역시 과학 연구 분야에서 AI 활용을 어느 정도 촉진할 수 있을 것입니다.
업데이트, 자체 반복 및 기술 발전을 가속화합니다.
AI 기술의 발전으로 AI 적용 범위가 더욱 넓어지고 심도도 넓어졌지만, 알고리즘에 대한 요구 사항도 점점 더 높아지고 있습니다. 현재 대부분의 알고리즘은 인간 전문가에게 의존하여 최적화하기 어려운 단계에 도달했으며, 이로 인해 계산적 병목 현상이 지속적으로 심화되고 있습니다. 하지만 과학자들은 알고리즘 분야에 대한 탐구를 결코 멈추지 않았습니다.
알파데브
알파고의 명수 재현
정렬 알고리즘은 컴퓨터 시스템이 데이터 항목을 순서대로 정리하는 데 필요한 기본 도구입니다. 이 분야에서 혁신적인 돌파구를 마련하기 위해 Google DeepMind는 혁신적인 접근 방식을 취해 비교적 연구가 부족했던 컴퓨터 조립 지침 분야를 탐구했습니다.DeepMind는 AlphaDev 시스템을 통해 CPU 어셈블리 명령어 수준에서 직접 더 효율적인 정렬 알고리즘을 찾을 수 있습니다.
AlphaDev 시스템은 학습 알고리즘과 표현 함수라는 두 가지 핵심 구성 요소로 구성됩니다.
학습 알고리즘은 고급 AlphaZero 알고리즘의 확장으로, 심층 강화 학습(DRL)과 무작위 검색 최적화 알고리즘을 결합하여 대규모 명령어 검색 작업을 수행합니다. 표현 함수는 어셈블리 언어의 기본 구조를 포착하여 특수한 시퀀스 표현으로 변환할 수 있는 Transformer 아키텍처를 기반으로 합니다.
AlphaDev 시스템을 사용하여DeepMind는 현재 수동으로 조정된 알고리즘보다 우수한 고정 길이의 짧은 시퀀스 정렬 알고리즘인 Sort 3, Sort 4, Sort 5를 성공적으로 발견했으며 관련 코드를 LLVM 표준 C++ 라이브러리에 통합했습니다.특히, 알파데브는 3차 정렬 알고리즘을 발견하면서, 실제로는 지름길이었던 겉보기에 반직관적인 접근 방식을 취했는데, 이는 알파고가 전설적인 바둑 기사 이세돌과의 경기에서 사용했던 "37번째 수"를 연상케 합니다. 이는 궁극적으로 승리로 이어진 예상치 못한 전략이었습니다.

AlphaDev의 응용 분야는 정렬 알고리즘에만 국한되지 않습니다. DeepMind는 이 방법을 일반화하여 9~16바이트 범위의 해시 알고리즘에도 적용하여 30%의 상당한 속도 향상을 달성했습니다. 이는 AlphaDev가 기본 컴퓨팅 작업을 최적화하는 데 있어 폭넓은 잠재력과 응용 가치를 가지고 있음을 보여줍니다.
논문 링크:
https://www.nature.com/articles/s41586-023-06004-9
플렉시큐브
AI를 사용하여 고품질 3D 모델을 생성합니다.
장면 재구성부터 생성적 AI 추적까지, 새로운 세대의 AI 모델은 사실적이고 세부적인 3D 모델을 생성하는 데 놀라운 성공을 거두었습니다. 이러한 모델은 일반적으로 표준 삼각형 메시로 만들어지므로 메시의 품질이 매우 중요합니다. 이를 위해,엔비디아 연구진은 3D 네트워크 생성 파이프라인의 메시 품질을 크게 개선하고 물리 엔진과 통합하여 3D 모델에서 유연한 객체를 쉽게 생성할 수 있는 새로운 메시 생성 방법인 FlexiCubes를 개발했습니다.

FlexiCubes의 핵심 아이디어는 메시를 생성하는 과정에서 정밀한 조정을 가능하게 하는 "유연한" 매개변수를 도입하는 것입니다.최적화 과정에서 이러한 매개변수를 업데이트함으로써 메시의 품질이 크게 향상됩니다. 이러한 접근 방식은 FlexiCubes를 널리 사용되는 Marching Cubes 알고리즘과 같은 기존의 그리드 기반 파이프라인과 극명하게 대조시켜 최적화 기반 AI 파이프라인을 원활하게 대체할 수 있습니다.
FlexiCubes가 생성한 고품질 메시는 복잡한 세부 사항을 표현하는 데 탁월하여 AI가 생성한 3D 모델의 전반적인 사실감과 충실도를 향상시킵니다. 이러한 메시는 사진측량법이나 생성적 AI와 같은 분야의 물리 시뮬레이션에 특히 유용하며, 이를 통해 AI 파이프라인이 복잡한 모양의 세부 정보를 정확하게 렌더링할 수 있습니다.
논문 링크:
https://research.nvidia.com/labs/toronto-ai/flexicubes
인간의 노력을 넘어 창조를 가속화하고 효율성을 향상시킵니다.
신봇
AI 기반 로봇 화학자
화학 실험실의 깊은 곳에서 혁명이 조용히 일어나고 있습니다. 유기 화합물의 합성은 더 이상 느리고 지루한 과정이 아니라 자동화의 마법을 통해 현실로 가속화되고 있습니다.이러한 변화의 중심에는 삼성전자 과학자들이 만든 자율 합성 로봇인 신봇(Synbot)이 있습니다.

구체적으로 Synbot은 세 가지 계층으로 구성됩니다.
* AI S/W 계층:역합성 모듈, 실험 설계 및 최적화 모듈을 갖추고 포괄적인 계획 과정을 주도하며, 의사 결정 모듈을 사용하여 실험 방향을 안내합니다.
* 로봇 S/W 계층:레시피 생성 모듈과 번역 모듈을 통해 이를 로봇에 대한 실행 가능한 명령으로 변환하는 역할을 담당합니다.* 로봇 계층:온라인 스케줄링 모듈의 감독 하에 합성 실험실의 다양한 기능이 모듈화되고 계획된 레시피가 체계적으로 실행되어, 사전 정의된 목표가 달성될 때까지 데이터베이스가 지속적으로 업데이트됩니다.
연구에 따르면Synbot은 24시간 동안 평균 12개의 반응을 수행할 수 있습니다. 인간 연구자가 하루에 두 가지 실험을 수행할 수 있다고 가정하면, Synbot은 인간 연구자보다 최소 6배 더 효율적입니다.Synbot을 추가하면 과학자들은 지루한 작업에서 벗어나 혁신과 탐구에 더 많은 에너지를 쏟을 수 있습니다.
논문 링크:
https://www.science.org/doi/full/10.1126/sciadv.adj0461
금언
재료 발견 프로세스 재창조
Google DeepMind는 Nature에 다음과 같은 기사를 게재했습니다.재료 탐색을 기반으로 한 AI 도구 GNoME(Graph Networks for Materials Exploration)은 220만 개의 새로운 결정 예측(인간 과학자가 축적한 약 800년 분량의 지식에 해당)을 발견했는데, 이 중 38만 개가 안정적인 결정 구조입니다.실험적 합성을 통해 일부 소재가 차세대 배터리와 초전도체와 같은 기술적 변화를 촉발할 수 있을 것으로 기대됩니다.

GNoME은 고급 그래프 신경망(GNN) 모델입니다. 입력 데이터는 주로 그래프 형태로 되어 있어 원자 간의 연결과 유사한 연결을 형성합니다. 이를 통해 GNoME은 새로운 결정질 물질을 더 쉽게 발견할 수 있습니다. GNoME은 새로운 안정적 결정의 구조를 예측하고 이를 DFT(밀도 함수 이론)를 통해 테스트한 다음, 그 결과로 얻은 고품질의 학습 데이터를 모델 학습에 다시 제공할 수 있다고 합니다.
이 단계에서는새로운 모델은 물질 안정성 예측 정확도를 약 50%에서 80%로 높이고, 새로운 물질 발견률을 10% 미만에서 80% 이상으로 높일 것입니다.(전체 보고서를 보려면 클릭하세요: 인간보다 800년 앞서? DeepMind, 딥러닝을 활용해 220만 개의 새로운 수정을 예측하는 GNoME 출시)
변화를 가속화하고 생태환경의 '회색 코뿔소'를 차분하게 다루세요
그래프캐스트
가장 정확한 글로벌 날씨 예보를 제공합니다
Google DeepMind가 출시한 GraphCast는 머신 러닝과 그래프 신경망(GNN)을 기반으로 하는 날씨 예보 시스템입니다. "인코딩-프로세스-디코딩" 구성을 사용하고, 총 3,670만 개의 매개변수를 가지고 있으며, 경도/위도 0.25도(적도에서 28km x 28km)의 고해상도로 예측이 가능합니다.이 범위는 지구 표면 전체를 포함합니다. 각 격자점에서 이 모델은 지구 표면 변수 5개(온도, 풍속, 풍향, 평균 해수면 기압 등 포함)와 비습도, 풍속, 풍향, 37개 고도의 온도 등 대기 변수 6개를 예측합니다.

종합기초시험에서는HRES(고해상도 예보)와 비교했을 때 GraphCast는 1,380개의 테스트 변수 중 약 90%에 대해 더욱 정확한 예보를 제공합니다.비교 분석에 따르면 GraphCast는 기존 예측 모델보다 심각한 기상 현상을 더 일찍 식별할 수도 있습니다. (전체 보고서를 보려면 여기를 클릭하세요: 우박 폭풍 센터는 데이터를 수집하고, 대형 모델은 극한 날씨 예보를 지원하며, "폭풍 추적자"가 무대에 올랐습니다)
홍수 예보
인공지능이 홍수 예측을 혁신하다
2018년 구글은 AI와 강력한 컴퓨팅 성능을 활용해 더 나은 홍수 예측 모델을 만들고 여러 국가의 정부와 협력하는 Google 홍수 예측 이니셔티브를 시작했습니다. 2023년에구글 연구팀은 머신러닝을 기반으로 홍수를 5일 앞당겨 정확하게 예측할 수 있는 강 예측 모델을 개발했습니다. 5년에 한 번 발생하는 홍수 사건을 예측하는 경우, 현재 1년에 한 번 발생하는 홍수 사건을 예측하는 것과 동등하거나 더 나은 성능을 보입니다. 이 시스템은 80개국 이상을 포괄할 수 있습니다.
본 연구에서는 두 개의 장단기 메모리 네트워크(LSTM)를 적용하여 고급 하천 예측 모델을 구축했습니다.이 모델의 핵심 아키텍처는 인코더-디코더 프레임워크를 기반으로 합니다.구체적으로, Hindcast LSTM 모듈은 과거 기상 데이터를 처리하는 반면, Forecast LSTM 모듈은 예보 기상 데이터를 처리합니다. 모델의 출력은 각 예측 시점에 대한 확률 분포 매개변수이며, 이를 통해 특정 시점의 특정 강의 흐름에 대한 확률 예측을 제공할 수 있습니다.

연구 결과는 다음과 같습니다.이 모델은 현재 세계를 선도하는 모델링 시스템인 코페르니쿠스 비상 관리 서비스의 글로벌 홍수 인식 시스템(GloFAS)보다 성능이 뛰어납니다.이번 연구 결과는 제안된 모델의 하천 예측 분야에서의 잠재력과 신뢰성을 확인해 주었으며, 홍수 경보와 수자원 관리를 위한 새로운 기술적 수단을 제공했습니다. (전체 보고서를 보려면 여기를 클릭하세요: Google의 홍수 예측 모델이 다시 Nature에 게재되어 세계 1위 시스템을 앞지르고 80개국 이상을 포괄합니다)
AI: 의학의 새로운 시대를 선도하다
"2024년 인공지능 지수 보고서"에 따르면 AI 기술은 의료 영상, 의학 질의응답, 의학 진단 등 여러 분야에서 성과를 거두었습니다. 실제로 의료 보건 분야에서 AI가 응용된다는 사실은 오래전부터 사람들에게 알려져 왔습니다. AI는 머신 러닝 알고리즘을 통해 방대한 양의 의료 데이터를 분석하고 의사가 질병을 더욱 정확하게 진단할 수 있도록 도와줍니다. 예를 들어, 암 탐지 분야에서 AI는 의료 영상에서 미묘한 이상을 식별하여 조기 진단의 성공률을 높일 수 있습니다.
게다가 AI는 약물 개발에도 중요한 역할을 합니다.한편으로는,AI는 약물 표적과 화합물 합성에 대한 이해를 심화시키고, 약물 발견 단계를 최적화하고, 새로운 약물 출시의 성공을 크게 높였습니다.반면에,AI 기술은 신약 개발 주기를 단축하고, 비용을 절감하며, 약물 개발 효율성과 기업 경쟁력을 크게 향상시키는 데 활용됩니다.
주목할 점은 "2024년 인공지능 지수 보고서"에서도 인공지능 관련 의료기기를 정리한 내용이며, 미국 식품의약국(FDA)의 AI 관련 의료기기 승인 건수가 지속적으로 증가하고 있다는 점이다. FDA는 2022년에 AI 관련 의료기기 139개를 승인했는데, 이는 전년보다 12.1%가 증가한 수치입니다. 이 수치는 2012년 이후 45배 이상 증가했으며, 이는 AI가 실제 의료 분야에 널리 사용되고 있음을 보여줍니다.
실제 의료에 AI 기술을 적용함으로써 많은 기회가 생겼지만, AI 윤리 문제, 데이터 개인정보 보호, 기술적 병목 현상, 감독 및 책임, 학제 간 협력, 임상 적용성 등 해결해야 할 과제도 많이 있습니다. 특히,에이I 모델의 "블랙박스" 특성은 의사결정 과정을 설명하기 어렵게 만드는데, 이는 높은 수준의 투명성과 추적성이 요구되는 의학적 진단에 있어 큰 과제입니다.설명 가능성이 부족하면 의사가 AI 지원 진단 결과를 신뢰하지 못할 수 있습니다.
따라서 기술적 반복 외에도 정책, 표준, 감독, 보안 등의 빈틈을 어떻게 메우고, 스스로의 '블랙박스' 특성을 어떻게 깨뜨릴 것인가에 대한 해결책을 찾기 위해서는 정부와 관련 기업이 공동으로 추진해야 할 과제가 여전히 남아 있습니다.
의료 영상: 보다 포괄적이고 심층적인 솔루션 제공
의료 영상 분야에서 AI 기술의 적용은 점점 더 다양하고 심도 있게 진행되고 있습니다. 진단 지원부터 업무 흐름 개선, 개인화된 의료 촉진까지 AI는 의료 영상에 없어서는 안 될 도구가 되어가고 있습니다.
신스SR
고해상도 이미지 변환 및 병변 복구
MIT의 컴퓨터 과학 및 인공지능 연구실에서 개발한 SynthSR은 1mm 등방성 고장장 MRI 스캔의 오픈 액세스 데이터 세트와 뇌 내 39개 관심 영역(ROI)의 정밀한 분할을 사용하여 초고해상도 합성곱 신경망(CNN)을 훈련합니다.이 기술은 자기준비 고속 경사 에코(MPRAGE) 획득 기술을 사용하는 동시에, 저주파(0.064T) T1 및 T2 가중 뇌 MRI 시퀀스에 초점을 맞춰 1mm 등방성 공간 분해능의 고품질 이미지를 생성하는 것을 목표로 합니다.

SynthSR의 고급 기능은 다음과 같습니다.이 제품은 다양한 방향, 해상도, 대비의 임상 MRI 스캔 데이터를 1mm 등방성 MPRAGE 이미지로 변환하고 이 과정에서 병변을 복구할 수 있습니다.
변환된 합성 MPRAGE 이미지는 영상 등록이나 분할과 같은 기존의 뇌 MRI 3D 이미지 분석 도구에 직접 적용될 수 있습니다.추가 교육이 필요하지 않습니다.또한, 합성 영상의 뇌 형태 측정 데이터와 실제 고자장 강도 영상을 비교함으로써, 이 연구는 정량적 신경방사선학 분야에서 LF-SynthSR의 응용 가능성을 더욱 검증했습니다.
논문 링크:
http://arxiv.org/pdf/2012.13340v1.pdf
CT 팬더
조기 췌장암 검진
췌장암의 숨겨진 위치와 일반 CT 이미지에서 명확한 증상이 나타나지 않는 점을 고려할 때,알리바바 DAMO 아카데미는 전 세계 10여 개 의료기관의 연구팀과 협력하여 AI를 사용하여 무증상 환자의 췌장암을 선별하고, 고유한 딥 러닝 프레임워크를 구축했으며, 궁극적으로 췌장암을 조기에 발견하기 위한 PANDA 모델을 훈련했습니다.
PANDA 모델은 여러 가지 딥러닝 기술을 결합하여 췌장 병변 탐지의 효율성과 정확성을 개선한 고급 의료 영상 분석 도구입니다. 이 모델은 먼저 분할 네트워크(U-Net)를 사용하여 췌장 영역을 정확하게 찾은 다음, 다중 작업 합성 신경망(CNN)을 사용하여 이미지의 이상을 식별합니다. 마지막으로, 2채널 변압기 모델을 사용하여 탐지된 이상을 분류하고 특정 췌장 병변 유형을 식별했습니다.
이 기술의 핵심적인 장점은 AI 알고리즘을 사용하여 육안으로 식별하기 어려운 일반 스캔 CT 이미지에서 작은 병변 특징을 확대하고 식별할 수 있다는 것입니다.이를 통해 조기 췌장암을 효율적이고 안전하게 검출할 수 있을 뿐만 아니라, 기존 검진 방법에서 발견되던 높은 위양성률 문제도 효과적으로 해결할 수 있습니다.

검증 시험에서 PANDA의 민감도는 일반 영상의학과 의사보다 34.1% 더 높았고, 특이도는 일반 영상의학과 의사보다 6.3% 더 높았습니다.약 20,000명의 환자를 대상으로 실시한 대규모 실제 테스트에서 PANDA는 92.9%의 민감도와 99.9%의 특이도를 달성했습니다.(전체 보고서를 보려면 여기를 클릭하세요: 20,000건의 사례 중 31건의 진단 누락이 확인되었으며, 알리바바 다모 아카데미는 췌장암 검진을 위한 "일반 스캔 CT + 대형 모델" 출시를 주도했습니다.)
의료 진단: 개인 맞춤형 정확한 진단 및 치료 계획 수립
진단 효율성과 정확성을 높이고, 개인 맞춤형 치료 계획을 제공하는 것부터 AI 기술은 의료 진단 분야에서 큰 잠재력을 가지고 있으며, 의료 서비스의 질과 환자 경험을 개선하는 데 도움이 됩니다.
결합 플라스모닉 적외선 센서
신경퇴행성 질환 진단 강화
신경퇴행성 질환의 진단 분야에서 임상 전 바이오마커를 검출하는 효과적인 도구가 부족하여 파킨슨 증후군 및 알츠하이머병과 같은 질병의 조기 진단이 큰 어려움에 직면하게 되었습니다. 질량 분석법이나 효소 결합 면역 측정법(ELISA)과 같은 전통적인 검출 방법은 어느 정도 도움이 되지만, 바이오마커의 구조적 상태 변화를 식별하는 데는 한계가 있습니다.
이 문제를 해결하려면EPFL의 연구팀은 신경망 기술, 표면 강화 적외선 흡수(SEIRA) 분광법을 이용한 플라스모닉 적외선 센서, 면역 분석 기술(ImmunoSEIRA)을 결합한 혁신적인 진단 방법을 개발하여 신경 퇴행성 질환의 단계와 진행을 정량적으로 분석할 수 있게 했습니다.

ImmunoSEIRA 센서는 특정 단백질을 표적으로 하는 항체로 변형된 금 나노로드 배열을 사용하여 극히 적은 양의 샘플에서 실시간으로 목표 바이오마커를 포착하고 구조 분석을 수행할 수 있습니다. 그런 다음 신경망을 사용하여 잘못 접힌 단백질, 올리고머 및 섬유 응집체를 식별하여 전례 없는 수준의 감지 정확도를 달성했습니다. 이 방법의 도입은 신경퇴행성 질환의 조기 진단 및 정확한 평가를 위한 새로운 기술적 수단을 제공합니다.
코닥
AI와 의사 진단의 논리적 통합
Google DeepMind는 CoDoC라는 의료 지원 인공지능 시스템을 개발했습니다. 이 시스템은 의료 이미지에 대한 심층적인 해석과 분석을 제공하도록 설계되었습니다. 시스템은 학습을 통해 언제 자체 판단에 의존해야 할지, 언제 의사의 의견을 채택해야 할지 결정할 수 있습니다.
구체적으로, DeepMind 팀은 임상의가 AI 도구를 사용하여 의료 이미지를 해석하는 데 도움이 되는 다양한 응용 시나리오를 탐구했습니다. 임상 환경에서의 모든 이론적 사례에 대해 CoDoC 시스템은 교육 데이터 세트의 각 사례에 대해 세 가지 입력만 필요합니다.* 첫 번째,예측된 AI 출력에 대한 신뢰도 점수는 0(확실히 질병 없음)에서 1(확실히 질병 있음)까지입니다.* 둘째,임상의가 의료 이미지를 해석하는 방식
* 마침내,질병의 객관적 존재.
주목할 점은 다음과 같습니다.CoDoC 시스템은 의료 이미지 자체에 직접 접근할 필요가 없습니다.

또한 DeepMind는 실제 익명화된 여러 과거 데이터 세트를 사용하여 CoDoC 시스템에 대한 포괄적인 테스트를 수행했습니다. 테스트 결과에 따르면 인간의 의료 전문 지식과 AI 모델 예측을 결합하면 가장 정확한 진단을 내릴 수 있습니다.이 방법의 정확도는 두 가지 방법 중 하나만을 사용했을 때보다 뛰어납니다.이 연구 결과는 AI가 인간 전문가와 협력하여 작업하는 것의 중요성을 강조하며, 의료 영상 진단의 정확성과 신뢰성을 개선하기 위한 새로운 관점을 제공합니다.
의료 Q&A: 진단 정확도 향상, 치료 계획 최적화, 환자 서비스 경험 향상
2020년에 연구자들은 지식 그래프 기반 의학 질의응답 시스템인 MedQA를 제안했습니다. 이 시스템은 지식 그래프를 사용하여 의학 분야의 구조화 및 반구조화 데이터를 표현하고 저장한 다음 그래프 검색, 추론 또는 매칭 기술을 통해 지식 그래프에서 답변을 검색하거나 생성합니다. MedQA가 출시된 이후, AI가 의학적 질문에 답하는 능력에 대한 관심이 더욱 커졌습니다.
GPT-4 메드프롬프트
정확도는 90%를 초과합니다.
Microsoft 연구팀이 개발한 GPT-4 Medprompt는 MedQA 데이터 세트(미국 의사 면허 시험 문제)에서 처음으로 정확도 90%를 넘어섰습니다.BioGPT, Med-PaLM 등 다수의 정밀 조정 방법을 능가합니다. 연구진은 또한 Medprompt 방법은 의학뿐만 아니라 전기 공학, 머신 러닝, 법률과 같은 전문 분야에도 보편적으로 적용 가능하다고 밝혔습니다.
Medprompt는 다음을 포함한 여러 가지 프롬프팅 전략을 결합한 것입니다.* 동적 소수 샘플 선택:연구진은 먼저 text-embedding-ada-002 모델을 사용하여 각 훈련 샘플과 테스트 샘플에 대한 벡터 표현을 생성했습니다. 그런 다음, 각 테스트 샘플에 대해 벡터 유사성을 기반으로 훈련 샘플에서 가장 유사한 k개의 샘플이 선택됩니다.* 자체 생성 사고 사슬:사고의 사슬(CoT) 방법은 모델이 단계별로 생각하도록 하고 일련의 중간 추론 단계를 생성하는 것입니다. Med-PaLM 2 모델의 전문가가 직접 작성한 사고 사슬 사례와 비교했을 때, GPT-4에서 생성된 사고 사슬 근거는 더 길고 단계별 추론 논리가 더 세분화되어 있습니다.
* 옵션 셔플 통합:GPT-4가 객관식 문제에 답할 때는 편향이 있을 수 있습니다. 즉, 선택지가 무엇이든 항상 A를 선택하거나, 항상 B를 선택하는 경향이 있습니다. 이를 위치 편향이라고 합니다. 이 문제를 줄이기 위해 연구진은 옵션의 원래 순서를 섞은 다음 GPT-4가 각 라운드에서 옵션의 순서를 다르게 하여 여러 라운드의 예측을 수행하도록 했습니다.

연구에 따르면 Medprompt는 2022년에 PubMedQA, MedMCQA, MMLU 등 여러 유명 의학 벤치마크 테스트의 객관식 섹션에서 1위를 차지한 Flan-PaLM 540B보다 각각 3.0%, 21.5%, 16.2% 포인트 더 좋은 성적을 기록했습니다. 그 성능은 당시 가장 진보된 Med-PaLM 2를 능가했습니다.
메디트론-70B
헬스케어를 위한 최고의 오픈소스 대규모 언어 모델
GPT-4 Medprompt는 폐쇄형 소스 시스템이기 때문에 일반 대중의 무료 사용은 제한적입니다. 이 문제를 해결하려면로잔에 있는 스위스 연방 기술 연구소의 연구원들은 이 시스템을 기반으로 MediTron-70B를 개발하여 다음과 같은 목표를 달성하고자 했습니다.의료 분야를 위한 오픈 소스, 고성능 대규모 언어 모델입니다.
MediTron은 딥러닝 알고리즘입니다.Llama 2 아키텍처를 기반으로 구축되었으며 Nvidia의 Megatron-LM 분산 트레이너를 사용하여 미세 조정되었습니다.동시에 포괄적인 의료 자료에 대한 확장된 사전 훈련이 수행되었습니다. 이 자료는 PubMed에서 엄선한 논문, 초록, 국제적으로 인정받는 의학 지침으로 구성되어 있습니다.

MediTron 시리즈에는 MediTron-7B와 MediTron-70B의 두 가지 모델이 있습니다. 안에,MediTron-70B의 성능은 GPT-3.5와 Med-PaLM을 능가했으며, GPT-4와 Med-PaLM-2 수준에 가깝습니다.
오픈소스 의료 LLM 개발을 촉진하기 위해 개발팀은 사용하는 의료 사전 교육 코퍼스와 MediTron 모델의 가중치 코드를 공개했습니다. MediTron-70B는 MedQA에서 오픈 소스 모델 중 가장 높은 점수를 달성했습니다. 이는 오픈 소스 의료 LLM 분야에서 중요한 진전을 나타내는 성과입니다.
논문 링크:
https://arxiv.org/pdf/2311.16079.pdf
메드얼라인
의료 행정의 부담을 줄여줍니다
현재의 의료 분야에서 텍스트 생성 작업을 위한 전자 건강 기록(EHR) 질의 응답 데이터 세트는 임상의가 정보 요구 분석 및 문서 처리에서 직면하는 복잡성을 적절히 포착하지 못합니다.
이러한 격차를 메우기 위해 다양한 전문 분야의 임상의 15명으로 구성된 팀이 출범했습니다. MedAlign - EHR 데이터를 기반으로 한 벤치마크 데이터 세트. 이 데이터 세트에는 983개의 실제 임상 질문과 그에 대한 지침, 그리고 303명의 임상의가 제공한 답변이 포함되어 있으며, 276개의 종단적 EHR 데이터를 분석하여 지침-응답 쌍을 구성했습니다.
이 연구는 복잡한 임상 업무에서 LLM의 실용성에 대한 평가 기준이 부족하다는 문제를 해결할 뿐만 아니라, 현실적이고 포괄적인 명령 응답 데이터 세트를 제공함으로써 의료 분야에서 자연어 생성에 대한 연구 진행을 촉진합니다.

연구진은 MedAlign 데이터세트에서 다양한 일반 도메인의 6개 대규모 언어 모델을 테스트하고 임상의가 각 대규모 모델에서 생성한 응답의 정확도와 품질을 평가했습니다.
결과는 다음과 같습니다여러 단계의 최적화를 거친 GPT-4 모델 변형은 일반적으로 다른 LLM보다 선호되는 65.0%의 정확도를 달성했습니다. MedAlign은 EHR 애플리케이션을 광범위하게 포괄하는 최초의 벤치마크 데이터 세트로서, 인공지능 기술을 사용하여 의료의 행정적 부담을 줄이는 데 있어 중요한 진전을 나타냅니다.
논문 링크:
https://arxiv.org/pdf/2308.14089.pdf
의학 연구: AI를 활용해 인간 건강을 위한 가장 강력한 방어선 구축
기술의 지속적인 발전으로 의학 연구 분야에서 AI 기술의 적용이 더욱 광범위하고 심도 있게 진행되고 있습니다. 오늘날 과학자들은 AI의 힘을 활용해 인간 유전자 코드를 심층적으로 탐구하고, AI를 사용하여 견고한 의료 방어선을 구축하고 있습니다.
알파미센스
유전자의 병원성 미스센스 돌연변이를 효과적으로 식별합니다.
Google DeepMind 팀은 AlphaFold를 기반으로 새로운 AI 모델인 AlphaMissense를 더욱 발전시켰습니다.이 모델은 AlphaFold가 제공하는 고정밀 단백질 구조 모델과 관련 시퀀스에서 추출한 제한적 진화 알고리즘을 결합한 것입니다. AlphaMissense의 훈련 과정은 두 단계로 나뉩니다.
* 첫 번째 단계는 AlphaFold의 훈련과 유사하며, 단백질 언어 모델의 가중치를 강화하는 데 중점을 둡니다.
* 두 번째 단계에서는 병원성을 더욱 정확하게 일치시키기 위해 모델을 미세 조정하고, 집단 내 빈도에 따라 돌연변이에 양성 또는 병원성 라벨을 지정하는 데 중점을 둡니다.

연구 결과는 다음과 같습니다.AlphaMissense는 인간 단백질 코딩 유전자에서 7,100만 개의 미스센스 돌연변이를 성공적으로 예측했습니다.미스센스 돌연변이는 단백질 기능에 영향을 미치는 유전적 변이로, 암을 포함한 다양한 질병을 유발할 수 있습니다. 이러한 잠재적인 미스센스 변형 중에서,AlphaMissense는 89% 변종을 분류할 수 있었으며, 그 중 약 57%는 양성일 가능성이 높은 변종(Likely benign)으로, 32%는 병원성일 가능성이 높은 변종(Likely pathogenic)으로, 나머지 변종은 불확실한 특성(Uncertain)으로 분류되었습니다.
이러한 분류 능력은 모든 미스센스 돌연변이 중에서 0.11개의 TP3T만 식별할 수 있는 인간 주석자의 능력을 훨씬 능가합니다. AlphaMissense의 높은 효율성과 정확성은 유전 질환의 연구와 임상 진단을 위한 강력한 도구를 제공합니다.
논문 링크:
https://www.science.org/doi/10.1126/science.adg7492
이브스케이프
팬데믹 조기 경보 시스템
하버드 의과대학과 옥스퍼드 대학의 연구팀은 혁신적인 범용 모듈형 프레임워크인 EVEscape를 공동으로 개발했습니다.팬데믹 동안 시퀀싱 데이터나 항체 구조 정보에 의존하지 않고도 바이러스의 탈출 가능성을 예측할 수 있는 능력.
EVEscape를 이용해 SARS-CoV-2 팬데믹 돌연변이를 예측하는 정확도는 고처리량 심층 돌연변이 스캐닝(DMS) 기술과 비슷한 수준이며, SARS-CoV-2에만 국한되지 않고 다른 바이러스 유형으로 확장 적용될 수 있습니다. 이러한 조기 경보 시스템은 공중 보건 관련 의사 결정과 대비 태세를 안내하여, 전염병이 인간의 건강과 사회경제에 미치는 부정적 영향을 최소화하는 데 도움이 됩니다.

EVEscape 프레임워크는 두 가지 주요 부분으로 구성됩니다.* 한 부분은 진화적 시퀀스를 생성하기 위한 모델입니다.이 모델은 EVE(진화적 바이러스 탈출) 프로젝트에서 사용된 모델과 유사하게, 가능한 바이러스 돌연변이에 대한 통찰력을 제공합니다.
* 또 다른 부분은 바이러스에 대한 자세한 생물학적, 구조적 정보를 담은 데이터베이스입니다.EVEscape는 이 두 가지 구성 요소를 통합하여 바이러스 변종이 실제로 나타나기 전에 그 특성을 예측할 수 있습니다.
연구팀은 SARS-CoV-2 팬데믹에 대한 회고적 분석을 통해 팬데믹 탈출 가능성이 있는 돌연변이를 예측하는 데 있어 EVEscape가 효과적임을 확인했으며, 이는 기존 항체 및 혈청학 실험에 의존하는 방법보다 수개월 앞서 예측하는 동시에 비슷한 정확도를 유지했습니다. EVEscape를 사용하여 잠재적인 탈출 돌연변이를 조기에 식별하면 바이러스 확산을 보다 효과적으로 통제하기 위한 백신과 치료제를 설계하는 데 중요한 정보를 제공할 수 있습니다.
논문 링크:
https://doi.org/10.1038/s41586-023-06617-0
인간 팬게놈 참조
인간 팬게놈 매핑의 첫 번째 초안
21세기 초, 인간 게놈 프로젝트는 인간 참조 게놈의 예비 초안을 성공적으로 공개하면서, 인간이 자신의 생명 청사진을 이해하는 데 획기적인 진전을 이루었습니다. 그러나 당시 시퀀싱 기술의 한계로 인해 초안에는 채워지지 않은 빈칸이 여러 개 있었습니다.
2023년, 워싱턴 대학교 의과대학과 캘리포니아 대학교가 이끄는 60개 기관의 과학자 119명으로 구성된 국제 컨소시엄은 인공지능 기술을 사용하여 최초로 업데이트되고 보다 대표성이 높은 인간 범게놈 초안을 개발했습니다.
이 초안에서는 첨단 "장독 시퀀싱" 기술을 사용하여 전 세계에서 서로 다른 조상적 배경을 가진 47명의 개인으로부터 얻은 94개 유전체 샘플에 대한 심층 분석을 실시했습니다.긴 DNA 조각들은 맞춤형 알고리즘을 사용하여 더욱 완전한 게놈 시퀀스로 조립되었습니다. 결과에 따르면, 초안은 예상 시퀀스에 대해 99% 적용 범위를 달성했으며, 구조와 염기쌍 정확도 측면에서도 99%를 넘어섰습니다.

GRCh38 기반의 기존 워크플로와 비교했을 때, 새로운 초안은 단편 읽기 데이터를 분석할 때 더욱 효율적입니다.34%는 작은 유전적 변이를 발견하는 데 발생하는 오류를 줄였고, 104%는 1억 1,900만 개의 염기쌍을 추가하여 염색체 구조 변이의 검출률을 향상시켰습니다.또한, 새로운 초안에서는 유전자 발현을 조절하는 두 가지 중요한 새로운 구성 요소인 HIRA와 SATB2도 공개되었습니다. 이러한 연구 결과는 인간 유전체의 구조와 기능을 더 깊이 이해하는 데 매우 중요합니다.
2024년, AI가 과학 연구의 미래를 이끈다
놀라운 잠재력을 지닌 인공지능은 과학적 진보와 의학 발전을 위한 핵심 원동력이 되고 있습니다. 2024년, AI의 급속한 발전은 과학 연구와 의학에 혁명적인 변화를 가져올 것이며, 그 속도와 영향은 그 어느 때보다 훨씬 클 것입니다. AI는 지식 축적과 혁신 주기를 가속화할 뿐만 아니라, 복잡한 문제를 이해하고 해결하는 방식을 새롭게 정의하고 있습니다.
과학 연구 분야에서AI 알고리즘과 모델은 과학자들이 방대한 데이터 세트를 처리하고 분석하여 데이터 뒤에 숨겨진 심층적인 통찰력을 밝혀내는 데 도움이 됩니다. 그들은 복잡한 시스템의 행동을 시뮬레이션하고 예측하는 데 엄청난 이점을 보여주었고, 물리학, 화학, 생물학 등 많은 기초 과학 분야에서 획기적인 발견을 이끌어냈습니다.
의료 분야에서는AI 지원 진단 도구는 점점 더 정확해지고 있으며, 질병 징후를 조기에 감지하고 환자에게 더 적절한 치료를 제공할 수 있게 되었습니다. 동시에, 개인맞춤형 의료에 AI를 적용하면 개별 유전 정보와 바이오마커를 분석하여 환자에게 더욱 정확한 치료 계획을 맞춤화할 수 있으며, 이를 통해 치료 결과와 환자의 삶의 질이 크게 향상됩니다.
또한,약물 개발에 있어서 AI의 역할을 과소평가해서는 안 됩니다.분자의 활동과 약물의 부작용을 예측함으로써 실험실에서 개발된 신약이 시장에 출시되기까지의 주기를 크게 단축하고, 연구 개발 비용을 절감하며, 신약을 시장에 출시하는 과정을 가속화합니다.
AI의 모든 진보는 인간 지혜의 긴 강에 돌을 던지는 것과 같다고 할 수 있습니다. 그 돌은 파장을 일으켜 과학 연구와 의학의 경계를 넓혀줍니다. 도구를 잘 다루는 인간은 결국 이러한 자극의 힘을 이용해 더욱 지능적이고 건강한 새로운 시대로 나아갈 것입니다.