【ScienceAI Weekly】딥마인드의 AI 제약회사가 분사해 30억 달러 규모의 새로운 계약을 체결했습니다. 바이트댄스, 미국에서 생물학/화학/물리학 분야 인재 모집 나선다

과학을 위한 AI의 새로운 성과, 새로운 발전, 새로운 관점——* DeepMind에서 분사된 AI 제약 회사, 30억 달러 규모의 첫 제약 협력 체결 * Microsoft, 연구원들이 3,200만 개의 새로운 배터리 소재를 발견하도록 지원 * TikTok, 미국 전역에서 계산 생물학, 양자 화학, 분자 동역학 및 물리학 분야의 인재를 모집 중이라고 알려짐 * iFlytek, 의료 사업을 분사하여 홍콩 증권 거래소 메인보드에 상장할 계획 * Magnesium Chemical, 시리즈 A 자금 조달에서 2,600만 달러 완료 * 학술지 Science, AI 도구를 사용하여 저널의 가짜 이미지 감지
자세한 내용은 아래를 참조하세요~
회사 뉴스
DeepMind에서 분사된 AI 제약 회사, 첫 제약 회사와 파트너십 체결
1월 8일, 알파벳 산하의 AI 제약 회사인 아이소모픽 랩스는 엘리 릴리와 노바티스와 30억 달러 규모의 두 건의 약물 연구 개발 계약을 체결했다고 발표했습니다. 협력에는 다양한 질병 관련 단백질과 경로에 대한 치료법 개발이 포함됩니다. 아이소모픽 랩스는 2021년 11월에 설립되었으며, 구글의 딥마인드에서 분사되어 AI 의학 분야에 중점을 두고 있습니다. 이 회사는 생물의학 연구 분야에서 DeepMind의 업적, 특히 단백질 구조 예측 모델인 AlphaFold를 활용해 약물 개발을 진행했습니다.
Microsoft, 연구자들이 3,200만 개의 새로운 배터리 소재를 발견하도록 지원
태평양 북서부 국립 연구소는 Microsoft의 Azure Quantum Elements 서비스를 사용하여 3,200만 개의 잠재적인 새로운 배터리 소재를 빠르게 평가했다고 보고되었습니다. 미국 에너지부는 이 서비스를 사용한 지 80시간 만에 18개의 유망한 후보 물질을 발견했는데, 이는 기존 연구 방법을 사용했다면 수십 년이 걸렸을 일입니다. 영국의 화학 제조업체인 존슨 매티는 이 서비스를 활용하여 수소 연료 전지의 연구 개발을 가속화하고 있습니다.
TikTok이 미국 전역에서 계산생물학, 양자화학, 분자역학, 물리학 분야의 인재를 모집하고 있다고 합니다.
TikTok의 모회사인 ByteDance가 AI 약물 설계 및 AI 과학 팀을 위해 계산 생물학, 양자 화학, 분자 동역학 및 물리학 분야의 인재를 모집하고 있다는 보도가 나왔습니다. ByteDance는 뉴욕, 캘리포니아, 워싱턴 주에서 최소 17개의 관련 직책을 모집하고 있다고 알려졌습니다.
아이플라이텍, 의료사업 분사해 홍콩증권거래소 상장 계획
1월 9일 저녁, iFLYTEK은 자사의 지배 자회사인 iFLYTEK Medical을 분사하여 홍콩 증권거래소 주거래소에 상장할 계획이라고 발표했습니다. iFlytek Medical의 현재 공모 규모는 발행 후 총 주식 자본의 15%를 초과하지 않을 것입니다. 분사가 완료된 후에도 iFLYTEK은 iFLYTEK Medical에 대한 통제권을 계속 유지합니다.
2016년 5월에 설립된 iFlytek Medical은 의료 의미 컴퓨팅, 텍스트 이해, 지식 추론, 데이터 마이닝과 같은 세계 최고의 핵심 기술을 기반으로 인공 지능 의료 솔루션 시스템을 구축했습니다. 1차 의료기관, 병원, 환자, 주민 등 의료업계 종사자의 광범위한 요구를 대상으로 하며, 질병 경고, 조기 검진, 진단, 치료 및 효능 평가부터 진단 후 관리 및 만성 질환 관리까지 전체 의료 과정을 포괄합니다.
마그네슘 케미컬, 2,600만 달러 규모의 시리즈 A 자금 조달 완료
상하이 메이루이 테크놀로지(Shanghai Meirui Technology Co., Ltd.)는 최근 Qiming Venture Partners와 LYFE Capital이 공동으로 주도하고 Sinovation Ventures와 Mega Technology가 뒤따른 2,600만 달러 규모의 시리즈 A 자금 조달 라운드를 완료했습니다. 자금은 제품 연구 및 개발을 더욱 개선하고, 상업 시장을 확대하고, 국제적 레이아웃을 지원하는 데 사용될 예정입니다.
마그네슘케미칼은 2022년 1월에 설립되었으며, 메가에 의해 육성되어 엔젤 라운드 투자를 완료했습니다. 이 회사는 국제적인 학제간 배경을 가진 팀에 의해 설립되었습니다. 자동화 및 지능형 플랫폼을 사용하여 신약 연구 개발 고객을 위한 차세대 화학 합성 CRO 서비스를 제공하고, 신약 연구 개발 주기에서 화학 합성의 전달 주기를 크게 단축하고, 화학 합성 관련 비용을 크게 절감하는 데 전념하고 있습니다. 이를 통해 약물 화학 합성이 수동 작업에 크게 의존하는 현재 상황을 없앨 것입니다.
학술지 '사이언스', AI 도구 활용해 저널 속 가짜 이미지 감지
과학계에서는 Proofig 플랫폼을 구축하고 몇 달 동안 실험을 진행해 왔으며, 독자를 오도하기 위해 조작된 이미지 등 문제가 있는 데이터를 논문이 출판되기 전에 감지할 수 있다는 확실한 증거를 제시했습니다. 또한, Science는 텍스트 표절 탐지 소프트웨어와 함께 이 탐지 도구를 사용하여 수동 검토를 대체합니다.
도구 및 리소스
화웨이와 홍콩대학교, 오픈소스 기하학적 수학 모델 G-LLaVA 공개
현재 대규모 다중 모드 언어 모델은 여전히 기하학적 도형의 기본 요소와 그 관계를 정확하게 구문 분석할 수 없습니다. 이 문제를 해결하기 위해 화웨이 노아의 방주 연구실, 홍콩대학교, 홍콩과학기술대학교는 공동으로 전문적 기하 수학 모델 G-LLaVA를 오픈 소스로 공개했습니다. G-LLaVA의 성능을 테스트하기 위해 연구진은 잘 알려진 수학 테스트 플랫폼인 MathVista에서 다른 대형 모델을 사용하여 심층적인 평가를 수행했습니다. 결과는 G-LLaVA의 성능이 GPT-4-V, LLaVA1.5, MiniGPT-4와 같은 모델의 성능을 능가한다는 것을 보여줍니다.
오픈소스 주소:
https://github.com/pipilurj/G-LLaVA
서류 주소:
https://arxiv.org/abs/2312.11370
상하이 AI 실험실 오픈소스 의료 모델 그룹 "푸이 2.0"
최근 상하이 AI 연구실은 상하이 교통대학 의학부 산하 루이진 병원 등의 파트너와 함께 의료 멀티모달 기초 모델 그룹인 'OpenMEDLab2.0'을 공동으로 출시하여, 의료용 대형 모델 그룹의 '생산, 학습, 연구, 응용, 평가'를 원스톱 오픈 소스로 실현하고, '영역 간, 질병 간, 모달 간' AI 의료 응용 프로그램에 대한 역량 지원을 목표로 하고 있습니다.
오픈소스 주소:
github.com/OpenMEDLab
중국 최초의 의료 전문 추론 데이터 세트 RJUA-QA가 이제 오픈 소스로 제공됩니다.
Ant Group과 상하이 런지 병원 비뇨기과 전문가 팀은 의사 팀의 임상 경험을 바탕으로 시뮬레이션 사례 데이터를 구성하여 최초의 중국 의학 전문 분야 질의응답 추론 데이터 세트인 RJUA-QA를 공동으로 개발하고 출시했습니다. 데이터 세트는 훈련, 검증, 테스트의 세 부분으로 구성되며, 2,132개의 QA 질문-답변 쌍을 포함합니다. 이 문맥은 중국 비뇨기과 및 남성과 질환의 진단 및 치료에 대한 지침에서 나왔습니다. 이 질병 유형은 비뇨기과 의료 인구의 97.6% 이상을 포괄하며 진단 및 치료 시나리오를 실제로 재현할 수 있습니다.
데이터 세트 주소:
http://openkg.cn/dataset/rjua-qadatasets
paperai: 의학/과학 문헌 검색 및 검토 엔진
paperai는 의학/과학 논문을 위한 AI 기반 문헌 발견 및 검토 엔진입니다. 이 도구는 특정 기준을 충족하는 논문을 걸러내기 위한 쿼리를 실행하고, 질의-답변 추출 기술을 기반으로 한 보고 기능을 수행하여 일련의 의학/과학 논문에서 주요 질문에 대한 답변을 찾습니다. paperai는 COVID-19 오픈 연구 데이터 세트(CORD-19)를 분석하는 데 사용되었으며 CORD-19 Kaggle 챌린지에서 여러 상을 수상했습니다.
도구 주소:
https://paperpal.com/paperpal-for-researchers
DeepKE: 딥러닝 기반 저장대학교의 오픈소스 중국어 지식 그래프 추출 도구
DeepKE는 기존의 전체 감독, 리소스가 부족한 소수 샘플 및 문서 수준 시나리오를 지원하는 오픈 소스이자 확장 가능한 지식 그래프 추출 도구로, 명명된 엔터티 인식, 관계 추출 및 속성 추출을 포함한 다양한 정보 추출 작업을 포괄합니다. DeepKE는 통합된 프레임워크를 통해 개발자와 연구자가 데이터 세트와 모델을 사용자 정의하고, 구조화되지 않은 텍스트에서 필요에 따라 정보를 추출할 수 있도록 지원합니다.
도구 주소:
http://openkg.cn/tool/deepke
ResGen: 단백질 주머니 인식을 기반으로 한 3D 분자 생성 모델
저장대학과 지장연구실의 연구팀은 단백질 포켓을 기반으로 한 3D 분자 생성 모델인 ResGen을 제안했습니다. 이는 주어진 표적 내에서 유기 분자를 설계하는 데 사용됩니다. ResGen은 현재 가장 뛰어난 기술보다 약 8배나 더 빠른 계산 효율성을 가지고 있으며, 새로운 분자를 생성하는 성공률도 현재 가장 뛰어난 방법보다 더 높습니다.
오픈소스 주소:
https://github.com/HaotianZhangAI4Science/ResGen
연구 결과
생성 AI, 6초 만에 새로운 화학 반응 생성
객체 인식 등가 기본 반응 확산 모델을 사용한 정확한 전이 상태 생성

* 출처: Nature Computational Science
* 분야 : 화학, 머신러닝
* 저자: MIT팀
연구자들은 화학 반응의 전이 상태를 몇 초 만에 발견할 수 있는 기계 학습을 기반으로 한 대체 방법을 개발했습니다. 새로운 모델은 화학자들이 연료 화합물이나 약물과 같은 유용하고 부가가치가 높은 제품을 만들어낼 수 있는 새로운 반응과 촉매를 탐구하고 설계하는 데 도움이 될 수 있습니다. 또한, 이 모델은 자연적으로 발생하는 화학 반응을 시뮬레이션할 수 있습니다.
원본 기사를 읽어보세요:
https://www.nature.com/articles/s43588-023-00563-7
연합 학습을 기반으로 한 폐기된 배터리에 대한 빠른 분류 모델
연합 머신 러닝을 통한 수익성 있는 직접 재활용을 위한 협력적이고 개인 정보 보호 방식의 폐기 배터리 분류

* 출처: Nature Communications
* 분야 : 커뮤니케이션 과학, 머신 러닝
* 저자: 청화대학교 선전국제대학원 장쉬안, 주광민
연구팀은 연합 학습을 기반으로 폐기된 배터리에 대한 신속한 분류 모델을 구축했으며, 이를 통해 과거 운영 데이터가 필요 없이 소량의 현장 테스트 정보만으로 폐기된 배터리 양극 소재를 정확하게 분류할 수 있었습니다.
원본 기사를 읽어보세요:
https://doi.org/10.1038/s41467-023-43883-y
UniKP: 효소 반응 속도론적 매개변수 예측을 위한 통합 프레임워크
UniKP: 효소 반응 속도론적 매개변수 예측을 위한 통합 프레임워크

* 출처: Nature Communications
* 분야 : 생명공학, 언어 모델링
* 저자 : 중국과학원 팀
연구진은 사전 훈련된 대규모 언어 모델과 머신 러닝 모델을 기반으로 효소 운동 매개변수 예측 프레임워크(UniKP)를 개발했습니다. 이 프레임워크는 주어진 효소의 아미노산 서열과 기질의 구조적 정보만을 사용하여 다양한 효소 반응 속도론적 매개변수를 예측할 수 있습니다.
원본 기사를 읽어보세요:
https://www.nature.com/articles/s41467-023-44113-1
DeepProSite: 단백질 결합 부위 식별
DeepProSite: ESMFold와 사전 학습된 언어 모델을 사용한 구조 인식 단백질 결합 부위 예측

* 출처 : 생물정보학
* 분야 : 생물의학, 언어모델
* 저자: 상하이 교통대학교 및 중산대학교 팀
DeepProSite는 단백질 구조와 서열 정보를 사용하여 단백질 결합 부위를 식별합니다. ESMFold에서 단백질 구조를 생성하고, 사전 훈련된 언어 모델에서 시퀀스 표현을 생성하며, Graph Transformer를 사용하여 그래프 노드 분류로 결합 부위 예측을 공식화합니다.
원본 기사를 읽어보세요:
https://academic.oup.com/bioinformatics/article/39/12/btad718/7453375
예정된 이벤트
ALCF 교육: 연구를 위한 AI 촉진을 위한 슈퍼컴퓨터 기초

"슈퍼컴퓨터를 활용한 AI 기반 과학 소개"는 Argonne Leadership Computing Facility(ALCF)가 주최하는 무료 온라인 이벤트 시리즈로, 강의와 실습 세션의 두 부분으로 나뉩니다. 코스 설정은 다음과 같습니다.
* 1주차: 슈퍼컴퓨터 소개
* 2주차: 신경망 소개
* 3주차: 신경망에 대한 심층 탐구
* 4주차: 대규모 언어 모델 소개
* 5주차: 대규모 언어 모델의 임베딩 및 토큰화
* 6주차: AI를 위한 병렬 학습 방법
등록 링크:
https://www.alcf.anl.gov/alcf-ai-science-training-series?ct=t(EVT-ALCFINTROTOAI_01092024)
이상 "사이언스AI주간"이 공유하고자 하는 모든 내용입니다~
AI for Science에 대한 최신 연구 결과나 기업에 대한 직접적인 정보 등이 있으시면, "정보 공개"를 위한 메시지를 남겨주세요.