岁序更替,华章日新。在刚刚过去的 2023 年中,AI for Science 带来了太多惊喜,也埋下了更具想象空间的种子。
从 2020 年开始,以 AlphaFold 为代表的科研项目将 AI for Science 推向了 AI 应用的主舞台。两年来,从生物医药到天文气象、再到材料化学等基础学科,都成为了 AI 的新战场。在这个过程中,AI 的能力也具象化为一柄利刃,甚至可以劈开困扰人们半个世纪的桎梏,大大加速了科研进程。
珠玉在前,进入 2023 年后,AI 在科研领域的征程也更加顺畅,越来越多的研究团队开始寻求 AI 的帮助,从而催生了更多的高价值成果。
作为最早一批关注到 AI for Science 的社区,「HyperAI 超神经」通过解读前沿论文的方式持续记录其最新进展,一方面是将最新的成果、研究方法进行普适化分享,另一方面也是希望能够令更多团队看到 AI 对于科研的帮助,为 AI for Science 在国内的发展贡献力量。
岁末年初,正是观往知来的好时节,我们将「HyperAI 超神经」在 2023 年解读的前沿论文进行了分类汇总,方便不同科研领域的读者检索。
关注微信公众号,在后台回复 「2023 ScienceAI」即可打包下载全部论文。另外,部分论文中所使用的数据集可以在「HyperAI 超神经」官网下载获取。
下载地址:
Machine learning models to accelerate the design of polymeric long-acting injectables
*来源:Nature Communications
*作者:多伦多大学研究人员
*解读:横向对比 11 种算法,多伦多大学推出机器学习模型,加速长效注射剂新药研发(点击阅读原文)
*论文:
https://www.nature.com/articles/s41467-022-35343-w
Machine learning enhances prediction of plants as potential sources of antimalarials
*来源:Frontiers in Plant Science
*作者:英国皇家植物园及圣安德鲁斯大学的研究人员
*解读:英国皇家植物园采用机器学习预测植物抗疟性,将准确率从 0.46 提升至 0.67(点击阅读原文)
*论文:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10248027
A live-cell image-based machine learning strategy for reducing variability in PSC differentiation systems
*来源:Cell Discovery
*作者:北京大学赵扬课题组、张钰课题组联合北京交通大学刘一研课题组
*解读:北京大学研发基于机器学习的多能干细胞分化系统,高效、稳定制备功能性细胞(点击阅读原文)
*论文:
https://www.nature.com/articles/s41421-023-00543-1
Predicting pharmaceutical inkjet printing outcomes using machine learning
*来源:International Journal of Pharmaceutics: X
*作者:圣地亚哥德孔波斯特拉大学、伦敦大学学院的研究人员
*解读:药物 3D 打印新突破:圣地亚哥大学用机器学习筛选喷墨打印生物墨水,准确率高达 97.22%(点击阅读原文)
*论文:
https://www.sciencedirect.com/science/article/pii/S2590156723000257
Deep learning-guided discovery of an antibiotic targeting Acinetobacter baumannii
*来源:Nature Chemical Biology
*作者:麦克马斯特大学、麻省理工学院的研究人员
*解读:AI 对抗超级细菌:麦克马斯特大学利用深度学习发现新型抗生素 abaucin(点击阅读原文)
*论文:
https://www.nature.com/articles/s41589-023-01349-8#access-options
Discovery of Senolytics using machine learning
*来源:Nature Communications
*作者:梅奥诊所的 James L. Kirkland 博士等人
*解读:拒绝细胞衰老、远离老年疾病,爱丁堡大学给细胞开出 3 张「AI 抗衰处方」(点击阅读原文)
*论文:
https://www.nature.com/articles/s41467-023-39120-1
Identifying Neural Signatures of Dopamine Signaling with Machine Learning
*来源:ACS Chemical Neuroscience
*作者:美国加利福尼亚大学伯克利分校的研究团队
*解读:「量化」快乐:UC Berkeley 利用 AI 追踪多巴胺释放量及释放脑区(点击阅读原文)
*论文:
https://pubs.acs.org/doi/full/10.1021/acschemneuro.3c00001
Discovering small-molecule senolytics with deep neural networks
*来源:Nature Aging
*作者:麻省理工学院的研究人员
*解读:拨慢人体衰老时钟,MIT 利用 Chemprop 模型发现兼具药效与安全性的细胞抗衰化合物(点击阅读原文)
*论文:
https://www.nature.com/articles/s43587-023-00415-z
Accurate proteome-wide missense variant effect prediction with AlphaMissense
*来源:Science
*作者:DeepMind
*解读:DeepMind 利用无监督学习开发 AlphaMissense,预测 7100 万种基因突变(点击阅读原文)
*论文:
https://www.science.org/doi/10.1126/science.adg7492
Deep Learning Empowers the Discovery of Self-Assembling Peptides with Over 10 Trillion Sequences
*来源:Advanced Science
*作者:西湖大学的李文彬课题组
*解读:西湖大学利用 Transformer 分析百亿多肽的自组装特性,破解自组装法则(点击阅读原文)
*论文:
https://onlinelibrary.wiley.com/doi/full/10.1002/advs.202301544
Macrocyclization of linear molecules by deep learning to facilitate macrocyclic drug candidates discovery
*来源:Nature Communication
*作者:华东理工大学的李洪林课题组
*解读:华东理工李洪林课题组开发 Macformer,加速大环类药物发现(点击阅读原文)
*论文:
https://www.nature.com/articles/s41467-023-40219-8
A principal odor map unifies diverse tasks in olfactory perception
*来源:Science
*作者:Google Research 的分支 Osmo 公司
*解读:Google 基于 GNN 开发气味识别 AI,工作量相当于人类评价员连续工作 70 年(点击阅读原文)
*论文:
https://www.science.org/doi/full/10.1126/science.ade4401
Rules and mechanisms governing G protein coupling selectivity of GPCRs
*来源:Cell Reports
*作者:佛罗里达大学的研究人员
*解读:佛罗里达大学利用神经网络,解密 GPCR-G 蛋白偶联选择性(点击阅读原文)
*论文:
https://doi.org/10.1016/j.celrep.2023.113173
Demonstration of an AI-driven workflow for autonomous high-resolution scanning microscopy
*来源:Nature Communications
*作者:美国阿贡国家实验室的研究人员
*解读:美国阿贡国家实验室发布快速自动扫描套件 FAST,助力显微技术「快速阅读」成为可能(点击阅读原文)
*论文:
https://www.nature.com/articles/s41467-023-40339-1
Machine learning‑based predictive models for the occurrence of behavioral and psychological symptoms of dementia: model development and validation
*来源:Scientifc Reports
*作者:韩国延世大学研究团队
*解读:有效延缓痴呆症:延世大学发现梯度提升机模型能准确预测 BPSD 亚综合征(点击阅读原文)
*论文:
https://www.nature.com/articles/s41598-023-35194-5
Robust Feature Selection strategy detects a panel of microRNAs as putative diagnostic biomarkers in Breast Cancer
*来源:CIBB 2023
*作者:意大利那不勒斯费德里科二世大学的研究人员
*解读:特征选择策略:为检测乳腺癌生物标志物寻找新出口(点击阅读原文)
*论文:
https://www.researchgate.net/publication/372083934
Machine learning-based models to predict one-year mortality among Chinese older patients with coronary artery disease combined with impaired glucose tolerance or diabetes mellitus
*来源:Cardiovascular Diabetology
*作者:中国湖北省麻城市人民医院的研究人员
*解读:收集 301 医院 451 名老年冠心病患者数据,湖北麻城人民医院推出机器学习模型,准确预测患者一年内死亡率(点击阅读原文)
*论文:
https://cardiab.biomedcentral.com/articles/10.1186/s12933-023-01854-z
A high-performance neuroprosthesis for speech decoding and avatar control
*来源:Nature
*作者:加州大学团队
*解读:中风失语 18 年,AI + 脑机接口帮她「意念发声」(点击阅读原文)
*论文:
https://www.nature.com/articles/s41586-023-06443-4
Performance of a Breast Cancer Detection AI Algorithm Using the Personal Performance in Mammographic Screening Scheme
*来源:Radiology
*作者:英国诺丁汉大学的研究团队
*解读:「粉红杀手」通缉令,AI 阅读乳腺 X 光片的能力已与医生相当(点击阅读原文)
*论文:
https://pubs.rsna.org/doi/10.1148/radiol.223299
Self-supervised learning of hologram reconstruction using physics consistency
*来源:bioRxiv
*作者:中科院基因组所
*解读:OBIA:900+ 患者、 193w+ 影像,中科院基因组所发布我国首个生物影像共享数据库(点击阅读原文)
*论文:
https://www.nature.com/articles/s42256-023-00704-7
A foundation model for generalizable disease detection from retinal images
*来源:Nature
*作者:伦敦大学学院和 Moorfields 眼科医院的在读博士周玉昆等人
*解读:160w+ 未标注图像、 3 个维度全方位评估,周玉坤等人开发 RETFound 模型,用视网膜图像预测多种系统性疾病(点击阅读原文)
*论文:
https://www.nature.com/articles/s41586-023-06555-x
Large-scale pancreatic cancer detection via non-contrast CT and deep learning
*来源:Nature Medicine
*作者:阿里达摩院联合多家国内外医疗机构
*解读:在 2 万病例中识别出 31 例漏诊,阿里达摩院牵头发布「平扫 CT +大模型」筛查胰腺癌(点击阅读原文)
*论文:
https://www.nature.com/articles/s41591-023-02640-w
Machine Learning-Enabled Tactile Sensor Design for Dynamic Touch Decoding
*来源:Advanced Science
*作者:浙江大学的杨赓和徐凯臣课题组
*解读:浙江大学利用 SVM 优化触觉传感器,盲文识别率达 96.12%(点击阅读原文)
*论文:
https://onlinelibrary.wiley.com/doi/10.1002/advs.202303949
Fill in the Blank: Transferrable Deep Learning Approaches to Recover Missing Physical Field Information
*来源:Advanced Materials
*作者:麻省理工学院的研究人员
*解读:材料空间「填空解谜」:MIT 利用深度学习解决无损检测难题(点击阅读原文)
*论文:
https://onlinelibrary.wiley.com/doi/full/10.1002/adma.202301449
Enhancing corrosion-resistant alloy design through natural language processing and deep learning
*来源:Science Advances
*作者:德国马克思普朗克铁研究所的研究人员
*解读:AI「反腐」,德国马普所结合 NLP 和 DNN 开发抗蚀合金(点击阅读原文)
*论文:
https://www.science.org/doi/10.1126/sciadv.adg7992
Machine learning-assisted prediction of water adsorption isotherms and cooling performance
*来源:Journal of Materials Chemistry A
*作者:华中科技大学的李松课题组
*解读:华中科技大学李松课题组,利用机器学习预测多孔材料水吸附等温线(点击阅读原文)
*论文:
https://pubs.rsc.org/en/content/articlelanding/2023/TA/D3TA03586G
Universal machine learning for the response of atomistic systems to external fields
*来源:Nature Communication
*作者:中国科学技术大学的蒋彬课题组
*解读:中科大蒋彬课题组开发 FIREANN,分析原子对外界场的响应(点击阅读原文)
*论文:
https://www.nature.com/articles/s41467-023-42148-y
Scaling deep learning for materials discovery
*来源:DeepMind
*作者:Nature
*解读:领先人类 800 年?DeepMind 发布 GNoME,利用深度学习预测 220 万种新晶体(点击阅读原文)
*论文:
https://www.nature.com/articles/s41586-023-06735-9
Material symmetry recognition and property prediction accomplished by crystal capsule representation
*来源:Nature Communications
*作者:中山大学李华山、王彪课题组
*解读:中山大学李华山、王彪课题组开发 SEN 机器学习模型,高精度预测材料性能(点击阅读原文)
*论文:
https://www.nature.com/articles/s41467-023-40756-2
Retrosynthesis prediction with an interpretable deep-learning framework based on molecular assembly tasks
*来源:Nature Communications
*作者:山东大学、电子科技大学课题组
*解读:山东大学开发可解释深度学习算法 RetroExplainer,4 步识别有机物的逆合成路线(点击阅读原文)
*论文:
https://www.nature.com/articles/s41467-023-41698-5
A comprehensive machine learning strategy for designing high-performance photoanode catalysts
*来源:Journal of Materials Chemistry A
*作者:清华大学朱宏伟课题组
*解读:清华大学利用可解释机器学习,优化光阳极催化剂,助力光解水制氢(点击阅读原文)
*论文:
https://pubs.rsc.org/en/content/articlelanding/2023/TA/D3TA04148D
Adaptive and maladaptive introgression in grapevine domestication
*来源:Proceedings of the National Academy of Sciences
*作者:中国农业科学院深圳农业基因组的研究人员
*解读:葡萄风味有奥秘,农科院用机器学习揭示基因渐渗过程(点击阅读原文)
*论文:
https://www.pnas.org/doi/abs/10.1073/pnas.2222041120
The spatiotemporal signature of cherry blossom flowering across Japan revealed via analysis of social network site images
*来源:Flora
*作者:澳大利亚莫纳什大学的研究团队
*解读:爬取 2 万多张 Flickr 图片,莫纳什大学复现 10 年间日本樱花开放的时空特征(点击阅读原文)
*论文:
https://www.sciencedirect.com/science/article/abs/pii/S0367253023001019
除了类似 AlphaFold 这一类广为人知的生物信息学进展外,AI 在同源搜索、多重比对及系统发育构建、基因组序列分析、基因发现等生物学领域中,都有丰富的应用案例。作为一名生物学研究人员,能熟练地将机器学习工具,整合到数据分析中,必将加速科学发现、提升科研效率。
*推荐阅读:生物信息学 | 借助 AI 更高效地开启研究(点击阅读原文)
Uncovering developmental time and tempo using deep learning
*来源:Nature Methods
*作者:系统生物学家 Patrick Müller 及康斯坦茨大学研究人员
*解读:AI 与胚胎结合?系统生物学家 Patrick Müller 利用孪生网络对斑马鱼胚胎展开研究(点击阅读原文)
*论文:
https://www.nature.com/articles/s41592-023-02083-8
A deep learning approach to photo–identification demonstrates high performance on two dozen cetacean species
*来源:Methods in Ecology and Evolution
*作者:夏威夷大学的研究人员
*解读:「鲸脸识别」已上线,夏威夷大学用 5 万张图像训练识别模型,平均精度 0.869(点击阅读原文)
*论文:
https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.14167
Machine learning prediction and classification of behavioral selection in a canine olfactory detection program
*来源:Scientific Reports
*作者:美国全国儿童医院阿比盖尔·韦克斯纳研究所、洛基维斯塔大学的研究人员
*解读:狗狗求职记:AI 面试、人类辅助,美研究所利用 628 只拉布拉多数据,提升嗅觉检测犬选拔效率(点击阅读原文)
*论文:
https://www.nature.com/articles/s41598-023-39112-7
Accurate proteome-wide missense variant effect prediction with AlphaMissense
*来源:BioScience
*作者:克莱姆森大学的研究人员
*解读:应对人虎共存难题,首个识别和传输老虎照片的 AI 相机来了(点击阅读原文)
*论文:
https://www.science.org/doi/10.1126/science.adg7492
BirdFlow: Learning seasonal bird movements from eBird data
*来源:Methods in Ecology and Evolution
*作者:马萨诸塞州立大学、康奈尔大学的研究人员
*解读:借助计算机建模及 eBird 数据集,马萨诸塞大学成功预测鸟类迁徙(点击阅读原文)
*论文:
https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.14052
Deep learning pose estimation for multi-cattle lameness detection
*来源:Nature
*作者:纽卡斯尔大学及费拉科学有限公司的研究人员
*解读:借力计算机视觉及深度学习,纽卡斯尔大学开发实时、自动化奶牛跛行检测系统(点击阅读原文)
*论文:
https://www.nature.com/articles/s41598-023-31297-1
Testing early detection of pine processionary moth Thaumetopoea pityocampa nests using UAV-based methods
*来源:NeoBiota
*作者:里斯本大学研究团队
*解读:无人机+ AI 图像分析:里斯本大学高效检测林业害虫(点击阅读原文)
*论文:
https://neobiota.pensoft.net/article/95692/
Sounds emitted by plants under stress are airborne and informative
*来源:Cell
*作者:以色列特拉维夫大学的研究人员
*解读:压力之下番茄也会「惊声尖叫」,特拉维夫大学发现植物王国不沉默(点击阅读原文)
*论文:
https://doi.org/10.1016/j.cell.2023.03.009
Sow Farrowing Early Warning and Supervision for Embedded Board Implementations
*来源:Sensors
*作者:南京农业大学研究团队
*解读:母猪产仔早知道,这次南农用上了英伟达边缘 AI Jetson(点击阅读原文)
*论文:
https://www.mdpi.com/1424-8220/23/2/727
Deep Learning Enables Instant and Versatile Estimation of Rice Yield Using Ground-Based RGB Images
*来源:Plant Phenomics
*作者:京都大学的研究人员
*解读:京都大学利用 CNN 预测粮食产量,丰收不问天,问 AI 就够了(点击阅读原文)
*论文:
https://spj.science.org/doi/10.34133/plantphenomics.0073
Drone-Based Harvest Data Prediction Can Reduce On-Farm Food Loss and Improve Farmer Income
*来源:Plant Phenomics
*作者:东京大学和千叶大学的研究人员
*解读:最高可挽回 20% 损失!东京大学利用 AI 及无人机,预测农作物最佳采收日期(点击阅读原文)
*论文:
https://spj.science.org/doi/10.34133/plantphenomics.0086#body-ref-B4
A new paradigm for medium-range severe weather forecasts: probabilistic random forest-based predictions
*来源:Weather and Forecasting
*作者:美国科罗拉多州立大学和国家海洋和大气管理局的研究人员
*解读:科罗拉多州立大学发布 CSU-MLP 模型,用随机森林算法预测中期恶劣天气(点击阅读原文)
*论文:
https://arxiv.org/abs/2208.02383
Implicit learning of convective organization explains precipitation stochasticity
*来源:PNAS
*作者:哥伦比亚大学 LEAP 实验室
*解读:准确预测极端降水,哥伦比亚大学推出升级版神经网络 Org-NN(点击阅读原文)
*论文:
https://www.pnas.org/doi/10.1073/pnas.2216158120
早在 2021 年,阿里云就透露称,达摩院与国家气象中心联合研发了 AI 算法用于天气预测,并成功预测了多次强对流天气。同年 9 月,Deepmind 在《Nature》上发表文章,利用深度生成模型进行降雨量的实时预报。
2023 年年初,Deepmind 正式推出了 GraphCast,可以在一分钟内对全球未来 10 天的气象,进行分辨率为 0.25° 的预测。 4 月,南京信息工程大学和上海人工智能实验室合作研发了「风乌」气象预测大模型,误差较 GraphCast 进一步降低。
随后,华为推出了「盘古」气象大模型。由于模型中引出了三维神经网络,「盘古」的预测准确率首次超过了目前最准确的 NWP 预测系统。近期,清华大学和复旦大学相继发布了「NowCastNet」和「伏羲」模型。
*推荐阅读:雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演(点击阅读原文)
数值天气预报是天气预报的主流方法。它通过数值积分,对地球系统的状态进行逐网格的求解,是一个演绎推理的过程。 2022 年以来,天气预报领域的机器学习模型取得了一系列突破,部分成果可以与欧洲中期天气预报中心的高精度预测匹敌。
*推荐阅读:机器学习 vs. 数值天气预报,AI 如何改变现有的天气预报模式(点击阅读原文)
Galaxy image deconvolution for weak gravitational lensing with unrolled plug-and-play ADMM
*来源:皇家天文学会月刊
*作者:清华大学及美国西北大学研究团队
*解读:00 后清华学霸用 AI 打败大气层「魔法攻击」,还原宇宙真面貌(点击阅读原文)
*论文:
https://www.nature.com/articles/s41421-023-00543-1
The Image of the M87 Black Hole Reconstructed with PRIMO
*来源:The Astrophysical Journal Letters
*作者:普林斯顿高等研究院研究团队
*解读:利用 PRIMO 重构 M87 黑洞图像,普林斯顿高等研究院成功将「甜甜圈」变身「金戒指」(点击阅读原文)
*论文:
https://iopscience.iop.org/article/10.3847/2041-8213/acc32d/pdf
Astronomaly at Scale: Searching for Anomalies Amongst 4 Million Galaxies
*来源:arXiv
*作者:西开普大学的研究者
*解读:Astronomaly:利用 CNN 和主动学习识别 400 万张星系图像中的异常(点击阅读原文)
*论文:
https://arxiv.org/abs/2309.08660
Predicting new mineral occurrences and planetary analog environments via mineral association analysis
*来源:PNAS Nexus
*作者:华盛顿卡内基科学研究所、亚利桑那大学的研究人员
*解读:AI 卷到正经「挖矿」业,卡内基科学研究所另辟蹊径,靠关联分析法找到新矿床(点击阅读原文)
*论文:
https://academic.oup.com/pnasnexus/article/2/5/pgad110/7163824?login=true
Characterizing soiling losses for photovoltaic systems in dry climates: A case study in Cyprus
*来源:Solar Energy
*作者:塞浦路斯大学的研究人员
*解读:光伏圈告别「看天吃饭」,塞浦路斯大学耗时 2 年,发现机器学习预测污染损失未来可期(点击阅读原文)
*论文:
https://www.sciencedirect.com/science/article/pii/S0038092X23001883
Machine learning for industrial processes: Forecasting amine emissions from a carbon capture plant
*来源:ScienceAdvances
*作者:洛桑联邦理工学院和赫瑞瓦特大学组成的研究小组
*解读:90 后学霸博士 8 年进击战:用机器学习为化学研究叠 BUFF(点击阅读原文)
*论文:
https://www.science.org/doi/10.1126/sciadv.adc9576
Landslide susceptibility modeling by interpretable neural network
*来源:Communications Earth & Environment
*作者:加利福尼亚大学洛杉矶分校的研究人员
*解读:变透明的黑匣子:UCLA 开发可解释神经网络 SNN 预测山体滑坡(点击阅读原文)
*论文:
https://www.nature.com/articles/s43247-023-00806-5
Explainable artificial intelligence (XAI) for interpreting the contributing factors feed into the wildfire susceptibility prediction model
*来源:ScienceDirect
*作者:澳大利亚国立大学、悉尼科技大学的研究人员
*解读:夏威夷等全球多地深陷「末日狂烧」,关键时刻 AI 监测能否跑赢野火?(点击阅读原文)
*论文:
https://www.sciencedirect.com/science/article/pii/S0048969723016224
Artificial Intelligence in Meta-optics
*来源:ACS Publications
*作者:香港城市大学的研究人员
*论文:
https://pubs.acs.org/doi/10.1021/acs.chemrev.2c00012
Restoring and attributing ancient texts using deep neural networks
*来源:Nature
*作者:DeepMind 和威尼斯福斯卡里大学的研究人员
*解读:千年密码新解读,DeepMind 开发 Ithaca 破译希腊铭文(点击阅读原文)
*论文:
https://www.nature.com/articles/s41586-022-04448-z
来自斯坦福大学计算机科学与基因技术学院的博士后 Hanchen Wang,与佐治亚理工学院计算科学与工程专业的 Tianfan Fu,以及康奈尔大学计算机系的 Yuanqi Du 等 30 人,回顾了过去十年间,基础科研领域中的 AI 角色,并提出了仍然存在的挑战和不足。
*推荐阅读:30 位学者合力发表 Nature 综述,10 年回顾解构 AI 如何重塑科研范式(点击阅读原文)
3 月 27 日,据新华社报道,为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近期启动「人工智能驱动的科学研究」( AI for Science ) 专项部署工作。
本次,我国布局 AI for Science 前沿科技研发体系,将紧密结合数学、物理、化学、天文等基础学科关键问题,围绕药物研发、基因研究、生物育种、新材料研发等重点领域科研需求展开。对此,中科院自动化研究所所长徐波解释说,新药创制、基因研究、生物育种、新材料研发等领域,是人工智能与科学研究结合需求迫切、进展突出、具有代表性的重要方向。
以上就是「HyperAI 超神经」在 2023 年为大家解读的前沿论文,关注微信公众号,并在后台回复「2023 ScienceAI」即可打包下载全部论文。
2024 年,我们将继续关注 AI for Science 的最新科研成果及相关应用,敬请期待~