导语
读书会背景
读书会框架
发起人
与读书会之间的联系
AI+Science系列读书会中,第一季读书会就AI4Science以及Science4AI进行了较为全面的前沿探讨,第二季读书会呈现了大模型在生物医学健康研究方面应用的全貌,第三季读书会从AI4Math,Math4AI两个方面深入探讨了人工智能与数学的密切联系。本次读书会聚焦几何深度学习这一科研领域的发展与突破,从拓扑知识、模型、算法到科学应用系统地介绍其发展,并探讨在材料科学和生物科学中的前沿应用。
在图机器学习中,数据通常以图的形式表示,其中节点和边分别代表数据点和它们之间的关系。在几何深度学习中,按照数据结构的不同,其涵盖了集合学习、图学习、拓扑深度学习、群等变神经网络等内容。图神经网络与组合优化读书会聚焦图神经网络与算法神经化求解的相关领域,并分享讨论了几何图神经网络在AI4Science领域的前沿应用。本次读书会则将从几何背景知识开始,更加系统地介绍几何深度学习的发展脉络以及主流模型,同时将更深入地探讨AI4Math、AI4Material以及AI4Biology的应用与前沿动态。
复杂系统通常由许多相互作用的组成部分组成,这些部分在空间和时间上的结构非常复杂,因此传统的方法往往难以完全捕捉和理解其内在的复杂性。如何理解复杂系统的内在关联是科学和工程领域中的关键挑战之一。
几何深度学习作为一种新兴的研究领域,专注于处理结构化数据,相较传统的深度学习方法,几何深度学习能够有效地处理具有复杂结构和拓扑特性的非欧几里得数据,如点云、网格、图谱、流形等。近年来,几何深度学习在多个领域,特别是科学智能(AI for Science)领域取得了显著进展,展现了其理解复杂系统与预测、生成复杂结构的巨大潜力。
报名参与读书会
为确保专业性和讨论的聚焦,本读书会谢绝脱离读书会主题和复杂科学问题本身的空泛的哲学和思辨式讨论;不提倡过度引申在社会、人文、管理、政治、经济等应用层面的讨论。我们将对参与人员进行筛选,如果出现讨论内容不符合要求、经提醒无效者,会被移除群聊并对未参与部分退费,解释权归集智俱乐部所有。
本季读书会预计讨论分享8-10次,以主题分享的形式按照暂定框架贯次展开;
每周进行线上会议,与会者可以广泛参与讨论,会后可以获得视频回放持续学习。
从2024年7月11日开始,每周四19:00-21:00,持续时间预计 8-10 周。我们也会对每次分享的内容进行录制,剪辑后发布在集智斑图网站上,供读书会成员回看,因此报名的成员可以根据自己的时间自由安排学习时间。
此次读书会为线上闭门读书会,采用的会议软件是腾讯会议(请提前下载安装)。在扫码完成报名并添加负责人微信后,负责人会将您拉入交流社区(微信群),入群后告知具体的会议号码。
第一步:扫码填写报名信息。
扫码报名
第二步:填写信息后,付费299元。
第三步:添加负责人微信,拉入对应主题的读书会社区(微信群)。
本读书会可开发票,请联系相关负责人沟通详情。
读书会采用共学共研的机制,围绕前沿主题进行内容梳理和沉淀。读书会成员可通过内容共创任务获得积分,解锁更多网站内容,积分达到标准后可退费。发起人和主讲人作为读书会成员,均遵循内容共创共享的退费机制,暂无其他金钱激励。读书会成员可以在读书会期间申请成为主讲人,分享或领读相关研究。
参与共创任务,共建学术社区:
读书会笔记:在交互式播放器上记录术语和参考文献
集智百科词条:围绕读书会主题中重要且前沿的知识概念梳理成词条。例如:
论文解读分享:认领待读列表中的论文,以主题报告的形式在社区分享
论文摘要翻译:翻译社区推荐论文中的摘要和图注
公众号文章:以翻译整理或者原创生产形式生产公众号文章,以介绍前沿进展。例如:
阅读材料
阅读材料较丰富,为了更好的阅读体验,建议您前往集智斑图沉浸式阅读,并可收藏感兴趣的论文,下载推荐阅读的论文以及代码,查看更多相关学习资源。
参考文献
推荐语:牛津大学教授Michael Bronstein、图灵奖得主Yann Lecun等人于2017年提出几何深度学习这一概念,结合几何学(或拓扑学)与深度学习,以便处理具有复杂结构和拓扑特性的非欧几里得数据,如点云、网格、图谱、流形等。
Bronstein, Michael M., et al. "Geometric deep learning: going beyond euclidean data." IEEE Signal Processing Magazine 34.4 (2017): 18-42.
推荐语:美国Generate Biomedicines公司提出了一种新颖的等变图扩散模型Chroma,创造了自然界中以前未发现的具有可编程特性的新型蛋白质。
Ingraham, John B., et al. "Illuminating protein space with a programmable generative model." Nature 623.7989 (2023): 1070-1078.
推荐语:谷歌DeepMind公司基于图神经网络构建了一种晶体材料稳定性预测模型GNoME,发现了多达220万种理论上稳定的新型材料。
Merchant, Amil, et al. "Scaling deep learning for materials discovery." Nature 624.7990 (2023): 80-85.
推荐语:2023年图灵奖得主Yoshua Bengio与数十位人工智能专家在顶级学术期刊《Nature》上发表综述论文,指出几何深度学习是科学智能研究的重要工具之一。
Wang, Hanchen, et al. "Scientific discovery in the age of artificial intelligence." Nature 620.7972 (2023): 47-60.
Yoshua Bengio领衔跨学科团队,Nature刊文综述人工智能时代的科学发现
推荐语:这篇文章因其创新性地将图卷积网络扩展到双曲几何(Hyperbolic GCNs)、深入的技术探讨、广泛的实验验证以及领域内知名作者的背书,成为了双曲几何图神经网络研究领域的基石性工作,对后续研究具有重要的指导和启发作用。
Chami, I., Ying, R., Ré, C., & Leskovec, J. (2019). "Hyperbolic Graph Convolutional Neural Networks." NeurIPS (2019).
推荐语:这篇文章提出了一种新型的单纯复形消息传递网络(MPSNs),通过在单纯复形上执行消息传递来捕捉复杂系统的多级交互,并在理论和实验上证明了其相较于传统图神经网络具有更高的表达能力和区分复杂图结构的能力。
Bodnar, Cristian, et al. "Weisfeiler and lehman go topological: Message passing simplicial networks." ICML (2021).
推荐语:拓扑深度学习(Topological Deep Learning, TDL)是关系学习领域的前沿方向,文章总结了目前主流的拓扑机器学习的框架和相关成果,并提出了一系列该领域的重要问题。
Papamarkou, Theodore, et al. "Position Paper: Challenges and Opportunities in Topological Deep Learning." arXiv preprint arXiv:2402.08871 (2024).
推荐语:文章介绍了组合复形及相关理论,并且介绍了一些基于组合复形的拓扑深度学习模型。
Hajij, Mustafa, et al. "Topological deep learning: Going beyond graph data." arXiv preprint arXiv:2206.00606 (2022).
推荐语:文章总结了基于组合复形的拓扑深度学习模型的框架细节。
Papillon, Mathilde, et al. "Architectures of topological deep learning: A survey on topological neural networks." Arxiv. Submitted to Transactions on Pattern Analysis and Machine Intelligence (2023).
推荐语:文章描述了ICML 2023 工作坊“机器学习中的拓扑与几何”中举办的拓扑深度学习计算挑战赛的设计并总结了其主要发现。
Papillon, Mathilde, et al. "Icml 2023 topological deep learning challenge: Design and results." Topological, Algebraic and Geometric Learning Workshops 2023. PMLR, 2023.
推荐语:对称性是指物体在某种变换上保持不变的性质,既是数学形式简约性的必要因素、也是物理规律均匀性的必然结果。这篇文章是最早将旋转对称性加入到卷积神经网络的开创工作之一,从群等变的角度对传统卷积算子进行了简单而深刻的改造。
Cohen T, Welling M. Group equivariant convolutional networks[C]//International conference on machine learning. PMLR, 2016: 2990-2999.
推荐语:这篇文章基于物理规律必须满足 SE(3) 对称性的重要假设,从群表示论中引入球谐函数、Wigner-D矩阵、CG张量积等概念,嵌入到图神经网络中,提出了张量场网络TFN。这是最早将具有对称性的图神经网络引入到三维物理系统建模中的开创性工作。
Thomas N, Smidt T, Kearnes S, et al. Tensor field networks: Rotation-and translation-equivariant neural networks for 3d point clouds[J]. arXiv preprint arXiv:1802.08219, 2018.
推荐语:这篇文章摒弃了前一篇论文TFN中的高阶表示量,只利用向量之间的内积构建了具有对称性的图神经网络EGNN,极大提升了模型的效率,并且在许多实际任务中打败了传统数学形式更完备但计算更复杂的模型。
Satorras V G, Hoogeboom E, Welling M. E (n) equivariant graph neural networks[C]//International conference on machine learning. PMLR, 2021: 9323-9332.
推荐语:这是一篇综述性论文(两个版本),从数据结构、模型、任务等多个维度总结了几何图神经网络的发展历程和重要应用例子。
Han J, Cen J, Wu L, et al. A Survey of Geometric Graph Neural Networks: Data Structures, Models and Applications[J]. arXiv preprint arXiv:2403.00485, 2024.
Han J, Rong Y, Xu T, et al. Geometrically equivariant graph neural networks: A survey[J]. arXiv preprint arXiv:2202.07230, 2022.
推荐语:这篇论文针对2D分子设计了具备亿级参数的图神经网络GROVER,在千万级无标签分子数据上进行了预训练,是分子图大模型的开创性工作之一。
Rong Y, Bian Y, Xu T, et al. Self-supervised graph transformer on large-scale molecular data[J]. Advances in neural information processing systems, 2020, 33: 12559-12571.
推荐语:这篇论文设计了能同时处理分子的图Transformer模型Graphormer,在OGB、Open Catalyst等著名榜单上取得了很好的实验结果。
Ying C, Cai T, Luo S, et al. Do transformers really perform badly for graph representation?[J]. Advances in neural information processing systems, 2021, 34: 28877-28888.
推荐语:这篇论文设计了能处理3D分子的预训练图神经网络Uni-Mol,在分子性质预测、蛋白质性质预测、蛋白质-小分子对接等下游任务上取得了良好效果。
Zhou G, Gao Z, Ding Q, et al. Uni-mol: A universal 3d molecular representation learning framework[J]. 2023.
推荐语:这篇论文提出了一种基于黎曼去噪的3D分子图神经网络的预训练方法3D-EMGP,在分子物理性质预测、分子动力学等与3D构象相关的任务上取得了很好效果。
Jiao R, Han J, Huang W, et al. Energy-motivated equivariant pretraining for 3d molecular graphs[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2023, 37(7): 8096-8104.
推荐语:这篇论文将生成式模型VAE与图神经网络了进行结合,并且提出了一种主子图的概念,实现了分子图的有效生成。
Kong X, Huang W, Tan Z, et al. Molecule generation by principal subgraph mining and assembling[J]. Advances in Neural Information Processing Systems, 2022, 35: 2550-2563.
推荐语:这篇论文将生成式模型Diffusion与等变图神经网络进行结合,实现了3D分子构象的多样性生成。
Xu M, Yu L, Song Y, et al. Geodiff: A geometric diffusion model for molecular conformation generation[C]//International Conference on Learning Representations(ICLR), 2022.
推荐语:这篇论文将生成式模型BFN与等变图神经网络进行进行结合,实现了3D分子的高效生成。
Song Y, Gong J, Zhou H, et al. Unified Generative Modeling of 3D Molecules with Bayesian Flow Networks[C]//The Twelfth International Conference on Learning Representations. 2023.
推荐语:这篇论文利用等变图神经网络CDVAE实现了晶体生成,是该方向的开创性工作之一。
Xie T, Fu X, Ganea O E, et al. Crystal diffusion variational autoencoder for periodic material generation[J]. arXiv preprint arXiv:2110.06197, 2021.
推荐语:这篇论文将扩散模型与等变图神经网络进行结合,很好建模了晶体的对称性,实现了晶体3D结构的精准生成。
Jiao R, Huang W, Lin P, et al. Crystal structure prediction by joint equivariant diffusion[J]. Advances in Neural Information Processing Systems, 2024, 36.
推荐语:这篇论文基于图神经网络构建了一种晶体材料稳定性预测模型GNoME,发现了多达220万种理论上稳定的新型材料。
Merchant A, Batzner S, Schoenholz S S, et al. Scaling deep learning for materials discovery[J]. Nature, 2023, 624(7990): 80-85.
推荐语:这篇论文提出了一种多通道等变图神经网络MEAN,有效实现了抗体CDR区域的设计与优化。
Kong X, Huang W, Liu Y. Conditional antibody design as 3d equivariant graph translation[J]. ICLR, 2023.
推荐语:这篇论文提出了一种新颖的等变图扩散模型Chroma,创造了自然界中以前未发现的具有可编程特性的新型蛋白质。
Ingraham J B, Baranov M, Costello Z, et al. Illuminating protein space with a programmable generative model[J]. Nature, 2023, 623(7989): 1070-1078.
推荐语:这篇论文提出了一种全原子建模方法RoseTTAFold All-Atom,利用等变图神经网络实现了蛋白质、小分子、核酸、共价修饰等多种分子的结构预测与设计。
关于集智俱乐部读书会和主办方
推荐读书会
第二季:
详情请见:
第三季:
详情请见:
人工智能与数学读书会启动:AI for Math,Math for AI
点击“阅读原文”,报名读书会