随着ChatGPT引发全球新一轮生成式 AI 热潮,AI for Science(科学智能)这一极具未来未来市场发展的潜力的赛道被“激活”。
钛媒体App 4月14日消息,国内AI for Science公司深势科技(DP Technology)近日在北京首次披露自主研发的科学大模型体系“深势宇知”——这是国内首个AI for Science(AI4S)大模型系列。
同时,深势科技还在会上全景展示了其多年来在AI for Science领域的有关技术、算法、产品和前沿探索的成果及布局。这中间还包括首次系统性展示“玻尔科研空间站”云原生科学计算平台,以及Bohrium科研云平台、Hermite药物计算设计平台、RiDYMO难成药靶标研发平台及Piloteye电池设计自动化平台等微尺度工业设计基础设施和有关技术和进展,从而形成AI for Science创新落地的链路和开放生态,大范围的应用于生物医药、能源、材料、信息科学工程等领域。
从科学计算基座 AI 大模型,到核心难点突破,再到行业解决方案,深势科技是全世界内为数不多能做到软硬件结合、端到端方案的AI for Science技术公司。
会后,深势科技创始人、CEO孙伟杰对钛媒体App表示,公司将持续聚焦在“微观世界”市场,研发与原子分子尺度有关技术,最重要的包含AI for Science软件、配套的仪器和对应的必要“耗材”工具三个层面。“深势的‘边界’是做好AI for Science原始创新技术探讨研究,持续推动行业加快速度进行发展。”
孙伟杰强调,新一轮 AI 技术创新热潮发展迅速。“2018年,鄂老师提出AI for Science概念,当时别人叫醒他是梦想,而我是,每天叫醒我的是(AI业务)闹钟。这样的领域的原始创新发展非常迅速,新质生产力正不断涌现和加速。”
产业规模近500亿,全球首个AI for Science深势宇知大模型发布
据悉,深势科技成立于2019年,是一家致力于运用“AI+分子模拟”技术,为人类文明最基础的生命、能源、材料科学与工程研究打造新一代微尺度工业设计平台。
所谓AI for Science,在应用层面主要是通过AI去求解电子、原子、分子等这些微观粒子之间的相互作用,然后进一步求解药物、材料、化工、能源等领域面临的关键工业问题。解决技术和工业的方方面面,加速科学研究和技术创新之间的最后一公里。
AI for Science是一种新的科学研究范式,未来市场发展的潜力巨大。据towardshealthcare的一项多个方面数据显示,预计到2030年,生命科学领域的 AI 产业规模将达到67亿美元左右(约合人民币484.88亿元),接近500亿元规模,2022年至2030年的复合年增长率为20%。
深势科技源于学界,创始人兼首席科学家(CSO)张林峰毕业于北京大学元培学院,在普林斯顿大学获应用数学系博士学位,师从中国科学院院士、北京大学国际机器学习研究中心主任、北京科学智能研究院理事长鄂维南院士。
张林峰主要研究方向包括统计物理、分子模拟和机器学习,及其在化学、生物、材料等方向的应用。他通过结合机器学习、多尺度建模方法、高性能计算,有效解决了计算化学、分子动力学模拟等方向中的一系列关键问题,与合作者发展了DeePMD-kit等开源软件和DeepModeling开源社区,作为核心开发者的工作获得2020年度高性能计算领域最高奖ACM戈登·贝尔奖。
孙伟杰同样毕业于北京大学元培学院,后继续在北京大学深造,获管理学硕士学位。
目前,深势科研技术团队汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中公司博士及博士后占比超过35%。
融资方面,深势科技已完成五轮融资,总额达数亿美元,投资方包括高瓴创投、经纬中国、百度风投、百图生科、元璟资本、唯猎资本和盛景嘉成等机构。
钛媒体App从市场方面独家获悉,最近一轮融资中,深势科技获得了北京人工智能产业投资基金等多个机构的支持。
研发层面,成立五年来,深势科技发展很快,不仅基于深度势能研究,利用机器学习和预训练大模型技术,产生DPA Uni-Mol、Uni-SMT等落地产品应用,而且该公司作为共建单位参与到全球“大原子模型计划(Open LAM)”当中,建立开源开放的围绕微尺度大模型的生态,为微观科学研究提供新的基础设施,从而带动材料、能源、生物制药等领域工业微尺度设计的变革。
孙伟杰透露,深势科技自成立以来始终致力于推动 AI 技术在科学研究中的应用与创新。依托在交叉学科领域的深耕,深势科技构建了AI for Science大模型体系“深势宇知®”,将众多学科的科研方法从“实验试错/计算机”时代带入“预训练模型”时代。他表示,“深势宇知”的推出是深势科技对推动科学技术进步和工业创新的坚定承诺。
截至目前,深势科技已在药物设计、材料设计等领域落地产品及解决方案,并与医药和材料领域的多个头部企业建立合作。战略合作伙伴包括阿里、腾讯、亚马逊AWS、百度、火山引擎、华为、英伟达、宁德时代、中科曙光、北京大学、中国科学院、清华大学、西湖大学等超过40家顶级机构。
此次深势科技2024开发者大会上,鄂维南在开场致辞中表示,科学计算应该说是两类问题,一类是已经解决的问题,比如机械工程,汽车制造,甚至大部分的飞机制造,建筑这些都是已经解决的问题;另外一部分是没解决的问题,就是比方说今天可能提到的材料、生物制药、催化等等,AI for Science就为了促进这些没解决的问题。
鄂维南强调,AI for Science参与者包括三部分:一部分就是学校里面的科研人员,老师们;第二部分就是科学智力研究员AI for Science,第三部分深势科技这样的企业 ...... 这中间最主要的桥梁就是工业软件。现在的环境跟过去不一样了,因为现在整个社会的发展步伐加快了,那在这样的新的环境下怎么生存下来,怎么能够发挥自己应该发挥的作用,希望深势团队能在其中发挥关键作用。
具体到技术产品层面,以软件、仪器、配套“耗材”以及划分,深势科技提出了“多尺度建模+机器学习+高性能计算”的科学研究新范式,新品具体信息最重要的包含如下:
深势推出了DPA分子模拟大模型、Uni-Mol 3D 分子构象大模型、Uni-Fold 蛋白折叠大模型、Uni-RNA 核酸结构大模型、 Uni-Dock 高性能药物分子对接引擎,以及Uni-SMART 科学文献多模态大语言模型等公司基座模型;同时,深势以“微尺度工业设计与仿真”为切入点,推出Bohrium科研云平台、Hermite药物计算设计平台、RiDYMO难成药靶标研发平台及 Piloteye电池设计自动化平台等微尺度工业设计基础设施,利用 AI 解决生物医药、能源、材料、信息科学与工程的产业挑战,从而打造新一代工业设计与仿真系统。此外,深势研发了“玻尔科研空间站”——基于AI for Science的综合性、系统性的云原生科学计算平台,满足教学、科研、开发等场景需求。
深势的“仪器”主要是DeePMD模拟专用机“深势盒子DP BlueBox”,是一款定制的科学计算服务器,在选配市面上常见的CPU基础上,专门定制计算加速卡,其性能比深势计算平台上常用GPU(图形处理单元)提升3-15倍,经常使用下算力成本节约50%~80%,可推理上亿级别的分子DP势函数,MD规模提高100倍,解锁多种复杂元素体系、长时间尺度的尖端应用。
深势还提供一系列存储、云计算等配套服务方案,支持阿里云、腾讯云、火山引擎、华为、中国联通等弹性计算资源调用,并且可集成100万+核CPU,最高可同时调度1万+张GPU,跨云跨超算无缝切换,提升超过50%的科研效率,节省超过30%的成本,额外创造超过30%的收入。
孙伟杰表示,深势科技基于DPA开发的正极大模型,为行业伙伴推荐掺杂配方,50量保持率提升5%。同时,深势科技基于 Uni-Mol分子构象大模型,实现电池电解液高通量筛选,可搜索化学空间拓展至10^20(1e+20),研发周期缩短至1/3。
孙伟杰强调,深势开创性推出了Bohrium科研云平台、Hermite药物计算设计平台、RiDYMO难成药靶标研发平台及 Piloteye电池设计自动化平台等工业设计与仿真基础设施,颠覆了现有研发模式,从而打造“计算引导实验、实验优化设计”的全新范式。
孙伟杰坦言,AI for Science技术带来的最根本变化是,把新材料、新药物,新分子研发由过去实验室为主模式,变成了能够用计算机进行设计、少量实验验证的新的计算科学设计范式。对于 AI 人才的工作和生活,利用 AI 工具能够在一定程度上帮助我们更好提升研发效率、工作效率。此外,AI 也促进精度、速度、交互等多层面发生重要变化。
实际上,科学技术是第一生产力。过去三百年间,科学行进经历过数次系统性危机,正是这些危机的解决才带来了科学的突破,新科学经由新工具的应用和普及,进而带来生产力的大幅度的提高。时至今日,随着数字化时代的到来,科学技术创新转化为直接生产力的速度慢慢的变快。面对纷繁复杂的现实世界,“微观”尺度的 AI for Science技术将推动现实世界实现更大的技术突破。
孙伟杰对钛媒体App表示,“我们目前主要聚焦于把主要的(AI for Science)工具做好,包括软件、仪器以及必要的一些耗材。比如,咱们提供的软件当中必须用到算力和存储,所以说算力和存储其实不是我们擅长的东西,但是为了让大家能用好软件耗材,我们也得提供。然后,材料、电池等领域的研发软件,与软件相配套的新的仪器、相应的耗材我们都能够给大家提供。”
谈及企业壁垒,孙伟杰表示,“首先,我们大家都希望打破的‘壁垒’是我们内部合作,或者是我们跟合作伙伴一起的‘壁垒’。主要壁垒来自于知识的壁垒,认知的壁垒,以及不同学科之间的这种专业壁垒。回归问题本源,我们应该多个学科交叉、开放发展,所以,我们对内部有信心,在合作伙伴的协作和支持下,整个产业链的壁垒是很容易去打破的。作为深势来说,重点是‘我们内部没有壁垒’,我们真正让问题、知识在不同专业背景里面充分流动,我们拥有非常强的研发效率,从底层的数学、物理、计算机到化学、生物、药物、材料制造等学科都是很丰富的。所以说,我们内部没有壁垒,就创造了我们对其他伙伴最大的利润。”
因此,除了软件、仪器和耗材之外,深势还希望主导推进AI for Science生态和国内相关人才的搭建工作。
此次活动上,深势科技还宣布与云南白药,宁德时代,嘉庚创新实验室,北京科学智能研究院,阿里云,腾讯云,火山引擎,中国联通等15家产学研领域的合作伙伴发布倡议,共建 AI for Science 开发科学生态,旨在整合各方在 AI、云计算及工业应用领域的优势资源,推动科学研究与产业应用的深度融合。
“基于底层AI for Science大模型,我们已在多个核心问题上带来了巨大突破,也带来我们一系列工业研发和学术研究的解决方案。最终我们大家都希望,通过我们AI for Science大模型,真正理解宇宙底层的运作规律,赋予我们人类文明。AI for Science的未来还是一个进行时的时态,需要大家与我们一起发展。深势科技可以跟大家做这个保证,我们会长期专注于AI for Science这些困难问题的研究,并持续投入解决这里面最核心、最困难、最直接落地的问题。”孙伟杰在演讲结尾表示。
孙伟杰强调,AI for Science的未来,还充满非常大的不确定性。相关基础设施的建设不止需要深势科技一家,而是需要与社区开发者、用户、合作伙伴一起建设,碰撞出“火花”,从而推动整个科学智能产业持续健康发展。