文|《中国企业家》记者 张昊
编辑|姚赟
深势科技创始人、CEO孙伟杰说公司的终极业务就是原子尺度的“活字印刷”,“这其实是上帝的业务”。初中化学课本对原子的描述是:构成一般物质的最小单位。真能实现,那理论上就可以造万物。
深势科技被归纳在了AI for Science(科学智能,简写为“AI4S”)这个赛道里。最近的一次高光时刻,是2024年的英伟达GTC大会,英伟达CEO黄仁勋提到AI领域的三个关键方向:LLM(大语言模型)、具身智能,以及AI4S。
这是个很前沿的领域,相比AI的其他两个领域,已出现多家全球知名的公司,AI4S领域最知名的公司是谷歌的DeepMind,但其更重要的战场是在大语言模型中与ChatGPT对打。 今年5月,DeepMind发布了新一代AlphaFold3模型,可以用于预测几乎所有生物的分子结构和相互作用。而在2021年底,深势科技曾是全球首家成功复现AlphaFold2的公司。
注意是“预测”。到了原子这个尺寸,再贵的显微镜都看不清楚。它动得太快了,刚刚过去的一秒钟,已动了100万亿次。是真的“看不到”怎么动,只能模拟,更不用说把它“打印”出来。
“细胞是由无生命的原子构成的,如果我们从一个原子开始模拟,直到组成蛋白质,一点点往上加,加到什么时候突然就有生命了?生命是‘涌现’的,边界在哪里?”孙伟杰说,锂枝晶号称“电池杀手”,是一种让锂电池失效的机制,这个过程涉及至少数十万个原子在微秒甚至毫秒内发生变化。如果能了解它,那电池就有机会颠覆式地进步。
这听上去既“虚幻”,又“科研”。中国科学院院士、北京大学国际机器学习研究中心主任鄂维南高度概括了这件事: 科学计算只有两类问题,一类已经解决,比如汽车制造、飞机制造等;一类还没有解决,包括经常提到的材料、生物制药等,AI4S就是为了推动后者。
孙伟杰可不想只做前沿技术研究。他提到公司的一个关键节点,2020年拿到第一轮融资后,其商业模式被定义成“微尺度的工业研发平台”。一开始,别人不知道他们在做什么,他会经常用达索系统(Dassault Systemes)来类比。这家法国公司借助3D建模、虚拟仿真等技术,在战斗机、智慧城市等现实世界的领域,把工业研发做到了极致。
深势科技是微观尺度的达索系统,逻辑相同,只是面对的问题不同。 这很重要,深势科技必须是一个能提供解决方案的公司。“早期我最怕出现‘拿着锤子找钉子’的情况。”在孙伟杰看来,首先应该“找钉子”,即行业中的实际问题,然后再设计出相应的“锤子”。
3年左右的时间,深势科技完成5轮十几亿元融资。他一开始盘算这件事大概需要多少钱,“我们想去训练一个涵盖宇宙所有物质的万物模型,觉得至少需要10亿个数据点,一个数据点差不多10元。这个成本是可以优化的,如果我们优化到一个数据点1元,那也要10亿元。”当时,他和合伙人银行卡里只有20多万元。
今年,他明显感受到了市场的变化,“主动来找我们的客户变多了,不像一开始我们都要跟客户打磨产品,他们现在也都清楚深势能干什么。”在最初的预测中,孙伟杰觉得2026年之前都是基础设施建设阶段,而过了这个拐点,AI4S将迎来爆发。
商业化,必须商业化!
孙伟杰的创业“搭子”是大学同学张林峰,两人都毕业于北京大学元培学院。本科毕业后,孙继续在北大读教育经济与管理学研究生,之后进入了风险投资行业,张则是到美国普林斯顿大学攻读应用数学系博士。
不过,孙伟杰很明确自己是要创业的,风险投资的经历让他明白了商业模式、发展路径,以及资源配置对于一个公司的战略意义。尤其是他当时主看互联网教育赛道,行业的大起大落,令他感触颇深。
2017年夏天,张林峰把自己的一次模拟结果分享给了孙伟杰,这是深势科技的原点。
张林峰在一趟从北京飞纽约的航班上,用自己的笔记本电脑模拟出了64个水分子在10皮秒内(天文学名词,1,000,000,000,000皮秒=1秒)的运动结果。跟这组数据比对的是1985年用量子力学原理计算出来的数据,两组惊人地相似。40年前的那次试验,消耗了2亿核时,按现在几分钱1核时的计算费用,都要上千万元——这对他来说就是天文数字,张林峰的数据能耗只是一上飞机电脑一直插着电。
他觉得不可思议,立即给当时的导师鄂维南发邮件求证,得到的回复简洁有力:“Too good to be true(好得难以置信)。”
当孙伟杰听到同学的描述时,他第一反应是“冲击”。如果说AI就是在探寻世间万物规律,并基于此发展新科技和新领域,那还有什么比最底层的科学规律更有价值的事情呢?
于是,两人决定创业,这样的初创班子也是多数科技公司的经典合伙人搭配——张林峰任首席科学家,孙伟杰则负责公司的日常运营。孙伟杰说他的理想是“做一家源自中国,影响世界的科技公司”。“单独满足一项都挺容易,全部都满足,挺难的。”他在启动项目时,也有投资人建议他把团队放在国外,毕竟那里的资本市场对AI4S的理解更深刻,而且客群的认知也成熟一些。
开局很顺利,他们赢得了一次创业比赛,奖金1200万元,启动资金有了。关于产品和商业化的问题,孙伟杰一开始的逻辑就特别直接,“从行业的需求出发,把底层的技术打造成需要的产品形态。”
团队做的第一件事就是使用孙伟杰在投资机构的方法论——行业研究,把电池、材料、半导体、药物等行业翻了个遍。 高强度地两天看一个行业,团队过了差不多二三十个细分行业。
最终确定的策略就是“一横一纵”, 除了平台技术的“一横”之外,孙伟杰一定要先从一个好的场景切入,做出来“一纵”。他要通过这种方式验证公司的商业价值,之后才有“外溢”的可能性。团队的第一个切入点是药物发现领域,直到2023年,又进入了新能源电池领域。
千差万别的行业,在孙伟杰看来都一样。“当你做得足够底层时,会发现行业内的热点都与你相关。”他说,“目前我们已包含所有了,客观世界只有生命科学和物质科学两大门类。”
2020年底,鄂维南、张林峰等人获得有高性能计算领域“诺贝尔奖”之称的戈登贝尔奖,还因此入选了由两院院士评选的“2020年中国十大科技进展”。3年完成5轮融资,深势科技融到的资金早已超过了他们当年预测AI4S的启动门槛——10亿元人民币。
但2022年,谷歌的量子科技团队Sandbox AQ拆分出来单独融资,由谷歌创始人施密特担任董事长,首轮融资就达到5亿美元。孙伟杰说,当你的海外对手可能是以每年数十亿美元在投入的时候,很难没有危机感。
从“服务”到“工具”
孙伟杰判断AI4S应该是一个千亿美元级别的市场。每年全球在基础科研、药物、化学、电池和材料等领域的研发总体投入能达到千亿美元级别,用AI去优化整个研发效率,有可能替代50%低效的实验。这些都会转化成企业服务,而且也会因为研发门槛变低,进一步刺激研发市场的规模。
但距离市场爆发点还有相当距离,至少在中国市场,深势科技要做得更多更复杂。
实际上,作为一款“工具”,深势科技的产品——DeePMD已经足够好了。比如,帮客户做香料的有机分子性质预测中,预训练模型只用了一些公开数据,没有用到客户的私域数据,但预测效果已比客户用积累几十年数据训练出来的模型效果还要好。类似的案例还发生在电池材料和药物分子等领域,客户反馈一天就能跑出来很多数据,不像之前至少论月算。
“单纯做工具还是太前沿了,很多企业用不好。” 孙伟杰考量过三种商业模式:工具、服务和IP,他内心里最想做的其实是工具。
服务看起来是一个比工具更实际的路径,团队帮助客户找到解决方案,很大程度上是去“教”客户如何使用AI赋能研发;IP需要深入到一个细分领域,提供更全面的解决方案,甚至直接面对消费者,但深势科技会因此失去平台价值,这不是孙伟杰理想中的商业模式。
“你会发现最难的是需求提取,客户未必对技术很懂,还有自己的一套描述方式,时常会出现他们认为的需求和实际需求是不同的。”孙伟杰说,这就要求他们得有需求提取能力和强大的翻译能力。
所以,组建销售团队非常难。“要懂AI,要懂物理化学,也要懂行业客户。”孙伟杰说试了很多人才模板,如卖行业软件的,更熟悉标准产品,不懂AI;如卖云计算的,少有人懂行业的具体问题。
这就是深势科技的现状。尤其是孙伟杰开始面临商业化的压力,“在中国市场,客观情况是既要有先进技术,又要有快速商业化的能力,对于前沿技术类型的公司肯定很难,因为前期需要大量的投入。”
但在他看来,“服务”越做越多,总归是有穷尽的那一天,那时会把深势科技的产品训练得相对标准化,客户可以“即插即用”,就接近于“工具”了。
“这会改变客户的研发流程。过去创新药是线性流程,一步一步往后推,现在变成并行流程,或者是‘T字形’流程。很多研发步骤都可以前置了,让AI先把所有问题先算一遍,成功率大大提高。”孙伟杰经常跟做材料的客户说,过去你的研发是随机式的,现在用AI可以做10亿个材料的筛选,然后深势科技的库里还对应了六七百套的解决方案。
相比于一年和十年的规划,孙伟杰说三年规划要复杂得多。一年规划,他没得选,就是商业模式快速复制,提高造血能力;十年规划,也不用选,彻底解决微观尺度的工业设计问题,这是创业的初衷;而到了三年规划,如何在AI4S大规模商用的拐点之前,构建自己的护城河,这决定了他是否有机会能站在世界舞台上跟巨头们掰掰手腕。
“之前都是‘浅矿’,AI到了要去挖‘深矿’的阶段了,这点无法回避。”孙伟杰说。