基因合成遇上AI:再也不用对着天书一样的序列发愁了

mysmile 2小时前 产品中心 4 0

咱说实话,搞生命科学的这帮人,看着挺光鲜,穿着白大褂在实验室里晃悠,但其实背地里受的罪只有自己知道。别的且不说,就单说“基因合成”这事儿,早几年那可是实打实的体力活。你想要一段能高效表达蛋白的基因?行啊,自己设计去。怎么设计?翻文献,找类似序列,然后靠经验在那儿猜。运气好了,合成出来凑合用;运气不好,表达量低得跟没一样,几个月时间搭进去,啥也没捞着。

那种感觉就像啥?就像你拿着笔在那儿手抄一本书,抄得手腕子都疼,结果抄到最后一页发现前面漏了好几行,整本书的逻辑全乱了,得,从头再来吧。那时候咱们老调侃,说这是“凭手艺吃饭”,其实心里都清楚,这特么就是“瞎猫碰死耗子”,碰上了算你走运,碰不上是常态。

但现在不一样了,真的不一样了。不知道大家伙儿发现没,这几年冒出个新词儿,叫“基因合成ai”。这玩意儿一出来,嚯,直接把咱们这一行的游戏规则给改了。

首先得说说,这个所谓的“基因合成ai”到底解决了咱们啥最头疼的问题?我觉得排第一的,就是“快”。

我以前在实验室带师弟的时候,最怕他问我:“师兄,这条3000多bp的序列,你说我咋拆开合成比较稳妥?”咋拆?这玩意儿哪有标准答案!得看GC含量,得看重复序列,得看有没有复杂的二级结构。我那会儿全靠经验,有时候盯着屏幕瞅半天,眼睛都看对眼了,也不敢打包票说这么拆肯定没问题。拆一条序列,快则半小时,慢了一上午啥也别干了。就这,合成回来还得提心吊胆,生怕它中途给你断了或者组装错了。

现在的小孩儿幸福啊,用那个基因合成ai的生物信息平台,几秒钟,真的就是几秒钟,人家把最优的拆解方案、组装的引物设计、甚至后面质检的标准全给你摆出来了。我听擎科生物的一个朋友(他们在亦庄那边搞得挺大)吹过,说他们现在的AI平台,把病毒序列自动筛查、危险基因识别这些安全功能都集成进去了,合成效率提升了90%以上 -2。这就不是手抄书了,这相当于你刚想到要写个啥,打印机“唰”地一下就把成书给你印出来了,还带自动校对的那种。咱把省下来的时间拿去喝杯咖啡,或者想想实验下一步咋走,不比在那儿跟序列较劲强?

解决了速度问题,那第二个痛点就更核心了——“准”和“好”。

光快不行,合成出来的基因不干活,那不是白搭吗?以前咱们设计基因,尤其是那些调控元件,比如启动子、增强子啥的,基本就是“抄作业”。从模式生物里找一段公认好使的,挪到咱们自己的系统里。但问题是,作业不是那么好抄的,这个菌里的启动子,换到那个菌里可能就水土不服,表达强度直接打对折。你想微调一下表达量,让它不高不低刚刚好?门儿都没有,只能在那儿做诱变,碰运气 -3

但这几年,AI的玩法变了。它不是光在那儿帮你预测,它开始“写”了。Rice大学那边今年刚发了个Nature,搞了个叫CLASSIC的技术,能一次性造出上百万个DNA设计 -6。百万个啊同志们!以前我们做一个突变体库,做个几千个克隆就累得跟狗一样,人家现在拿AI一跑,直接给你生成一片“设计森林”。然后把这些设计扔进细胞里一测,哪个亮哪个暗,数据再喂给AI,AI就能学会啥样的序列是“好”的。

这就像啥?就像你教孩子画画,以前是你告诉他太阳是圆的,所以他画的太阳永远是圆的。现在的AI是啥?是你给它看了一百万张太阳的照片,有朝阳、有落日、有被云遮住的,它自己总结出来了:哦,原来太阳在不同时候、不同天气下可以有这么多种样子,然后它自己画了一个你从来没见过,但美得不得了的夕阳。这就是生成式AI的厉害之处。像Genyro那家公司,从加州理工搞了个叫Sidewinder的技术,组装DNA的错误率低到百万分之一,比现在主流的标准好了一万倍 -5。这意味着啥?意味着以前因为序列复杂(比如GC含量高,或者重复序列多)我们根本不敢碰的那些“硬骨头”基因,现在能合成出来了,而且还能保证准。

这基因合成ai带来的第三个变化,我觉得是一种思维上的解放,或者说,是把我们从“泥腿子”变成了“指挥官”。

以前咱们老觉得生物这东西太复杂,没法预测。一个转录因子结合位点,挪了三个碱基,可能表达量就崩了;挪了两个碱基,可能又翻倍了。这里头有啥物理规律?说不清。大家只能靠试,靠经验堆。

但现在你看,国家都开始重视这事儿了。中科院天津工业生物所那边今年刚启动了个大项目,叫“基于虚拟细胞技术的合成基因回路与底盘细胞协同设计” -8。啥叫虚拟细胞?就是想在电脑里造一个“数字版的细胞”,用AI去模拟,我给它设计一段基因回路,它在虚拟世界里先帮我跑一遍,看看这个细胞会不会听话地生产我想要的药物,会不会好好长。这不就是从“摸着石头过河”变成了“先在电脑上模拟架桥,再开工”吗?

还有那个Evo系列的基因组基础模型,人家已经能从头设计噬菌体(一种病毒)的基因组了 -5。这就更玄乎了,这已经不是设计一个基因的事儿了,这是在设计一套生命的“操作系统”。虽然咱们现在还处于早期,很多模型还是“黑箱子”,给出来的设计有时候也不知道它咋想出来的 -1。但这方向对了呀!咱们以后当科学家的,可能不再是最累的那个“实验员”,而是给AI下指令的“指挥官”。你说我想要一个能在低氧环境下特异性启动的启动子,强度控制在中等水平,AI给你吐出几十条候选序列,你只管拿去验证就行了。

所以说,这玩意儿虽然现在还没法做到100%完美,有时候AI给出的设计在电脑里跑得挺好,进了真细胞就拉胯了(这叫“湿实验”和“干实验”的gap,搞这行的都懂) -1。但你不得不承认,这已经是咱们能抓到的、让生物设计变得更“工程化”最靠谱的一根稻草了。市场预测也说,这种AI驱动的平台,未来十年年增长率能冲到22% -10。资本是最诚实的,这说明大家伙儿都看明白了,咱们搞合成生物的,从今往后,怕是离不开这“基因合成ai”了。再抱着老黄历,守着那点经验不愿意放手,可真就要被时代落下了。

扫描二维码

手机扫一扫添加微信