单细胞测序技术咋就成了科研圈的“照妖镜”?俺嘞个亲娘嘞,信息增量全在这!

mysmile 4周前 (06-05) 行业资讯 46 0

大家吼啊!今天咱来聊点硬核的,就是那个让生物学家们跟打了鸡血似的,能让咱把一个个细胞扒得底裤都不剩的神奇技术——单细胞测序。你要是还没听说过这个,那可真就 out 了,现在跑个学术会议,满嘴不蹦哒几句“单细胞”、“异质性”、“图谱”,你都不好意思跟人打招呼。🤔

但是,咱今天不聊那些虚头巴脑的宏观概念,咱就唠点实在的,唠点只有亲自做过实验、被数据虐过千百遍的人才能体会的痛,以及现在那些最新、最骚气的技术是咋把这些痛点按在地上摩擦的。你别看我在这儿吹得天花乱坠,其实好多坑俺自己也踩过,那真是眼泪哗哗的。

最开始接触这玩意儿,谁不是被它的高大上给唬住了?想着拿它来找找稀有的细胞亚群,或者看看疾病状态下细胞状态的转变,那不就是手拿把掐的事儿嘛。结果呢?数据一出来,好家伙,满屏的零蛋!你想找的那个关键 marker,它愣是给你来个“未检测到”。你以为是细胞里压根儿没有?错啦大兄弟!那很可能只是技术上的“漏网之鱼”。早期的单细胞测序技术,那捕获效率,低得能让你怀疑人生,就好比拿个漏勺去舀珍珠,能捞上来几个全看天意。特别是那些跟细胞身份决定密切相关的转录因子,本身就表达量低,想抓到它们,难度不亚于让我现在去追刘亦菲——梦里啥都有。

这就引出了第一个让我抓耳挠腮的痛点:那些真正关键的“灵魂”分子,总是在数据里“隐身”。你明明知道它在那儿,可技术就是测不出来。这就好比你追一个姑娘,你心里明镜儿似的知道她对你有意思(生物学功能),可你手里愣是拿不出一点儿实锤证据(检测数据),急不急人?

为了解决这个痛点,科学家们也是操碎了心,鼓捣出了一堆新花样。比如最近看到的一个叫 RoCK and ROI 的技术,这名字起的,听着就跟打游戏似的 -1。它最牛的地方在于,直接在RNA捕获的那个环节就动手脚。传统的那些个 beads(就是用来钓RNA的小磁珠),上面长的都是清一色的“钓鱼钩”(polyT),专门钓那些带polyA尾巴的mRNA。但这玩意儿有个毛病,它不看人下菜碟,管你重要的不重要的,全靠随机碰撞。

RoCK and ROI 这招儿高就高在,它给一部分“鱼钩”动了手脚,加上了特定的“饵料”。这“饵料”是啥?就是你想抓的那个关键基因的互补序列。这样一来,当细胞裂解液流经这颗beads的时候,那个你心心念念的低表达关键转录本,就不再是随缘被捕获,而是被带有特定序列的“鱼钩”精准拦截。我滴个乖乖,这简直就是在单细胞测序技术里开了个“VIP通道”啊!据说这玩意儿能把目标基因的检测率干到98%的细胞里 -1。以前是十个细胞里可能只有一个能测到你的心头好,现在恨不得个个都有,这种踏实感,谁用谁知道。

解决了“能不能测到”的问题,下一个更头疼的痛点来了:测到了,但不全,关键的“剧情”在中段丢失了

咱们常用的那些商业化高通量平台,10x啊,BD啊,它们主打的都是3′端或者5′端测序。啥意思呢?就是逮着RNA分子的头或者尾巴使劲儿读,中间那老大一段儿,直接就忽略掉了。对于大多数情况,看看基因表达量高低,这招儿够用了。但你要是想看看这个基因有没有发生可变剪接,有没有融合突变,那对不起,关键信息全在中间那部分,你读了个开头,猜不到结局啊!

这就好比你追剧,只看第一集和最后一集,中间主角经历了啥,是怎么黑化的,跟谁谈了恋爱,一概不知。那这剧追得还有啥意思?对于研究疾病机制的人来说,那些位于编码区(CDS)的序列信息,比如单核苷酸变异,或者像慢性粒细胞白血病里那种BCR-ABL1融合基因的断裂点,那才是决定疾病走向的关键“剧情”啊!

这时候,就得请出那些能读“全文”的技术了。像刚才提到的RoCK and ROI,它就带了个叫 ROIseq 的功能,专门针对你指定的“感兴趣区域”进行测序,让你既能看清全貌(全转录组),又能聚焦细节(特定区域)-1。还有更狠的,比如基于长读长测序平台(像PacBio和Oxford Nanopore)的单细胞技术,那家伙,直接给你把一整条RNA分子从头读到尾 -8。什么可变剪接异构体,什么基因融合,在它面前就跟秃子头上的虱子似的,明摆着。以前我们只能推断某个基因可能有不同的剪接方式,现在直接用眼睛看,那感觉,就像是从标清一下子蹦到了4K高清。

再往深了说,第三个也是我觉得最颠覆认知的痛点:基因型(DNA)和表型(RNA)之间那笔“糊涂账”

很多时候,我们发现肿瘤里某个基因拷贝数变多了(DNA扩增),就本能地觉得,那它对应的RNA表达肯定也水涨船高呗,毕竟“人多力量大”嘛。事实真的如此吗?那可不一定!最近有个叫 wellDR-seq 的技术,它牛就牛在可以同时对一个细胞的DNA和RNA进行测序 -3。研究者们用这个技术在乳腺癌里一探究竟,结果发现了个惊天秘密。

他们发现,有些基因,比如那个跟乳腺癌预后密切相关的 PGR,它的表达确实是“剂量敏感”的——DNA多了,RNA也跟着涨。但像 PIK3CATP53 这种明星癌基因,它们居然是“剂量不敏感”的!也就是说,哪怕DNA那里拷贝数都翻了好几倍,RNA这边愣是岿然不动,表达量稳如老狗 -3。这就邪门了!这说明,细胞内部有着极其复杂的调控机制,DNA的突变要最终影响到细胞的功能(通过RNA表达变化),中间还隔着十万八千里呢。以前我们光靠RNA数据去反推DNA的拷贝数变化,那不靠谱,现在有了这种共测序技术,才算是把这两口子的关系给捋清楚了。这单细胞测序技术发展到这一步,已经开始从单纯的“看图说话”进化到“破案推理”了,它不仅要告诉你谁是谁,还要告诉你谁导致了谁。

除了这些,现在单细胞测序技术还在往两个极端狂奔。一个极端是 “极稀有的捕获” 。比如你想从病人血液里找那个凤毛麟角的循环肿瘤细胞(CTC),百万个正常细胞里才藏着那么一个,这要搁以前,简直就是大海捞针。现在有了像 PURE-seq 这样的技术,先把细胞通过流式分选(FACS)富集一下,再去做单细胞测序,一个小时就能抓到几十个目标细胞 -5。这对于早期诊断和监测复发,意义太大了。

另一个极端是 “极宏观的视野” 。以前单细胞技术再牛,一次也只能看几千个细胞。现在呢?随着商业平台的不断升级换代,一次性能看几万、甚至几十万个细胞已经不是什么新鲜事儿了 -7。而且,科学家们不满足于只看单个细胞了,他们开始把这些单细胞数据放回到组织原来的位置上去看,这就是空间转录组。配合上人工智能(AI)的分析,比如那些所谓的“基础模型”,能从海量数据里自动学习、识别细胞类型,甚至能像个“AI智能体”一样,帮你设计实验、分析数据,那效率,杠杠的 -4

说到这儿,不得不提一下那些藏在基因组“垃圾堆”里的宝藏——非编码区。咱们都知道,全基因组关联分析(GWAS)找到的那些跟疾病相关的位点,95%以上都落在不编码蛋白质的区域。这些区域以前被认为是“垃圾DNA”,现在知道它们大多在调控基因表达。可问题来了,这些非编码区的变异到底影响了哪个基因?影响了多少?以前的技术根本没法在单细胞层面回答。现在有了 SDR-seq,它不管变异是在编码区还是非编码区,都能把它跟同一个细胞里的基因表达给关联起来 -10。这就好比给每一个细胞都建立了一个“遗传档案”和一份“工作汇报”,你拿着档案去对照工作表现,就能清清楚楚地看到,档案上的哪一行记录(哪个遗传变异)直接导致了工作表现上的啥问题(基因表达变化)。这对于理解复杂疾病的发病机理,简直是大杀器。

总结一下俺这几年的感受。从一开始的懵懂无知,到被数据折磨得痛不欲生,再到看着新技术一个个冒出来,把那些看似无解的难题一个个攻克。这个感觉就像是看着一个孩子长大。最开始,它只会哭(告诉你这里有细胞,有基因),慢慢地,它学会了认字(告诉你是什么细胞,有什么marker),现在,它已经能写文章了(告诉你DNA和RNA怎么互动,剪接怎么变)。每一次的技术迭代,都不是简单的修修补补,而是实实在在地往你手里塞了一把更锋利的刀,让你能更深入地去解剖生命这个最复杂的机器。

所以,下次再有人跟你提单细胞测序,你别光想着UMAP和聚类图。你得想想,你关心的那个低表达基因,有没有哪个新方法能把它精准地捞出来?你想看的那段可变剪接,是不是该试试长读长技术?那些藏在DNA里的“犯罪动机”,能不能和RNA的“犯罪行为”对上号?

科研这条路,不就是靠着这些越来越趁手的工具,一步步把未知变成已知,把“卧槽”变成“原来如此”的吗?反正我是觉得,有这些新技术在手,未来几年,生物学的好戏,还在后头呢!咱们就搬个小马扎,嗑着瓜子,等着看大戏吧!😎

扫描二维码

手机扫一扫添加微信