在一项新的研究中,来自中国科学院上海生命科学研究院、复旦大学、清华大学和美国德克萨斯大学的研究人员开发出一种新的系统来鉴定和描述控制人基因组中的调节性DNA序列活性的分子组分。相关研究结果发表在2017年8月24日的Cell期刊上,论文标题为“In Situ Capture of Chromatin Interactions by Biotinylated dCas9(利用生物素化的dCas9原位捕获染色质相互作用)”。论文通信作者为复旦大学生物医学研究院周锋(Feng Zhou)研究员和德克萨斯大学西南医学中心的徐剑(Jian Xu)教授。
人基因组包含所有蛋白编码基因,具有将近30亿个碱基对。尽管具有比较大的基因组大小,但是仅2%的人基因组编码蛋白。剩下的98%的人基因组由调节着这些蛋白编码基因在何时和何处激活的非编码区域组成。人体遗传学和癌症基因组研究已反复地将这些非编码区域鉴别为癌症等人类疾病的潜在促进物。
更好地理解这些调节区域和指导基因何时开启和关闭的基本原则对发现疾病如何产生和发现新的疗法是有必要的。然而,鉴定这些非编码区域和理解它们如何发挥作用的工具是有限的。它们需要之前鉴定出调节这些区域的蛋白因子,依赖于获得抗体等试剂,而且经常需要复杂的基因操作。
由这些研究人员开发出的这种新的系统为深入研究这些调节性序列元件铺平道路。这种系统被称作CAPTURE(CRISPR Affinity Purification in situ of Regulatory Elements, 原位CRISPR亲和纯化调节元件),提供一种同时分离基因组序列结合蛋白以及研究它们与RNA和DNA之间的相互作用的方法。
CAPTURE让人们分离和分析调节着人DNA的所有因子的能力为研究不同的蛋白如何控制癌细胞和干细胞中的基因组功能提供多种可能。这也为发现新的药物靶标提供一种全新的途径。
CAPTURE方法是通过改变CRISPR基因组编辑系统的用途而被开发出来的。CRISPR系统包括Cas9蛋白,即一种经向导RNA(gRNA)引导结合到靶DNA上的酶。CAPTURE的工作机制是利用gRNA将一种失活的Cas9版本(dCas9)引导到研究人员想要研究的DNA序列元件上,而且dCas9接受生物素标记。随后,生物素化的dCas9---与其他的蛋白、RNA和跟dCas9在染色体上的位置相关联的DNA序列一起---经过链霉亲和素亲和纯化,就能够被分离出来和接受研究。这就使得鉴定和描述整个基因组中的调节区域和与这些调节区域结合的蛋白成为可能。
作为概念研究,这些研究人员利用CAPTURE方法成功地鉴定出很多已知的和新的人端粒结合蛋白。端粒是短的位于染色体末端的重复DNA序列,保护着我们的染色体免受磨损或与附近的染色体融合在一起。接着,他们在人血细胞中发现了调节异常的β-珠蛋白基因表达的新机制。β-珠蛋白是血红蛋白的一个至关重要的亚基,而血红蛋白负责我们的肺部和身体组织之间的氧气和二氧化碳交换。β-珠蛋白基因表达变化与遗传性血红蛋白疾病(如镰状细胞疾病)相关联。当前,镰状细胞疾病影响着世界5%的人口。
利用CAPTURE对基因组开展无偏差的分析为生物医学科学家们提供一种强大的新工具来阐明背后的调节机制。这种新的工具将加快人们对人基因组和多种疾病中的基因变异的理解。