研究方向

基因组转座子挖掘及其应用

主要开展转座子介导基因传递技术、基因编辑技术、分子标记技术研发及其应用研究,研究方向包括:(1)转座子进化、活性DNA转座子挖掘及高效基因传递工具开发; (2)转座子起源小分子靶向核酸酶挖掘及基因编辑工具开发;(3)大片段DNA定点整合技术研发;(4)逆转座子插入多态RIP分子标记规模挖掘及配套芯片研发。研究主要使用大肠杆菌、 哺乳动物细胞、酵母细胞、斑马鱼、小鼠和猪模型生物等。

1. 转座子进化及其生物学意义

转座子的转座特性使其能够水平传播,颠覆了人们对生命演化过程中关于遗传物质垂直传播的传统认识。这一特征使遗传物质能够在不同的物种、界和域之间发生水平转移。解析转座子的起源、分类、横向传播、驯化(蛋白编码基因驯化)和适应(基因拼接元件和表达调控调节元件,如增强子、启动子、lncRNA等)等进化规律,揭示转座对重塑功能基因基因组、转录组和表观组中的作用,对理解转座子在功能基因演化、基因组进化、表型变异和物种分化中的生物学功能有重要意义。

2. 活性转座子挖掘及高效基因传递工具开发

转座子的转座特性使其具有介导大片段DNA转移的能力,挖掘活性转座子,进行高效基因传递工具开发和工程化优化,在人类基因治疗和转基因生物育种中有广泛应用前景。

Fig.1. Structure of cut-and-paste transposons and their transposition mechanism. (A) The transposon is a mobile genetic element containing a transposase coding sequence (green box) flanked by terminal inverted repeats (TIRs; orange arrows on the left and right). (B) The transposase (green spheres) binds to its sites within the transposon TIRs (orange boxes). Excision takes place in a synaptic complex, and separates the transposon from the donor DNA (gray box). The excised element integrates into a target site in the target DNA (yellow box). This process generates target site duplications (TSDs, black boxes) which flank the newly integrated transposon. Most cut-and-paste transposons generate a transposon excision footprint in the donor DNA.

Fig.2. Experimental pipeline for the development of genetic tools based on active DNA transposons.

3. 转座子起源小分子靶向核酸酶挖掘及基因编辑工具开发

目前基因编辑中广泛应用的Cas9和Cas12a(Cpf1)核酸酶分子比较大(1200-1400 aa),给系统遗传改造、基因包装和细胞传递带来诸多不便,且基因编辑效率还不高,存在脱靶现象,严重制约了CRISPR/Cas技术在基因治疗、生物育种等领域的应用。

TnpB 是一种与转座子相关的小分子靶向核酸酶,研究表明三类转座子(IS605, IS607, IS1341)含有TnpB。它是 RNA引导的核酸酶,在细菌和古菌中广泛存在。近年来,TnpB 因其与 CRISPR-Cas 系统的相似性而受到关注,被认为是 CRISPR-Cas 系统的进化前体之一。TnpB能够加工自身的mRNA以产生引导RNA。这些引导RNA是短RNA分子,能够将TnpB核酸酶引导到特定的DNA序列。加工过程涉及对mRNA的切割,生成引导RNA,随后引导RNA用于将核酸酶活性定位到基因组中的正确位置

小分子靶向核酸酶具有许多优点,如易于合成、稳定性高,便于遗传修饰和细胞传递等。通过对原核生物基因组大数据挖掘转座子起源的小分子核酸酶,并利用人工智能(AI)等技术,进行定向进化、分子重构,研发基因编辑效率高、靶向特异性强的新型基因编辑工具,能够为人类基因治疗和转基因生物育种提供更加安全高效的编辑系统。

4. 大片段DNA定点整合技术研发

逆转录转录病毒和DNA转座子作为基因传递系统已经有大量的研究报道。然而逆转录病毒依靠内源性逆转录酶活性以及通过复制粘贴机制进行转座。 且由于涉及RNA中间体和逆转录,逆转录病毒介导的转基因可能不稳定。另外,逆转录病毒载体制备和储存比较复杂、载体容量有限、生物安全要求高、成本高昂。

相比之下,DNA转座子利用简单的“剪切粘贴”机制,其介导的基因传递相对简单且转基因片段更加稳定。科学家已经成功挖掘并改造了多种DNA转座子(如ZB、PS、SB和piggyBac),作为高效的基因传递载体,用于基因治疗,转基因和突变体制备。与逆转录病毒载体相比,DNA转座子作为基因治疗传递载体具有成本低廉、载体容量大、整合稳定、易于操作,受免疫系统沉默的影响小等优点。

然而,由于在基因组上的随机整合,目前基于DNA转座子载体(包括逆转录病毒载体)传递系统的基因治疗技术仍然存在一些潜在风险,如随机整合导致基因突变,致癌基因的激活或肿瘤抑制基因的失活等,这些可能会导致肿瘤的形成,这种现象被称为插入突变,以上风险是目前逆转录病毒载体和DNA转座子载体在基因治疗中主要安全性关切和挑战。

因此,靶向转座DNA转座子挖掘,并利用人工智能(AI)等技术的后续工程化改造,开发高效的基因定点转移技术,可以大大降低由随机整合引起的风险,显著提高DNA转座子介导基因治疗的安全性。

另外,通过转座酶和小分子靶向核酸酶融合,构建大片段DNA定点整合技术也是实验室重点攻关方向。

5. 基于活性转座子插入多态为基础的分子标记研发及其在动物遗传育种研究中的应用

由于转座子能在物种间和物种内转移,因此,像其它的突变源一样,能够产生丰富的基因组结构变异,转座产生的结构变异也称为转座子插入多态。转座子是很多模式动物基因组主要成份,占斑马鱼基因组55%左右,蛙类基因组35%左右,家蚕基因组45%左右,逆转录转座子(Retrotransposon)占哺乳动物基因组30-50% ,占家猪基因组40%左右,是哺乳动物基因组主要成分,主要分为长散在重复序列(LINEs)、短散在重复序列(SINEs)和长末端重复序列(LTRs,含内源性逆转录病毒,ERVs)三种类型。

由于转座子插入片段大(一般100 bp以上),且大多含有功能元件(启动子、增强子等),转座产生的结构变异产生的遗传效应普遍比SNP更强。转座插入能够通过导入调控元件、改变基因拼接方式、改变表观调控等方式引起基因功能和活性改变,从而引起表型变异。另外,由于转座产生的结构变异是由内源性转座酶介导,而SNP是自然突变,其突变率(2.5×10−2)比SNP(1.0-1.8×10–8)高。

转座子的转座不仅促进了物种间基因组的分化,而且还产生了物种内丰富的遗传多样性,对物种、品种、亚种、品系和新性状形成发挥了重要作用。因此,转座子插入形成的多态是重要的新型分子标记,其在遗传进化研究中的应用为我们理解高等生物基因组的进化提供了全新视角,同时,转座子插入多态分子标记技术也成为生物多样性、遗传进化和分子育种研究的重要工具。

与传统SNP标记相比,转座子插入多态分子标记具有突变率高、稳定性好、数量大、分布范围广、遗传效应大、检测手段简单快速和开发成本低等特点。因此,基于基因组上转座子插入多态的分子标记规模挖掘及其配套芯片研发在QTL精细定位、全基因组选择等遗传育种研究中具有更高的应用价值。

猪等家畜基因组中50%以上的结构变异由逆转座子介导产生(也称为逆转座子插入多态RIP,Retrotransposon Insertion Polymorphism),特别SINE逆转座子(家畜基因组上分布最广泛,多态最丰富的一类转座子)产生的RIP标记最具开发潜力。