全面解析!基因編輯過程中產生的染色體結構異常

CRISPR/Cas9核酸酶基因編輯系統被廣泛應用於基礎科研領域。它透過guide RNA

(gRNA)

與DNA配對,在靶向位點產生DNA雙鏈斷裂

(DNA double-stranded break, DSB)

,再利用細胞對DSB的修復產生基因突變從而完成基因編輯。除了脫靶活性一直制約著其在臨床治療上的進一步應用,美國NIH Somatic Cell Genome Editing Program在今年發表的

Nature

文章中還強調了要重點關注基因編輯過程中產生的染色體結構變異,如染色體易位,染色體大片段缺失等,並建議開發相關檢測方法

【1】

早在2019年,

北京大學生命科學學院和北大-清華生命科學聯合中心

胡家志

課題組就開發了全面評估基因編輯安全性的方法PEM-seq

(Primer-extension-mediated sequencing)

【2】

,可以從一個測序庫中同時檢測編輯活性、脫靶活性、和染色體異常結構等資訊。利用該方法,課題組進一步回答了一系列相關問題:基因編輯過程中染色體結構變異的產生有怎樣的頻率以及規律特徵?DNA損傷修復在其中起著怎樣的作用?以及目前該領域存在的諸多Cas9變體對基因組的穩定性影響又如何?

全面解析!基因編輯過程中產生的染色體結構異常

近日,

胡家志

課題組在

Nuclei Acid Research

發表了兩篇論文,題為

Global detection of DNA repair outcomes induced by CRISPR-Cas9

In-depth assessment of the PAM compatibility and editing activities of Cas9 variants

闡述了Cas9基因編輯產物的規律特徵,揭示了基因編輯過程中的不穩定因素,並且詳細評估了該領域內常見Cas9變體的編輯活性和對基因組穩定性的影響,更為安全基因編輯提供了重要啟示。

全面解析!基因編輯過程中產生的染色體結構異常

全面解析!基因編輯過程中產生的染色體結構異常

全面解析!基因編輯過程中產生的染色體結構異常

全面解析!基因編輯過程中產生的染色體結構異常

圖1。 PEM-Q全面揭示基因編輯產物規律。 a) PEM-Q檢測基因編輯產物型別以及同源末端鑑定。 b) Cas9在不同DNA修復蛋白缺失背景下,在CH12F3細胞 c-Myc位點編輯時各個產物的定量。 c) 基因編輯過程中染色體易位(左),染色體大片段缺失(右)的模式。 d) 基因編輯過程中外源DNA載體插入位點在質粒上的分佈。 AAV2 ITR原件能夠促進質量上DSB的形成。

作者首先在2019年發表的PEM-seq實驗方法的基礎上,開發了全面分析Cas9編輯產物的新生物資訊分析工具PEM-Q

(圖1a)

,該工具不僅可以分析Cas9編輯所造成的小規模插刪

(small insertions and deletions,indels)

, 還可以分析編輯過程中造成的大片段缺失、質粒插入和染色體易位等染色質異常事件。作者利用PEM-Q在多種人和小鼠的細胞系中對Cas9進行了全面評估,以CH12F3中的c-Myc位點為例,作者發現

Cas9在靶向位點產生indels的同時,還會造成佔編輯事件近3%的染色體大片段缺失,近3%的染色體易位,近1%的外源DNA片段

(質粒,病毒載體)

插入

(圖1b-d)

。其中小規模插刪是Cas9在靶向位點產生的數個鹼基

(小於20個)

的插入或者缺失的編輯產物,它造成基因讀碼框的偏移從而造成基因突變,是基因編輯中的主要目的產物;而染色體易位是編輯位點與其他染色體上的DSB發生連線產生的異常產物。靶向位點傾向於與Cas9的脫靶位點以及基因轉錄活躍區域發生連線,並與染色質三維結構相關

(圖1c左)

,染色體易位是一種危險的染色體結構變異,常常與血液和神經相關腫瘤的發生相關聯;除此之外,Cas9還會在編輯位點處造成數百bp至數百kb長度的染色體大片段缺失,這種副產物造成了遺傳物質的缺失

(圖1c右)

;對於外源DNA片段的插入,作者發現質粒或者病毒載體上的易斷裂位點易整合到靶向位點導致外源DNA的插入,研究表明病毒DNA的插入可以影響其附近染色體的狀態,與腫瘤的發生有一定關係。作者發現這些副產物在不同細胞系,不同位點之間的分佈表現出很大的差異

(圖1b)

,這些都說明了使用CRISPR-Cas9進行編輯前進行全方位評估的必要性。

全面解析!基因編輯過程中產生的染色體結構異常

圖2。 利用PEM-seq評估Cas9變體。 a) PEM-seq從切割效率,脫靶活性,染色體異常結構評估Cas9變體。 b) Cas9變體脫靶位點的數目。 c) 利用深度學習模型預測SpRY的脫靶位點(左),模型準確性的評估(右)。 d) SpRY切割自身表達質粒載體並造成大量外源片段插入基因組中。

為了減少Cas9的脫靶活性以及拓寬Cas9的靶向範圍,該領域工作者開發出了多種Cas9變體。作者進一步利用PEM-seq全面評估了現今常用的8種Cas9高保真變體

(eSpCas9, FeCas9, HF1, Hypa, evo, Hifi, LZ3, Sniper )

以及4種靶向範圍更廣泛的廣域編輯變體

(xCas9, Cas9-NG, SpG, SpRY)

【3,4】

。對於高保真變體,作者驗證了其犧牲了切割效率來提高特異性的均衡模型,並發現eSpCas9, FeCas9, HF1, Hypa在大部分位點表現優異;而對於廣域編輯變體,作者在驗證其靶向範圍更加廣泛的同時

(xCas9活性較差)

,也發現了它們具有更加嚴重脫靶活性

(圖2a, 2b)

。以PAM識別序列為NNN的SpRY為例,作者在多個位點檢測到了數十至數百個脫靶位點,並以此開發了一套深度學習的模型來準確預測其脫靶位點

(圖2b, 2c)

;進一步,該工作發現無論是野生型Cas9還是Cas9變體,它們都會造成相近比例染色體易位、染色體大片段缺失等染色體結構變異;而對於廣域編輯變體而言,它們還存在著切割自身表達載體,從而導致大量外源DNA插入靶向位點以及在基因組上隨機插入的問題

(圖2d)

;最後作者透過將高保真變體的突變與SpRY進行組合,找到了三個靶向範圍廣且脫靶效率低的Cas9新變體。

該工作向我們提示了隨著基因編輯在臨床應用上的不斷延伸,Cas9的安全性評估不應該僅侷限於脫靶活性,染色體結構變異也是一種必然發生且比例不低的基因編輯副產物,而該副產物往往具有不可控性以及不可預測性,但又與癌症的發生相偶聯,應該得到重視。目前來看,染色體異常結構不能透過Cas9高保真變體減弱,而以往透過抑制DNA損傷修復通路來增強同源重組效率的方式也並不可取,因為這往往會影響DNA損傷修復造成更多的DNA損傷,對基因組穩定性帶來更大的危害。所以

目前亟需尋找一種既可以保持基因編輯工具編輯活性又能有效降低脫靶活性和染色質結構變異的基因編輯工具。這樣,才能讓基因編輯工具更安全地應用於臨床。

北京大學

胡家志

研究員為兩篇文章的通訊作者。第一篇文章中,博士研究生

劉孟竺

張微微

辛昌昌

為共同第一作者。第二篇論文中,

張微微

為共同第一作者,

尹健行

為共同第一作者兼共同通訊作者。張丁崢嶸,尚雅芳,王渝鴻,艾晨,李嘉欣在該工作中亦有重要貢獻。該文章還得到了上海生化所孟飛龍研究員的支援與合作。

原文連結:

https://doi.org/10.1093/nar/gkab686

https://doi.org/10.1093/nar/gkab507

參考文獻

1。 Saha, K。 et al。 The NIH Somatic Cell Genome Editing program。

Nature

592, 195-204, doi:10。1038/s41586-021-03191-1 (2021)。

2。 Yin, J。 et al。 Optimizing genome editing strategy by primer-extension-mediated sequencing。

Cell Discov

5, 18, doi:10。1038/s41421-019-0088-8 (2019)。

3。 Anzalone, A。 V。, Koblan, L。 W。 & Liu, D。 R。 Genome editing with CRISPR-Cas nucleases, base editors, transposases and prime editors。

Nat Biotechnol

38, 824-844, doi:10。1038/s41587-020-0561-9 (2020)。

4。 Schmid-Burgk, J。 L。 et al。 Highly Parallel Profiling of Cas9 Variant Specificity。

Mol Cell

78, 794-800 e798, doi:10。1016/j。molcel。2020。02。023 (2020)。