Một trong những mục tiêu lớn của công nghệ sinh học là chỉnh sửa hệ gene (genome editing) của các sinh vật, gồm cả con người, một cách chính xác, nhanh chóng, thuận tiện và ít tốn kém. Vài năm gần đây, một công nghệ mới tên là CRISPR-Cas xuất hiện, hứa hẹn sẽ biến việc chỉnh sửa hệ gene trở thành một kỹ thuật phổ biến như kỹ thuật chuyển gene thực vật ngày nay. Hãy cùng tìm hiểu xem kỹ thuật này là như thế nào nhé!
Một số thuật ngữ chính
CRISPR:
clustered regularly interspaced short palindromic repeat, tạm dịch: cụm đoạn lặp xuôi ngược ngắn phân cách đều.
Cas:
CRIPS-associated ([yếu tố] đi kèm với CRISPR)
ncRNA:
non-conding RNA, là các RNA không mã hóa protein
CRISPR được
tìm thấy ở hầu hết cổ khuẩn archaea (~90%) và ở nhiều vi khuẩn (~40%). Nó là
trình tự lặp phổ biến nhất ở vi khuẩn, chiếm tới 40-70% lượng trình tự lặp ở một
số loài.
Cấu trúc của CRISPR trong genome vi khuẩn
Nghiên cứu
cho thấy tổ chức của CRISPR trong genome vi khuẩn rất đa dạng. Một locus (vị
trí) CRISPR cấu thành từ các đoạn lặp (repeats) dài 21 đến 48 bp xen kẽ bởi các
trình tự dài 26 đến 72 bp gọi là các đoạn đệm (spacers). Trong một locus thì
kích thước của đoạn lặp và đoạn đệm rất ổn định. Mỗi locus CRISPR được đặc
trưng bởi trình tự của đoạn lặp điển hình trong locus đó. Một locus CRISPR chỉ
chứa các đoạn lặp và các đoạn đệm, không có khung đọc mở (open reading frame).
Thường thì
trong một locus CRISPR, trình tự đoạn lặp rất bảo thủ. Hầu hết các đoạn lặp có
tính palindromic một phần (nghĩa là một phần trình tự xuôi và ngược giống
nhau), dẫn đến khả năng hình thành nên cấu trúc thứ cấp ổn định, bảo thủ cao.
CRISPR thường
nằm trong nhiễm sắc thể, nhưng cũng có trường hợp nằm trong plasmid.
Phía thượng
nguồn của một locus CRISPR là leader region (là trình tự đánh dấu sự bắt đầu của
một CRISPR array; CRISPR array là trình tự bao gồm các đoạn đệm và lặp) dài từ
20 đến 534 bp. Locus CRISPR được phiên mã do một promoter nằm trong leader
region. Ngoài ra, luôn tìm thấy vài gene đi kèm CRISPR (CRISPR-associated –
Cas) ở vùng lân cận, tạo thành hệ thống CRISPR-Cas (bao gồm locus CRISPR và các
gene Cas lân cận). Một hệ thống CRISPR-Cas thường gồm 4 đến 20 gene cas khác nhau. Các gene cas mã hóa một họ protein lớn và đa dạng
có các domain điển hình của nuclease, helicase, polymerase và các protein gắn
polynucleotide. Các gene cas này có
thể nằm ở phía thượng nguồn hay hạ nguồn của vùng lặp/đệm.
Đặc điểm thường thấy
|
|
Các
đoạn lặp (repeats)
- Có từ 2 đến 375 đoạn lặp trong mỗi
vùng (locus)
- Trình tự đoạn lặp ít biến đổi
- Đoạn lặp dài từ 21 đến 48 bp.
|
Các
đoạn đệm (spacers)
- Có từ 1 đến 374 đoạn đệm trong mỗi
locus
- Trình tự biến đổi
- Đoạn đệm dài từ 26 đến 72 bp.
|
Có thể có
nhiều locus CRISPR trong hệ gene của sinh vật prokaryote. Số lượng lớn nhất
phát hiện được cho tới nay là 20 locus CRISPR trong hệ gene của Methanococcus jannaschii. Các đoạn lặp
và đệm trong CRISPR có thể chiếm tới 1% tổng trình tự toàn hệ gene của vi khuẩn.
Có nhiều suy đoán về vai trò của CRISPR như vai trò trong tái sắp xếp nhiễm sắc
thể, điều hòa biểu hiện của các gene lân cận, sửa chữa DNA… Năm 2005, ba nghiên
cứu độc lập cho thấy sự tương đồng giữa trình tự của các đoạn đệm (spacers) với
các yếu tố ngoại nhiễm sắc thể như plasmid và virus. Điều này dẫn tới giả thuyết
rằng CRISPR có thể đóng vai trò miễn dịch thích nghi (adaptive immunity) chống
lại các yếu tố di truyền ngoại lai.
CRISPR, Cas và khả năng miễn dịch
Năm 2007,
một nghiên cứu quan trọng trên vi khuẩn Streptococcus
thermophilus (vi khuẩn sử dụng trong ngành công nghiệp sữa) được đăng tải.
Việc sử dụng loài vi khuẩn này trong công nghiệp thường bị đe dọa bởi các thực
khuẩn thể (phage – các virus tấn công vi khuẩn) nên các nhà nghiên cứu thường
chọn lọc các chủng vi khuẩn kháng được thực khuẩn thể. Bài báo cho thấy rằng,
trong quá trình tạo nên các chủng vi khuẩn mới kháng thực khuẩn thể, vi khuẩn
thường thay đổi các CRISPR bằng cách tích hợp thêm các đoạn lặp-đệm mới vào một
đầu của CRISPR. Các trình tự được tích hợp mới này giống hệt với trình tự có
trong các thực khuẩn thể dùng trong nghiên cứu chọn lọc, gợi ý rằng các đoạn lặp-đệm
mới đó có nguồn gốc từ nucleic acid của thực khuẩn thể. Để kiểm nghiệm điều
này, trình tự của đoạn đệm được biến đổi, và quả thực là việc chèn thêm đoạn đệm
có thể tạo ra tính kháng thực khuẩn thể, còn việc xóa đoạn đệm khiến vi khuẩn mất
tính kháng. Phát hiện này được xác nhận trên Streptococcus mutans, trong đó các chủng kháng thực khuẩn thể có
thêm các đoạn đệm mới trong CRISPR với trình tự giống hệt trình tự trong genome
thực khuẩn thể. Không những có khả năng ngăn chặn được sự tấn công của virus,
các CRISP còn có khả năng ngăn chặn sự xâm nhập của các plasmid. Hơn nữa, các
nghiên cứu về động học genome cho thấy rằng các locus CRISPR tiến hóa để đáp ứng
với sự tấn công của virus.
Nghiên cứu
sâu hơn cho thấy, các đoạn spacer có trình tự tương đồng với trình tự của virus
hay plasmid ngoại lai đóng vai trò định hướng đối tượng, còn nhiệm vụ phá hủy,
hay cắt, DNA của virus và plasmid ngoại lai đó là do các protein Cas đảm nhiệm.
Như đã nói ở trên, một số gene cas mã hóa nên các nuclease, và khi được định hướng
tới mục tiêu, các nuclease này sẽ cắt đứt đoạn DNA hoặc RNA mục tiêu ở một vị
trí nhất định. Như vậy, trong hệ thống CRISPR-Cas thì CRISPR chứa trình tự mục
tiêu giúp hệ thống nhận biết mục tiêu cần can thiệp, còn Cas phá hủy (cắt) mục
tiêu.
Có rất nhiều
gene cas khác nhau, và phân tích hệ gene của 200 vi khuẩn và cổ khuẩn cho thấy
có thể có tới 45 họ gene cas.
Hệ thống
phân loại hiện tại chia CRISPR-Cas vào hai lớp. Lớp 1 sử dụng nhiều protein Cas
để phá hủy nucleic acid ngoại lai. Các hệ thống thuộc lớp 2 sử dụng một protein
Cas duy nhất cho mục đích này. Lớp 1 được
chia nhỏ thành các Kiểu I, III và IV. Lớp 2 được chia thành các Kiểu II và V.
Cơ chế miễn dịch tổng quát của hệ thống
CRISPR-Cas
Tiếp nhận các đoạn đệm
Khi một vi
khuẩn bị virus tấn công, bước đầu tiên của đáp ứng miễn dịch là bắt giữ DNA của
virus và chèn một phần DNA này vào một locus CRISPR dưới dạng đoạn đệm
(spacer). Cas1 và Cas2 được chứng minh là có liên quan tới quá trình này.
Các đoạn
DNA của virus mà được vi khuẩn chọn để làm spacer được gọi là các protospacer
(tiền spacer). Phân tích cho thấy vi khuẩn không chọn các đoạn này một cách ngẫu
nhiên, mà các đoạn này thường nằm cạnh một đoạn DNA ngắn (3-5 bp) được gọi là
các motif liền kề protospacer (protospacer adjacent motifs – PAM). Các đoạn PAM
này là quan trọng với các hệ thống CRISPR-Cas kiểu I và II. Trong các hệ thống
kiểu này, các protospacer bị cắt một đầu cạnh PAM, còn đầu kia dựa theo một
kích thước nhất định (ví dụ, 20 bp kể từ đầu gần PAM), do đó duy trì một kích
thước nhất định của các đoạn spacer trong hệ thống CRISPR-Cas. Các đoạn spacer
mới thường được chèn về hướng trình tự leader (hình 1).
Sinh tổng hợp và can
thiệp
crRNA
(CRISPR-RNA) là trình tự RNA sau này sẽ định hướng Cas nuclease tới mục tiêu
trong quá trình can thiệp và được phiên mã từ trình tự CRISPR. Ban đầu, crRNA
được phiên mã thành một sản phẩm phiên mã (transcript) dài duy nhất bao gồm hầu
hết dãy trình tự lặp-đệm trong CRISPR. Sản phẩm phiên mã này sau đó được các
protein Cas cắt nhỏ thành các crRNA riêng rẽ.
Các crRNA
liên kết với các protein Cas để tạo thành phức hợp nhận biết và phá hủy các
nucleic acid ngoại lai. crRNA không phân biệt giữa DNA mã hóa với không mã hóa.
Các bước
nêu trên là các bước cơ bản trong cơ chế miễn dịch nhờ CRISPR-Cas. Hệ thống này
rất đa dạng (ví dụ, có tới 45 họ gene cas khác nhau) nên chi tiết sẽ khác nhau
với từng hệ thống. Ví dụ, có hệ thống yêu cầu phải có trình tự PAM trong crRNA,
trong khi các hệ thống khác thì không. Có hệ thống bao gồm nhiều protein Cas với
các nhiệm vụ khác nhau (xử lý sản phẩm phiên mã crRNA, phá hủy DNA ngoại lai),
có hệ thống sử dụng một protein Cas (ví dụ, Cas9) đa năng duy nhất.
Đặc điểm
chủ chốt của hệ thống CRISPR-Cas là (1) tạo ra điểm đứt gãy sợi kép trên DNA và
(2) điểm đứt gãy này được định vị một cách chính xác nhờ đoạn crRNA định hướng.
crRNA được phiên mã từ DNA, mà DNA có thể dễ dàng được tổng hợp nên sử dụng hệ
thống CRISPR-Cas có thể tạo ra điểm đứt gãy sợi kép ở bất kỳ vị trí mong muốn
nào.
Đối với
virus hoặc plasmid, các đứt gãy sợi kép trên DNA của chúng nghĩa là chúng bị
phá hủy, không còn có thể hoạt động được nữa. Tuy nhiên, nếu các đứt gãy này xảy
ra với DNA trong hệ gene của một tế bào chẳng hạn, thì ngay lập tức tế bào có cơ
chế để sửa chữa DNA. Bước sửa chữa điểm đứt gãy này chính là thời điểm công nghệ
chỉnh sửa gene vào cuộc.
CRISPR-Cas9 và ứng dụng trong chỉnh sửa
hệ gene (genome editing)
Số lượng
bài báo đề cập đến CRISPR đã tăng vọt từ mấy chục bài trong năm 2010 lên tới
hơn 600 bài trong năm 2014. Biểu đồ sau thể hiện số lượng bài báo đề cập đến
CRISPR qua các năm từ 2010 đến 2014, kèm theo dự báo cho năm 2015.
Hình 5. Tốc độ tăng trưởng theo cấp số mũ của số lượng các bài báo về CRISPR. |
Sở dĩ
CRISPR được quan tâm nghiên cứu vì khả năng ứng dụng mạnh mẽ và dễ dàng trong
việc tinh chỉnh gene, dễ dàng hơn nhiều so với các công nghệ tinh chỉnh gene
khác. Phần sau đây sẽ tập trung mô tả hệ thống CRISPR-Cas9, là hệ thống được
nghiên cứu và khai thác rộng rãi nhất hiện nay.
CRISPR-Cas9 và cơ chế
hoạt động
Các hệ thống
khác cần các protein Cas khác nhau cho bước xử lý crRNA và bước cắt DNA.
CRISPR-Cas9 khác biệt ở chỗ nó chỉ cần một protein Cas duy nhất là Cas9.
Dựa trên cấu
trúc tự nhiên của CRISPR-Cas9, các nhà nghiên cứu đã đơn giản hóa hệ thống này
bằng cách kết hợp tracrRNA và crRNA thành một RNA định hướng duy nhất (single
guide RNA – sgRNA). Cas9 định hướng bởi sgRNA được chứng minh là hiệu quả tương
đương với Cas9 định hướng bởi tracrRNA và crRNA riêng rẽ. Để phục vụ cho mục
đích chỉnh sửa gene, các thành phần không liên quan như leader region, các gene
cas có vai trò khác, và các đoạn lặp bị loại bỏ. Gene mã hóa cho Cas9, RNA định
hướng (sgRNA) chứa trình tự mục tiêu được kết hợp vào một plasmid biểu hiện nhỏ.
Khi chuyển các plasmid này vào tế bào mục tiêu, Cas9 cùng sgRNA được biểu hiện
đồng thời. Chúng kết hợp với nhau tạo thành một hệ thống CRISPR-Cas9 đơn giản
mà hiệu quả, có thể tạo ra điểm đứt gãy trên DNA tế bào chủ tại vị trí mong muốn.
Hình 7: Các hệ thống CRISPR tự nhiên và nhân tạo. Các bước xảy ra với hệ thống CRISPR tự nhiên: 1. Phiên mã tạo ra tiền crRNA và tracrRNA 2. tracrRNA liên kết với crRNA 3. Tạo ra các RNA định hướng từ tiền crRNA 4. nuclease Cas9 đang ở trạng thái bất hoạt gắn kết với RNA định hướng để trở thành Cas9 hoạt hóa. CRISPR nhân tạo: 1. Phiên mã nên RNA định hướng thành một sợi duy nhất 2. Phiên mã và dịch mã tạo nên nuclease Cas9 3. RNA định hướng gắn với Cas9 và hoạt hóa Cas9. Nguồn: https://sites.tufts.edu/crispr/genome-editing/ |
Điểm đứt
gãy sợi kép trên DNA có thể được sửa chữa theo hai hướng: non-homologous
end-joining (NHEJ – nối đầu cuối không tương đồng) hoặc homology-directed
repair (HDR – sửa chữa dựa theo sự tương đồng).
NHEJ thường
dẫn tới các đột biến chèn hoặc xóa đoạn nhỏ, khiến cho gene mục tiêu bị bất hoạt.
Có thể xóa một đoạn gene tương đối lớn nếu dùng hai crRNA, và có thể tạo ra sự
chuyển vị hoặc đảo ngược nhiễm sắc thể nếu dùng crRNA định hướng tới hai nhiễm
sắc thể khác nhau.
Nếu có một
đoạn DNA mẫu (template DNA, hay donor DNA) tương đồng với vị trí mục tiêu thì DSB
này có thể được sửa chữa bằng cơ chế HDR. Phần DNA ở quanh vị trí đứt gãy sẽ được
thay thế bằng phần DNA tương ứng ở DNA mẫu. Nếu một đột biến được chủ ý đưa vào
DNA mẫu thì đoạn DNA sau khi sửa chữa sẽ mang đột biến đó (Hình 8.A).
Nhưng ngay
cả khi có DNA mẫu thì nhiều khả năng là không chỉ cơ chế HDR, mà cả NHEJ, cùng
xảy ra, dẫn tới hiện tượng chèn/xóa đoạn không mong muốn. Một biến thể của Cas9
là Cas9D10A giúp hạn chế điều này. Cas9D10A chỉ có khả năng cắt DNA ở một sợi
(chứ không phải ở cả hai sợi như Cas9 thông thường), do đó không kích hoạt cơ
chế NHEJ. Khi có mặt DNA mẫu thì việc sửa chữa DNA chỉ được tiến hành theo cơ
chế HDR mà thôi. Việc sử dụng nhiều hơn một phức hợp Cas9D10A để tạo nên các vị
trí đứt gãy sợi đơn (nick) cạnh nhau giúp tăng đáng kể sự đặc hiệu mục tiêu
(Hình 8.B).
Một biến
thể khác nữa của Cas9 là nuclease-deficient Cas9 (dCas9, không có khả năng cắt
DNA). Các đột biến xảy ra với HNH và RuvC domain bất hoạt khả năng cắt DNA,
nhưng vẫn giữ lại khả năng liên kết với DNA. Một ứng dụng của biến thể này là
biến dCas9 thành công cụ hoạt hóa hoặc ức chế phiên mã khi dung hợp dCas9 với
các domain tác động (hoạt hóa hoặc ức chế). Ngoài ra, có thể lợi dụng khả năng
bắt cặp đặc hiệu trình tự của dCas9 với DNA để hiển thị trình tự DNA mong muốn
trên genome bằng cách dung hợp dCas9 với protein huỳnh quang (Hình 8.C).
Hình 8. Chỉnh sửa hệ gene bằng hệ thống CRISPR-Cas9. |
Tài liệu
tham khảo:
0 comments:
Post a Comment