Giải trình tự Exome (WES) - Công cụ hữu ích trong di truyền y học

Giới thiệu về Giải trình tự Exome

Giải trình tự Exome (Whole exome sequencing – WES) là một kỹ thuật tập trung giải trình tự các exon, là những vùng mã hóa protein của bộ gen. Mặc dù chỉ chiếm dưới 2% toàn bộ bộ gen, exon chứa khoảng 85% các đột biến gây bệnh đã biết ở người. WES thường được sử dụng để chẩn đoán các rối loạn di truyền Mendel, là những bệnh di truyền do đột biến trong một gen duy nhất gây ra.

Quy trình phân tích dữ liệu giải trình tự Exome

Sau khi hoàn thành giải trình tự WES, dữ liệu thô thu được cần được phân tích để xác định và diễn giải các biến thể di truyền. Quy trình phân tích dữ liệu WES bao gồm các bước chính sau:

Kiểm soát chất lượng dữ liệu giải trình tự (QC): Đánh giá chất lượng dữ liệu giải trình tự thô bằng cách kiểm tra các thông số như độ bao phủ, chất lượng đọc và mức độ trùng lặp.
Gióng hàng trình tự (Alignment): Gióng hàng các đoạn đọc lên bộ gen tham chiếu bằng các công cụ gióng hàng như BWA (Burrows-Wheeler Aligner).
Loại bỏ các đoạn đọc trùng lặp (PCR duplicates removal): Loại bỏ các đoạn đọc trùng lặp phát sinh trong quá trình PCR, giúp giảm thiểu sai lệch trong quá trình gọi biến thể.
Gọi biến thể (Variant calling): Xác định các biến thể di truyền bao gồm đột biến điểm (SNVs), đột biến lệch khung (indels) và biến thể số lượng bản sao (CNVs). Bước này được thực hiện bởi công cụ gọi biến thể như GATK (Genome Analysis Toolkit), MuTect, VarScan.
Chú thích biến thể (Variant annotation): Cung cấp thông tin về vị trí, tần suất alen, tác động lên protein và ý nghĩa lâm sàng của các biến thể. Các công cụ chú thích thường được sử dụng bao gồm VEP (Variant Effect Predictor), ANNOVAR, SnpEff, vcfanno.
Lọc biến thể (Variant filtering): Lọc bỏ các biến thể không đạt chất lượng hoặc không liên quan đến mục tiêu nghiên cứu, chẳng hạn như các biến thể phổ biến trong quần thể, các biến thể nằm trong vùng không mã hóa protein hoặc các biến thể được dự đoán là lành tính (benign).
Diễn giải biến thể (Variant interpretation): Đánh giá ý nghĩa lâm sàng của các biến thể dựa trên các bằng chứng từ các nguồn khác nhau, bao gồm dữ liệu lâm sàng, gia đình, tài liệu khoa học và cơ sở dữ liệu biến thể. Các biến thể có thể được diễn giải dựa trên các thuật toán dự đoán in silico (như SIFT, PolyPhen-2, CADD) và cơ sở dữ liệu biến thể (như ClinVar, dbNSFP, OMIM).
Xác nhận biến thể (Variant validation): Các biến thể có tiềm năng gây bệnh (pathogenic) thường được xác nhận bằng các phương pháp độc lập như giải trình tự Sanger.

Ưu điểm của Giải trình tự Exome

Giải trình tự Exome (WES) mang lại nhiều ưu điểm nổi bật, khiến nó trở thành một công cụ đắc lực trong nghiên cứu di truyền và y học. Một số ưu điểm của WES bao gồm:

Hiệu quả về chi phí: WES chỉ tập trung giải trình tự các exon, chiếm khoảng 1-2% bộ gen, giúp giảm thiểu đáng kể chi phí so với giải trình tự toàn bộ bộ gen (WGS). Điều này khiến WES trở thành lựa chọn kinh tế hơn cho việc nghiên cứu vùng mã hóa protein, đặc biệt là khi nguồn lực hạn chế.
Khả năng phát hiện biến thể: Mặc dù chỉ giải trình tự một phần nhỏ bộ gen, WES vẫn có khả năng xác định được phần lớn các biến thể di truyền liên quan đến bệnh. WES có thể phát hiện nhiều loại biến thể khác nhau, bao gồm đột biến điểm (SNVs), đột biến lệch khung (indels) và biến thể số lượng bản sao (CNVs). Nhờ đó, WES đã được ứng dụng thành công trong việc chẩn đoán các rối loạn di truyền Mendel, xác định các đột biến ung thư, và nghiên cứu di truyền dân số.
Ứng dụng đa dạng: WES có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực y học, bao gồm:
- Chẩn đoán bệnh: WES được sử dụng để chẩn đoán các rối loạn di truyền Mendelian, đặc biệt là những trường hợp có biểu hiện lâm sàng phức tạp hoặc chưa rõ nguyên nhân.
- Nghiên cứu ung thư: WES giúp xác định các đột biến gây ung thư, từ đó hỗ trợ chẩn đoán, tiên lượng và lựa chọn phương pháp điều trị phù hợp.
- Y học cá thể hóa: WES cung cấp thông tin về các biến dị di truyền cá nhân, giúp dự đoán nguy cơ mắc bệnh, phản ứng với thuốc và hiệu quả điều trị.

Hạn chế của Giải trình tự Exome

Mặc dù Giải trình tự Exome (WES) là một công cụ mạnh mẽ, kỹ thuật này vẫn tồn tại một số hạn chế nhất định. WES chỉ tập trung vào vùng exon nên không thể phát hiện các biến thể nằm ở các vùng như intron, vùng điều hòa hoặc các vùng không mã hóa khác. Ngoài ra, độ bao phủ không đồng đều của các đoạn đọc trên các exon mục tiêu cũng là một hạn chế của WES. Một số vùng có thể có độ bao phủ thấp, dẫn đến việc bỏ sót các biến thể tiềm năng. Cuối cùng, việc giải thích các biến thể di truyền, đặc biệt là các biến thể hiếm gặp, có thể phức tạp và đòi hỏi kiến thức chuyên môn sâu liên quan đến lâm sàng.

Kết luận

Giải trình tự exome (WES) đã nổi lên như một công cụ đầy hứa hẹn trong nghiên cứu di truyền và y học cá thể hóa. Bằng cách tập trung vào vùng exon mã hóa protein, WES mang lại hiệu quả chi phí đáng kể so với giải trình tự toàn bộ bộ gen (WGS), đồng thời vẫn cho phép phát hiện phần lớn các biến thể gây bệnh. WES đã chứng minh được giá trị trong chẩn đoán các rối loạn Mendelian, xác định các đột biến ung thư, và hỗ trợ nghiên cứu di truyền dân số.

ĐỌC THÊM: Các dự án phân tích dữ liệu giải trình tự thế hệ mới (NGS) đã và đang triển khai

Tuy nhiên, WES cũng có những hạn chế nhất định khi không phân tích được các biến thể nằm trong vùng không mã hóa protein hay biến thể có độ phủ thấp. Hơn nữa, việc giải thích các biến thể di truyền, đặc biệt là các biến thể hiếm gặp, đòi hỏi kiến thức chuyên môn và các công cụ phân tích phức tạp.

Mặc dù vậy, WES vẫn là một công cụ mạnh mẽ, mang lại nhiều lợi ích to lớn cho nghiên cứu di truyền và y học. Những tiến bộ công nghệ trong tương lai, chẳng hạn như cải thiện độ bao phủ giải trình tự và phát triển các thuật toán dự đoán tác động của biến thể chính xác hơn, sẽ giúp khắc phục những hạn chế hiện tại của WES và mở rộng tiềm năng ứng dụng của kỹ thuật này.

Tài liệu tham khảo

Corominas, J., Smeekens, S. P., Nelen, M. R., Yntema, H. G., Kamsteeg, E.-J., Pfundt, R., & Gilissen, C. (2022). Clinical exome sequencing—Mistakes and caveats. Human Mutation, 43(8), Article 8. https://doi.org/10.1002/humu.24360
Kircher, M., Witten, D. M., Jain, P., O’Roak, B. J., Cooper, G. M., & Shendure, J. (2014). A general framework for estimating the relative pathogenicity of human genetic variants. Nature Genetics, 46(3), Article 3. https://doi.org/10.1038/ng.2892
Liu, Z.-K., Shang, Y.-K., Chen, Z.-N., & Bian, H. (2017). A three-caller pipeline for variant analysis of cancer whole-exome sequencing data. Molecular Medicine Reports, 15(5), Article 5. https://doi.org/10.3892/mmr.2017.6336
Richards, S., Aziz, N., Bale, S., Bick, D., Das, S., Gastier-Foster, J., Grody, W. W., Hegde, M., Lyon, E., Spector, E., Voelkerding, K., & Rehm, H. L. (2015). Standards and Guidelines for the Interpretation of Sequence Variants: A Joint Consensus Recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine : Official Journal of the American College of Medical Genetics, 17(5), Article 5. https://doi.org/10.1038/gim.2015.30
Seaby, E. G., Pengelly, R. J., & Ennis, S. (2016). Exome sequencing explained: A practical guide to its clinical application. Briefings in Functional Genomics, 15(5), 374–384. https://doi.org/10.1093/bfgp/elv054
Suwinski, P., Ong, C., Ling, M. H. T., Poh, Y. M., Khan, A. M., & Ong, H. S. (2019). Advancing Personalized Medicine Through the Application of Whole Exome Sequencing and Big Data Analytics. Frontiers in Genetics, 10, 49. https://doi.org/10.3389/fgene.2019.00049

LOBI Vietnam là công ty tiên phong trong lĩnh vực Đọc trình tự gen thế hệ mới NGS (Next Generation Sequencing) và Phân tích Tin sinh học. Liên hệ hotline/Zalo 092.510.8899 để biết thêm chi tiết.

ĐỌC THÊM: 16S amplicon sequencing là gì?

Blog

Giải trình tự Exome (WES) – Công cụ hữu ích trong di truyền y học

Để lại một bình luận Hủy