PLINK: công cụ phân tích GWAS

GWAS là gì?

  • GWAS viết tắt của cụm từ Genome-Wide Association Studies, nghĩa là Nghiên cứu tương quan trên toàn bộ hệ gen.
  • Trong di truyền học, GWAS là nghiên cứu các biến đổi di truyền trên toàn hệ gen trong các cá thể khác biệt để tìm kiếm các biến đổi đi truyền có tương quan tới một tính trạng nào đó. Các GWAS thường tập trung vào các mối tương quan giữ các SNP với các tính trạng như là các bệnh di truyền chính ở người, nhưng nó có thể áp dụng cho tất cả các loài khác. (https://en.wikipedia.org/wiki/Genome-wide_association_study)

GWAS cơ bản hoạt động thế nào?

GWAS phát hiện các SNP và các biến dị di truyền trong hệ gen có tương quan tới một bệnh nào đó. Để làm được điều đó, các nghiên cứu GWAS xác định các alen của biến dị di truyền xuất hiện nhiều bất thường trong các cá thể bị bệnh di truyền hoặc có tính trạng đang quan tâm.

gwas(Nguồn: www.mpg.de)

Các nghiên cứu GWAS thường được thiết kế bao gồm 02 nhóm đối tượng: bị bệnh (case) và không bị bệnh (control). Số lượng của mỗi nhóm thường là lớn, rất lớn. Tất cả các cá thể trong mỗi nhóm đều được xác định kiểu gen (genotyping) với tập các SNP chính đã biết. Số lượng các SNP phụ thuộc vào công nghệ xác định kiểu gen cụ thể, nhưng thường là trên một triệu SNP. Với mỗi SNP, người ta xác định xem tần suất alen của SNP đó có sự khác biệt lớn giữa 2 nhóm case và control hay không. Để xác định mức độ ảnh hưởng, người ta xác định tỉ số odds ratio. Odds ratio là tỉ số giữa 2 odds (hiểu nôm na là khả năng), khả năng bị bệnh của cá thể có mang alen và khả năng bị bệnh của cá thể không mang cùng alen đó. Nếu tần số alen trong nhóm bị bệnh cao hơn nhiều tần số alen trong nhóm không bị bệnh thì Odds ration lớn hơn 1 và ngược lại. Ngoài ra, giá trị P-value của odds ratio thường được tính bằng phương pháp kiểm thử chi-squared. Xác định tỉ lệ odds ratio mà lớn hơn hẳn 1 là mục tiêu của GWAS bởi vì nó chỉ ra sự tương quan giữa SNP với bệnh.

PLINK: Công cụ phân tích GWAS được sử dụng phổ biến

PLINK là công cụ mã nguồn mở được phát triển bởi Shaun Purcell và cộng sự, Đại học Harvard. PLINK cung cấp nhiều tính năng quan trọng như:

  • Quản lý dữ liệu
  • Thống kê cơ bản
  • Tính mất cân bằng liên kết LD (Linkage disequilibrium) 
  • Tính ma trận IBD (Indentity by descent) và ma trận IBS (Indentity by Sate)
  • Phân lớp quần thể
  • Phân tích tương quan GWAS cho cả mô hình case/control và tính trạng số lượng (quantitative traits).

Bên cạnh phiên bản chạy trên cửa sổ dòng lệnh, phiên bản gPLINK có giao diện đồ họa GUI được phát triển trên nền tảng Java giúp cho người mới bắt đầu tiếp cận PLINK dễ dàng hơn. 

Tài liệu hướng dẫn sử dụng rất chi tiết bao gồm dữ liệu mẫu dành cho PLINK (Tutorial) và gPLINK (Docs). 

Trả lời

Email của bạn sẽ không được hiển thị công khai.