Khám phá ClinVar: Cơ sở dữ liệu về các biến thể di truyền và ý nghĩa lâm sàng ở người

Khám phá ClinVar: Cơ sở dữ liệu về các biến thể di truyền và ý nghĩa lâm sàng ở người

Giới thiệu về ClinVar

Trong kỷ nguyên của y học chính xác, việc giải mã hệ gen người và tìm hiểu ý nghĩa của các biến thể di truyền đã trở thành một nhiệm vụ then chốt. Mỗi người mang trong mình hàng triệu biến thể di truyền, sự khác biệt nhỏ về các biến thể này có thể ảnh hưởng đến sức khỏe của mỗi cá nhân. Tuy nhiên, không phải biến thể nào cũng gây bệnh và việc xác định liệu một biến thể cụ thể có liên quan đến bệnh tật hay không là một thách thức phức tạp, đòi hỏi sự hợp tác và chia sẻ thông tin rộng rãi giữa nhiều nghiên cứu trên thế giới. Đó là lý do ClinVar (Clinically relevant variation) ra đời, đóng vai trò như một kho lưu trữ công khai, miễn phí và vô giá trong biển dữ liệu di truyền người.

Vai trò của ClinVar

Được duy trì bởi Trung tâm Thông tin Công nghệ Sinh học Quốc gia (NCBI) thuộc Thư viện Y học Quốc gia và Viện Y tế Quốc gia (NIH), ClinVar (www.ncbi.nlm.nih.gov/clinvar/) là một cơ sở dữ liệu toàn cầu, thu thập và cung cấp thông tin về các biến thể di truyền ở ngườimối liên hệ của chúng với bệnh tật. Từ khi ra mắt vào năm 2013, ClinVar đã phát triển vượt bậc, hiện đang nắm giữ hơn 3 triệu biến thể được đóng góp bởi hơn 2800 tổ chức trên toàn thế giới.
Tầm quan trọng của ClinVar nằm ở khả năng tổng hợp và lưu trữ các thông tin về ý nghĩa lâm sàng của các biến thể. Các diễn giải này được cung cấp bởi nhiều nguồn khác nhau, bao gồm các phòng xét nghiệm lâm sàng, phòng thí nghiệm nghiên cứu, các cơ sở dữ liệu chuyên biệt, các hội đồng chuyên gia,... Bằng cách tập hợp các dữ liệu này lại với nhau, ClinVar giúp người dùng có thể:
  • Tìm hiểu, nghiên cứu và phân loại các biến thể mà họ chưa từng gặp trước đây.
  • Tiếp cận một nguồn dữ liệu phong phú để khám phá mối liên hệ giữa biến thể di truyền và bệnh tật.
  • Lựa chọn được thông tin đáng tin cậy và được cập nhật liên tục để hỗ trợ việc chẩn đoán, tiên lượng và điều trị bệnh nhân.
  • Nâng cao hiểu biết về các biến thể di truyền của bản thân và gia đình, từ đó đưa ra các quyết định y tế sáng suốt hơn.

Nội dung cốt lõi của ClinVar: Từ biến thể đến ý nghĩa lâm sàng

ClinVar không chỉ đơn thuần là một danh sách các biến thể mà nó cung cấp một cái nhìn toàn diện về từng biến thể, bao gồm:
  • Mô tả biến thể: Thông tin chi tiết về vị trí của biến thể trên bộ gen, loại biến thể (Đột biến điểm, chèn, xóa,..) và sử dụng nomenclatura HGVS (Human Genome Variation Society) chuẩn hóa. ClinVar liên kết các biến thể với các cơ sở dữ liệu khác như dbSNP (cho các biến thể đơn nucleotide và các biến thể nhỏ) và dbVar (cho các biến thể cấu trúc) tạo ra một mạng lưới thông tin liên kết chặt chẽ giữa các cơ sở dữ liệu với nhau.
  • Kiểu hình (Phenotype): Các tình trạng bệnh hoặc các đặc điểm lâm sàng được báo cáo liên quan đến biến thể được báo cáo dựa vào các mã định danh từ các hệ thống phân loại chuẩn như: MIM (Mendelian Inheritance in Man), MeSH (Medical Subject Headings), HPO (Human Phenotype Ontology) và MedGen để đảm bảo tính nhất quán và dễ dàng đối chiếu.
  • Diễn giải ý nghĩa lâm sàng (Interpretation): Đây là nội dung cốt lõi của ClinVar. Các tổ chức và chuyên gia cung cấp diễn giải của họ về việc liệu một biến thể có gây bệnh (Pathogenic), có khả năng gây bệnh (Likely pathogenic), không chắc chắn (Uncertain significance), có khả năng lành tính (Likely benign) hay lành tính (Benign). Đối với các bệnh di truyền Mendel, các thuật ngữ này thường dựa trên các khuyến nghị của American College of Medical Genetics and Genomics (ACMG).
  • Bằng chứng lâm sàng (Evidence): Mỗi diễn giải ý nghĩa lâm sàng được hỗ trợ bởi các bằng chứng, có thể bao gồm các nghiên cứu khoa học đã công bố, các ca lâm sàng, dữ liệu phân tích gia đình, kết quả xét nghiệm chức năng,…
  • Thông tin về người nộp dữ liệu (Submitter): ClinVar ghi nhận thông tin về các tổ chức hoặc cá nhân đã đóng góp dữ liệu, tăng cường tính minh bạch và cho phép người dùng đánh giá nguồn gốc của thông tin.

Hành trình của một biến thể trong ClinVar: Từ SCV đến RCV và VCV

Dữ liệu trong ClinVar được tổ chức theo một cấu trúc rõ ràng để dễ dàng quản lý và truy cập theo các cách sau:
  • SCV (Submission to ClinVar): Mỗi bản nộp dữ liệu riêng lẻ, bao gồm một biến thể, một hoặc nhiều kiểu hình, một diễn giải và các bằng chứng hỗ trợ từ người đóng góp, được định danh một mã số SCV duy nhất. Khi người nộp cập nhật thông tin, một phiên bản mới của SCV sẽ được tạo, giúp theo dõi lịch sử thay đổi.
  • RCV (Reference ClinVar Record): Để tổng hợp thông tin và xác định sự đồng thuận hoặc mâu thuẫn giữa các diễn giải, ClinVar tạo ra bản ghi RCV. Một RCV đại diện cho tất cả các dữ liệu SCV đã được nộp cho cùng một biến thể và kiểu hình cụ thể. ClinVar tự động tính toán một ý nghĩa lâm sàng tổng hợp cho RCV và chỉ ra nếu có sự khác biệt trong diễn giải giữa những người nộp.
  • VCV (Variation in ClinVar): Nhằm cung cấp một cái nhìn tổng quan về một biến thể duy nhất trên tất cả các bệnh đã được báo cáo, ClinVar giới thiệu bản ghi VCV. Mỗi biến thể được gán một mã số VCV tập hợp tất cả các RCV liên quan đến biến thể đó. Điều này cho phép người dùng dễ dàng xem xét toàn bộ thông tin có sẵn cho một biến thể cụ thể.
ĐỌC THÊM:  Nghiên cứu, giảng dạy sinh học ở Việt Nam: Khi đa dạng sinh học báo động suy thoái

Những bước tiến mới nhất của ClinVar: Hỗ trợ biến thể soma và hơn thế nữa

Trong những năm gần đây, ClinVar đã có những cải tiến đáng kể để đáp ứng nhu cầu ngày càng tăng của cộng đồng y học và nghiên cứu:
  • Hỗ trợ toàn diện cho phân loại biến thể soma (ung thư): Nhận thấy tầm quan trọng của các biến đổi gen trong ung thư, ClinVar đã được cập nhật để hỗ trợ việc nộp và hiển thị các phân loại đặc biệt cho biến thể soma. Giờ đây, người dùng có thể tìm thấy thông tin về khả năng gây ung thư (oncogenicity)tác động lâm sàng (clinical impact) của các biến thể được xác định trong các mẫu khối u. Các thuật ngữ phân loại này dựa trên các tiêu chuẩn đã được thiết lập bởi nhiều tổ chức uy tín trên thế giới.
  • Định dạng tệp và cải thiện giao diện người dùng: Định dạng XML của ClinVar đã được thiết kế lại để cho phép phân biệt rõ ràng giữa các nhóm phân loại biến thể khác nhau. Các tệp VCF (Variant Call Format) cũng đã được cập nhật để bao gồm thông tin chi tiết hơn về các biến thể soma. Trang web của ClinVar đã được tối ưu hóa để hiển thị rõ ràng các loại phân loại khác nhau và cải thiện trải nghiệm người dùng.
  • Thu thập dữ liệu kiểu hình phong phú: ClinVar đang nỗ lực thu thập thêm thông tin về kiểu hình chi tiết từ các nhà cung cấp dịch vụ y tế và các tổ chức đăng ký bệnh nhân. Điều này giúp liên kết chặt chẽ hơn giữa biến thể di truyền và biểu hiện lâm sàng.
  • Nâng cao khả năng tìm kiếm và truy cập dữ liệu: Các chức năng tìm kiếm của ClinVar liên tục được cải thiện, với nhiều trường và bộ lọc mới được thêm vào để cho phép người dùng tìm kiếm thông tin một cách chính xác và hiệu quả hơn.

Tài liệu tham khảo:

  1. https://pubmed.ncbi.nlm.nih.gov/39578691/
  2. https://pmc.ncbi.nlm.nih.gov/articles/PMC6943040/
  3. https://pubmed.ncbi.nlm.nih.gov/26582918/

LOBI Vietnam là công ty tiên phong trong lĩnh vực Đọc trình tự gen thế hệ mới NGS (Next Generation Sequencing) và Phân tích Tin sinh học. Liên hệ hotline/Zalo 092.510.8899 để biết thêm chi tiết.

ĐỌC THÊM:  COSMIC: Cơ sở dữ liệu về các biến thể soma và dữ liệu lâm sàng về ung thư

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *