Tổng hợp: Các tài nguyên tin sinh học sử dụng trong nghiên cứu SNP

SNP bioinformatics: a comprehensive review of resources

Author: Andrew D. Johnson

Giới thiệu: Những năm gần đây chứng kiến sự tăng lên theo hàm mũ của các nghiên cứu và phát hiện mới về genetic và genomic variation do ngày càng có nhiều genome được giải trình tự hoàn chỉnh, đi kèm với việc giá thành giảm nhờ những tiến bộ tương ứng trong quy mô của công nghệ giải trình tự. Song song với những phát triển này, nghiên cứu tìm ra các gene có liên quan đến các bệnh gây ra bởi yếu tố di truyền đã đạt được nhiều thành tựu, số lượng cơ sở dữ liệu bioinformatics, các công cụ thu thập, xử lý thông tin di truyền đã tăng lên cả về số lượng, kích thước và quy mô. Đa hình đơn nucleotide (SNP), một trong những loại biến dị di truyền xảy ra nhiều nhất, đã trở thành nguyên liệu cơ bản cho các nghiên cứu di truyền và các cơ sở dữ liệu.

Trong khi các loại biến dị khác như indel, microsatellites, copy number variants và epigenetic markers cũng quan trọng và có khả năng ảnh hưởng đến các bệnh di truyền, SNP là loại biến dị có thể được xác định và tìm hiểu dễ dàng nhất, do đó trở thành maker hữu dụng và được ứng dụng rộng rãi nhất trong các nghiên cứu di truyền hiện đại.

Các nhóm nghiên cứu thường gặp phải sự nhiễu trong việc lựa chọn công cụ và khó khăn trong khi làm việc với SNP do dữ liệu cũng như các cơ sở dữ liệu ngày càng lớn và phức tạp, đặc biệt là khi không có sự hỗ trợ từ geneticist hay bioinformatician. Mục tiêu chính của bài tổng hợp này là cung cấp một cái nhìn tổng quan từ các tài nguyên tin sinh học phục vụ nghiên cứu di truyền ở người, nhấn mạnh vào các tài nguyên xoay quanh SNP. Bài viết cũng giới thiệu các tài nguyên di truyền SNP cho những sinh viên quan tâm và những nhà nghiên cứu sinh học phân tử muốn thực hiện các nghiên cứu về SNP. Bằng các ví dụ thực tế, trong bài sẽ thảo luận một số yếu tố quan trọng có ảnh hưởng đến người dùng cũng như người phát triển các công cụ và cơ sở dữ liệu tin sinh học về SNP.

Mặc dù có rất nhiều nguồn tài nguyên được nêu trong bài xuất phát hoặc có liên quan từ các nghiên cứu về các loài khác, bài tổng hợp sẽ tập trung vào các ứng dụng trong nghiên cứu ở người. Các bài toán tin sinh học cơ bản về SNP, các cơ sở dữ liệu thiết yếu cùng với cách sử dụng, các cách tiếp cận, các thắc mắc về chúng, các phần mềm và công cụ có liên quan sẽ được đề cập trong bài này. Các cơ sở dữ liệu và công cụ được nhắc đến này đều có thể được truy cập và sử dụng rộng rãi.

Full article: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2789466/

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *