Cải thiện khả năng dự đoán gen trên hệ gen chuột bằng cách kết hợp EST với thông tin trình tự RNA

Tác giả: Li L1, Chen E2, Yang C3, Zhu J4, Jayaraman P5, De Pons J5, Kaczorowski CC3, Jacob HJ6, Greene A3, Hodges MR3, Cowley AW Jr3, Liang M3, Xu H7, Liu P8, Lu Y9.

RNAseq (còn gọi là trình tự transcriptome) là một công nghệ đang phát triển sử dụng ưu thế của kỹ thuật giải trình tự thế hệ mới để phát hiện và định lượng toàn bộ sản phẩm phiên mã (transcript). Một trong những ứng dụng quan trọng của nó là góp phần cải thiện các chú thích hệ gen hiện có. RNAseq cung cấp một công cụ nhanh chóng, toàn diện và chi phí thấp cho việc phát hiện ra gen mới và sản phẩm phiên mã so với các EST, là công cụ phát hiện gen và xác định trình tự gen. Trong nghiên cứu này, chúng tôi kết hợp dữ liệu RNAseq từ ba loại bao gồm tủy xương, não, thận với dữ liệu EST để cải thiện các chú thích bộ gen của chuột. Phân tích của chúng tôi xác định tổng số 32.197 transcript bao gồm 13.461 transcript đã biết, 13.934 isoform mới 4.802 gen mới, tăng gần gấp đôi số lượng các transcript so với cơ sở dữ liệu gen của chuột hiện nay (rn5). So sánh đoạn gen mã hóa protein được chúng tôi dự đoán với những đoạn tương tự trong cơ sở dữ liệu cho thấy RNA-seq cải thiện đáng kể kết quả chú thích gen, phát hiện gen mới, phát hiện isoform mới ở chuột. Quan trọng hơn, phần lớn các gen và isoform mới được chứng minh bởi bằng chứng trực tiếp từ các thí nghiệm RNAseq. Những gen đã được dữ đoán được tích hợp vào cơ sở dữ liệu gen chuột (Rat Genome Database) và là nguồn nguyên liệu quý giá cho các nghiên cứu tiếp theo.

Link:http://www.ncbi.nlm.nih.gov/pubmed/25217576

 

Trả lời

Email của bạn sẽ không được hiển thị công khai.