Cải thiện khả năng dự đoán gen trên hệ gen chuột bằng cách kết hợp EST với thông tin trình tự RNA

Tác giả: Li L1, Chen E2, Yang C3, Zhu J4, Jayaraman P5, De Pons J5, Kaczorowski CC3, Jacob HJ6, Greene A3, Hodges MR3, Cowley AW Jr3, Liang M3, Xu H7, Liu P8, Lu Y9.

RNAseq (còn gọi là trình tự transcriptome) là một công nghệ đang phát triển sử dụng ưu thế của kỹ thuật giải trình tự thế hệ mới để phát hiện và định lượng toàn bộ sản phẩm phiên mã (transcript). Một trong những ứng dụng quan trọng của nó là góp phần cải thiện các chú thích hệ gen hiện có. RNAseq cung cấp một công cụ nhanh chóng, toàn diện và chi phí thấp cho việc phát hiện ra gen mới và sản phẩm phiên mã so với các EST, là công cụ phát hiện gen và xác định trình tự gen. Trong nghiên cứu này, chúng tôi kết hợp dữ liệu RNAseq từ ba loại bao gồm tủy xương, não, thận với dữ liệu EST để cải thiện các chú thích bộ gen của chuột. Phân tích của chúng tôi xác định tổng số 32.197 transcript bao gồm 13.461 transcript đã biết, 13.934 isoform mới 4.802 gen mới, tăng gần gấp đôi số lượng các transcript so với cơ sở dữ liệu gen của chuột hiện nay (rn5). So sánh đoạn gen mã hóa protein được chúng tôi dự đoán với những đoạn tương tự trong cơ sở dữ liệu cho thấy RNA-seq cải thiện đáng kể kết quả chú thích gen, phát hiện gen mới, phát hiện isoform mới ở chuột. Quan trọng hơn, phần lớn các gen và isoform mới được chứng minh bởi bằng chứng trực tiếp từ các thí nghiệm RNAseq. Những gen đã được dữ đoán được tích hợp vào cơ sở dữ liệu gen chuột (Rat Genome Database) và là nguồn nguyên liệu quý giá cho các nghiên cứu tiếp theo.

Link:http://www.ncbi.nlm.nih.gov/pubmed/25217576

 

LOBI Vietnam là công ty tiên phong trong lĩnh vực Đọc trình tự gen thế hệ mới NGS (Next Generation Sequencing) và Phân tích Tin sinh học. Liên hệ hotline/Zalo 092.510.8899 để biết thêm chi tiết.

ĐỌC THÊM:  Xây dựng phần mềm, cơ sở dữ liệu và website
ĐỌC THÊM:  Lắp ráp de novo hệ phiên mã Themira biloba (Sepsidae: Diptera) sử dụng k-mer có độ dài khác nhau

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *