Lắp ráp de novo hệ phiên mã Themira biloba (Sepsidae: Diptera) sử dụng k-mer có độ dài khác nhau

A pipeline for the de novo assembly of the Themira biloba (Sepsidae: Diptera) transcriptome using a multiple k-mer length approach

Melicher D1, Torson AS, Dworkin I, Bowsher JH.

Bối cảnh: Họ ruồi Sepsidae là hình mẫu lý tưởng để nghiên cứu chọn lọc giới tính cũng như hiện tượng lưỡng tính. Tuy nhiên, những nguồn dữ liệu về sinh học phân tử của họ sepsid cũng rất ít và chưa chi tiết. Giải trình tự và lắp ráp toàn bộ hệ gen chưa được thực hiện ở bất kỳ loài nào trong họ sepsid, từ đó cũng gây ra những khó khăn cả trong phân tích biểu hiện gen. Mục tiêu của nghiên cứu là xây dựng một quy trình tự động lắp ráp de novo hệ phiên mã, và sử dụng quy trình đó để lắp ráp và phân tích hệ phiên mã của loài Themira biloba thuộc họ sepsid

 

Kết quả: Các nhà khoa học sử dụng máy giải trình tự 454 tạo ra 1.48 triệu trình tự đọc từ dữ liệu cDNA của phôi, ấu trùng và nhộng của T.biloba và lắp ráp tạo nên 24,496 contigs. Chú giải xác định được 16.705 transcripts, bao gồm rất nhiều transcripts xuất hiện trong quá trình phát sinh phôi và hình thành chi. Bên cạnh đó, quy trình cũng sử dụng dữ liệu giải trình tự từ hệ phiên mã của 3 loài khác đã được công bố để đối chiếu chất lượng lắp ráp việc sử dụng các độ dài k-mer khác nhau ở các loài khác nhau.

 

Kết luận: Quy trình lắp ráp đề ra đã làm tăng độ dài contig, phục hồi được những transcript đặc biệt và lắp ráp được nhiều nucleotide hơn các quy trình lắp ráp khác. Hệ phiên mã của T.biloba sẽ là một nguồn dữ liệu quan trọng cho phân tích biểu hiện gen, và là hệ phiên mã đầu tiên được xây dựng của họ Sepsidae thuộc bộ Diptera.

Quy trình lắp ráp và phân tích

 

Keywords: Multiple k-mer, de novo assembly, Sepsidae, Transcriptome, Pipeline, Cloud computing

 

Link:http://www.ncbi.nlm.nih.gov/pubmed/24621177

Trả lời

Email của bạn sẽ không được hiển thị công khai.