Tiếp tục loại bài viết về cách sử dụng thuật ngữ “giải trình tự thế hệ mới” (NGS). Trong buổi sáng hôm nay, tôi xin đưa ra so sánh 2 bài báo:
- De Novo Assembly and Annotation of Salvia splendens Transcriptome Using the Illumina Platform — Ge et al. PLOS ONE
- RepARK—de novo creation of repeat libraries from whole-genome NGS reads — Koch et al. Nucleic Acids Research
Bài báo thứ nhất cho tôi biết rằng nghiên cứu của họ dựa trên một công nghệ giải trình tự cụ thể trong bài báo thứ hai đã ngầm cho tôi hiểu rằng phần mềm RepARK mà nhóm phát triển là dành cho tất cả dữ liệu NGS.
Chính vì lý do ý nghĩa bao hàm rất rộng cũng như đôi lúc không phù hợp mà việc sử dụng thuật ngữ NGS không phải lúc nào cũng giúp người đọc hiểu được ý nghĩa sâu bên trong, đặc biệt là khi tác giả bài báo dùng “trình tự đọc NGS” (NGS reads). Trình tự đọc có thể có độ dài chỉ 25-30 bp với những máy Illumina, trong khi máy giải trình tự của PacBio có trình tự đọc lớn hơn 15.000 bp.
Tôi đã dành thời gian ra để đọc cả phần Phương Pháp của bài báo và tôi nhận ra rằng họ chỉ sử dụng dữ liệu giả lập với độ dài chỉ 101 bp và dữ liệu thật từ Illumina (độ dài trung bình = 82 bp). Họ cũng chỉ ra trong phần Thảo Luận rằng “những trình tự đọc có độ dài lớn [PacBio] có thể đem lại những khám phá mới trong phát hiện de novo đoạn lặp”.
Để chắc chắc rằng nhóm nghiên cứu không dùng bất kỳ dữ liệu PacBio nào, tôi cũng xem xét thêm Tiêu Đề, Tóm Tắt, Phương Pháp cũng như lướt qua toàn bộ phần còn lại của bài báo. Dù sao đi chăng nữa, tôi cũng thừa nhận NGS hay “giải trình tự thế hệ mới” là thuật ngữ mà sử dụng khá tiện lợi và thoải mái, nhưng sẽ giúp đỡ cho những người đọc (ít nhất trong đó có tôi) nếu như ít nhất Tóm Tắt của bài báo chỉ ra công nghệ giải trình tự nào được áp dụng trong bài báo.
Tác giả: Keith Bradnam – UC Davis Genome Center
Nguồn: http://www.acgt.me/blog/2014/3/21/next-generation-sequencing-must-die-part-3-a-tale-of-two-titles
{fcomment}
LOBI Vietnam là công ty tiên phong trong lĩnh vực Đọc trình tự gen thế hệ mới NGS (Next Generation Sequencing) và Phân tích Tin sinh học. Liên hệ hotline/Zalo 092.510.8899 để biết thêm chi tiết.