Giải trình tự thế hệ mới phải bị loại bỏ (phần 1)

Tôi thực sự ghét thuật ngữ “giải trình tự thế hệ mới” (next-generation sequencing -NGS). Và đây là lý do vì sao…

 

Công bố đầu tiên trên thế giới sử dụng thuật ngữ này (theo như những gì tôi tìm) là từ một bài báo trên tạp chí Drug Discovery Today Technologies của Thomas Jarvie vào năm 2005. Bài báo này có một tiêu đề rất ngắn gọn và cô đọng “Công nghệ giải trình tự thế hệ mới“, và đó chưa phải lần cuối cùng thuật ngữ này được sử dụng.

Công ty giải trình tự Illumina có lẽ là công ty nắm trong tay nhiều công nghệ mà chỉ cần nhắc đến là mọi người hiểu ngay là NGS, tuy nhiên thực ra chúng ta vẫn còn Pyrosequencing (phát triển vào khoảng năm 1996), Massively Parallel Signature Sequencing (năm 2000), ABI SOLiD sequencing (năm 2008) và Ion semiconductor sequencing (năm 2010).

Và chắc chắn chúng ta cũng đã nghe công nghệ giải trình tự một phân tử theo thời gian thực từ Pacific Biosciences. Công nghệ này được tìm ra vào năm 2004 nhưng không hề được đưa vào máy giải trình tự PacBio RS cho tới năm 2010. Một công nghệ khác cũng đang được báo chí nhắc đến rất nhiều như là bước đột phá trong giải trình tự đó là công nghệ nanospore, nhưng thực ra công nghệ này đã được phát triển từ giữa năm 1990.

Dường như chúng ta đang đánh đồng toàn bộ một giai đoạn của một công nghệ (từ lúc phát triển đến lúc phát hành công nghệ đó) với kỷ nguyên của NGS phải không nhỉ? Nếu đúng như vậy thì thực sự giải trình tự thế hệ mới hay còn gọi là NGS đã xuất hiện được gần 20 năm. Đó đâu phải là mới ?!

Một vài cá nhân đã cố gắng làm rõ hơn thuật ngữ này bằng việc giới thiệu NGS ở nhiều mức độ rối rắm hơn như thế hệ thứ hai, thế hệ thứ ba,… thậm chí là “mới của mới”. Về lý thuyết thì có vẻ hợp lý nhưng sẽ rất buồn cười nếu thế hệ thứ hai của người này thì đó lại là thế hệ thứ ba của người kia.

Các thuật ngữ khác thường được dùng thay thế cho NGS như “giải trình tự thông lượng cao” hay “giải trình tự với trình tự đọc có độ dài lớn” đều thực sự vô dụng khi sử dụng những từ ngữ mang tính tương đối như “cao” hay “lớn”. Kết quả đầu ra từ máy giải trình tự thông lượng cao thế hệ năm 2008 có lẽ chỉ còn là thông lượng “thấp” nếu so với các thế hệ máy bây giờ. Sự nhập nhằng trong khái niệm độ dài của trình tự đọc (read) là lý do vì sao NCBI phải đổi tên “Short Read Archive” thành “Sequence Read Archive“.

Cuối cùng thì tôi đưa ra ba bước để giải quyết vấn đề thuật ngữ có thể làm cộng động giải trình tự phát điên:

  1. Không sử dụng bất kỳ thuật ngữ nào như tôi đã nêu, kể cả là sử dụng lại.
  2. Hãy nêu đúng tên công nghệ giải trình tự mà lắng đọng đúng những tính chất của công nghệ này (ví dụ: sequencing-by-synthesis) hoặc có thể là theo tên công ty đã phát triển công nghệ này (Oxford Nanopore)
  3. Bạn có thể sử dụng thuật ngữ “current sequencing technologies” (giải trình tự thế hệ hiện tại) miễn là bài báo/sách/blog của bạn có ngày/tháng/năm đi kèm với nó.

Tác giả: Keith Bradnam – UC Davis Genome Center

Nguồn:http://www.acgt.me/blog/2014/3/7/next-generation-sequencing-must-die

{fcomment}

 

 

Trả lời

Email của bạn sẽ không được hiển thị công khai.