Lựa Chọn Thư Viện Tham Chiếu Cho Phân Tích 16S: SILVA Thay Vì Greengene

Phân tích 16S rRNA là kỹ thuật phổ biến được sử dụng để nghiên cứu quần xã vi sinh vật. Kỹ thuật này dựa trên việc giải trình tự gen 16S rRNA, một gen phổ biến ở vi khuẩn và chứa các vùng biến đổi cao (hypervariable regions) cho phép phân biệt các loài khác nhau. Một trong những bước quan trọng trong phân tích 16S là so sánh các trình tự thu được với một thư viện tham chiếu để xác định loài.
Hai thư viện tham chiếu phổ biến nhất là GreengenesSILVA. Nghiên cứu của Odom và cộng sự đã so sánh hiệu suất của các thư viện này trong phân tích 16S và khuyến nghị sử dụng SILVA thay vì Greengenes cho các phân tích trong tương lai.
Tại sao nên chọn SILVA?
Cập nhật thường xuyên: SILVA được cập nhật thường xuyên, đảm bảo cơ sở dữ liệu luôn đầy đủ và phản ánh sự phát triển của kiến thức phân loại. Ngược lại, Greengenes đã không được cập nhật kể từ năm 2013 (trừ phiên bản Greengenes2 năm 2022).
Bao phủ phân loại rộng hơn: SILVA có kích thước lớn hơn Greengenes, chứa nhiều trình tự 16S rRNA hơn, cho phép nhận diện loài chính xác hơn, đặc biệt là ở cấp độ loài.
Độ chính xác cao hơn: Các nghiên cứu đánh giá độc lập cho thấy SILVA cho kết quả phân loại chính xác hơn Greengenes. Trong nghiên cứu của Odom và cộng sự, SILVA cho kết quả nhạy hơn (sensitivity) đáng kể so với Greengenes ở cả cấp độ chi và loài. Đặc biệt, khi sử dụng PathoScope với thư viện SILVA, độ nhạy ở cấp độ loài đạt 0.86, cao hơn nhiều so với các phương pháp khác.
Được hỗ trợ rộng rãi: SILVA là thư viện tham chiếu mặc định cho Mothur và được DADA2 hỗ trợ. Kraken 2 cũng cung cấp phiên bản tương thích với SILVA.
Hạn chế của Greengenes:
Thiếu các loài quan trọng: Do thiếu cập nhật, Greengenes thiếu nhiều loài vi khuẩn quan trọng, chẳng hạn như Dolosigranulum, một loài có vai trò bảo vệ trong đường hô hấp người.
Độ chính xác thấp: Nghiên cứu của Odom và cộng sự cho thấy Greengenes cho kết quả kém chính xác hơn hẳn so với SILVA, đặc biệt là ở cấp độ loài. Khi sử dụng Greengenes, độ nhạy ở cấp độ loài chỉ đạt 0.16-0.28, thấp hơn đáng kể so với các phương pháp sử dụng SILVA. Thậm chí, khi kết hợp Kraken 2 với Greengenes, sai số trong ước tính chỉ số đa dạng alpha cao hơn đáng kể so với các phương pháp khác.
Kết luận:
SILVA là một thư viện tham chiếu 16S rRNA toàn diện, cập nhật thường xuyên và chính xác hơn so với Greengenes, khiến nó trở thành lựa chọn tốt hơn cho các phân tích 16S trong tương lai. Mặc dù phiên bản Greengenes2 đã được ra mắt, nhưng cần thêm nhiều nghiên cứu đánh giá hiệu suất của phiên bản này so với SILVA trước khi đưa ra khuyến nghị chính thức.
Nguồn: https://pubmed.ncbi.nlm.nih.gov/37633998/
Người tổng hợp: Vương Hương

LOBI Vietnam là công ty tiên phong trong lĩnh vực Đọc trình tự gen thế hệ mới NGS (Next Generation Sequencing) và Phân tích Tin sinh học. Liên hệ hotline/Zalo 092.510.8899 để biết thêm chi tiết.

ĐỌC THÊM:  Dự án 100,000 genome
ĐỌC THÊM:  BIC23: Khóa học Phân tích Metagenomics: 16S và Shotgun

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *