Đánh giá hiệu năng giải trình tự khuếch đại gen 16S rRNA sử dụng dữ liệu hệ vi sinh vật đường ruột của người Nhật với các bộ mồi V1–V2 và V3–V4

Tổng quan và Đặt vấn đề

  • Phân tích trình tự gen 16S rRNA (phân tích 16S) được sử dụng rộng rãi để phân tích hệ vi sinh vật bằng công nghệ giải trình tự thế hệ mới (NGS). Tuy nhiên, vẫn chưa có một phương pháp chuẩn vàng nào được thiết lập, và việc lựa chọn vùng biến đổi của gen 16S rRNA để nhắm mục tiêu là một vấn đề gây tranh cãi. Các vùng V1–V2 (V12) và V3–V4 (V34) là hai vùng được sử dụng phổ biến trong các nghiên cứu về hệ vi sinh vật đường ruột. Một số nghiên cứu trước đây đã đưa ra các kết luận khác nhau về việc vùng nào phù hợp hơn. Chẳng hạn, một nghiên cứu cho rằng V34 phù hợp hơn V12 vì khả năng phát hiện Bifidobacteriales cao hơn. Tuy nhiên, đã có một phiên bản mồi xuôi V1 mới (27Fmod) được phát triển để cải thiện đáng kể khả năng phát hiện Bifidobacterium so với mồi cũ.
  • Nghiên cứu này nhằm mục đích đánh giá và so sánh dữ liệu phân tích 16S từ mẫu phân của 192 người tình nguyện khỏe mạnh Nhật Bản sử dụng bộ mồi V12 được chỉnh sửa (sử dụng 27Fmod) và bộ mồi V34 tiêu chuẩn. Ngoài ra, nghiên cứu cũng so sánh kết quả giữa hai phiên bản của công cụ phân tích bioinformatics QIIME (QIIME1 và QIIME2). Mục tiêu là để tối ưu hóa quy trình phân tích hệ vi sinh vật đường ruột, đặc biệt là đối với quần thể người Nhật Bản.

Mô hình

Nghiên cứu này sử dụng 192 mẫu phân từ người tình nguyện khỏe mạnh Nhật Bản. Các mẫu được thu thập và DNA được chiết xuất bằng bộ DNeasy PowerSoil Kit.
Thư viện giải trình tự được chuẩn bị bằng cách khuếch đại vùng V12 (sử dụng mồi xuôi 16S_27Fmod và mồi ngược 16S_338R) và vùng V34 (sử dụng mồi xuôi 16S_341F và mồi ngược 16S_805R). Giải trình tự được thực hiện trên nền tảng Illumina MiSeq, với độ dài đọc 250 bp cho V12 và 300 bp cho V34. Số lượng đọc trung bình cho V12 là 44,442 và V34 là 47,220. Chất lượng đọc trung bình của cả hai vùng đều đạt trên Q30.
Dữ liệu giải trình tự thô được phân tích bằng hai quy trình bioinformatics: QIIME1 (qI)QIIME2 (qII).
  • QIIME1 (v1.8.0): Đọc ghép nối được gom nhóm theo độ tương đồng 97% thành các Đơn vị phân loại vận hành (OTU). Thông tin phân loại được gán sử dụng cơ sở dữ liệu Greengenes (v13.8) và trình phân loại RDP.
  • QIIME2 (v2020.2): Sử dụng DADA2 để ghép nối đọc, lọc và khử nhiễu, tạo ra các Biến thể trình tự Amplicons (ASV). Thông tin phân loại được gán sử dụng trình phân loại naive Bayes trong QIIME2 với dữ liệu vùng V2 (cho V12) và V34 (cho V34) từ Greengenes.
Các phân tích vi sinh vật bao gồm:
  • Đa dạng Alpha: Được đánh giá ở độ sâu 30,000 đọc sử dụng bảng OTU/ASV.
  • Đa dạng Beta: Sự khác biệt giữa các cộng đồng V12 và V34 được tính bằng độ phân ly Bray-Curtis và đánh giá bằng phép phân tích phương sai đa biến hoán vị (PERMANOVA).
  • Thành phần vi khuẩn: So sánh thành phần tương đối ở cấp độ ngành và chi giữa V12 và V34.
  • PCR định lượng thời gian thực (qPCR): Được thực hiện để ước tính độ phong phú thực tế của các chi Akkermansia, Bifidobacterium, Bacteroides và Faecalibacterium. Primer được sử dụng nhắm vào gen rplL (đối với Akkermansia trong phân tích mock community ban đầu, nhưng trong qPCR cho mẫu phân người thì nhắm vào 16S rRNA) và các gen 16S rRNA khác. Dữ liệu được chuẩn hóa bằng cách trừ giá trị ngưỡng chu kỳ (Ct) của 16S rRNA tổng từ giá trị Ct của vi khuẩn mục tiêu.

Ứng dụng

Bài báo tập trung vào việc đánh giá và chuẩn hóa phương pháp phân tích 16S rRNA để có thể đánh giá chính xác thành phần vi khuẩn đường ruột. Kết quả của nghiên cứu này có ứng dụng trực tiếp trong việc lựa chọn bộ mồi và quy trình phân tích bioinformatics phù hợp hơn cho các nghiên cứu hệ vi sinh vật đường ruột ở người Nhật Bản. Bằng cách so sánh dữ liệu từ V12 (với mồi 27Fmod đã được cải tiến) và V34 với dữ liệu qPCR được xem là gần với độ phong phú thực tế, nghiên cứu cung cấp bằng chứng để khuyến nghị bộ mồi hiệu quả hơn. Cụ thể, việc xác định rằng V12 (27Fmod) cho kết quả phát hiện Akkermansia gần hơn với qPCR và V34 ước tính quá cao chi này có ý nghĩa quan trọng cho các nghiên cứu liên quan đến Akkermansia như chỉ số sức khỏe. Tương tự, mặc dù cả V12 và V34 đều ước tính hơi thấp Bifidobacterium so với qPCR, nghiên cứu này xác nhận mồi 27Fmod cải thiện đáng kể khả năng phát hiện Bifidobacterium so với các mồi V12 trước đây.

 

Thảo luận và Hạn chế

Trong phần thảo luận, các tác giả so sánh chi tiết kết quả từ V12 và V34 qua các bước phân tích. Họ nhận thấy rằng số lượng đọc có thể phân tích được sau tiền xử lý thấp hơn ở dữ liệu V34 so với V12. Phân tích bằng cả QIIME1 và QIIME2 đều cho thấy số lượng trình tự đại diện chưa được phân loại (unclassified) cao hơn đáng kể ở dữ liệu V34. Tuy nhiên, việc sử dụng QIIME2 (với DADA2) làm giảm đáng kể số lượng ASV chưa được phân loại so với OTU chưa được phân loại của QIIME1. Ngoài ra, nhiều trình tự đại diện OTU bị loại bỏ bởi DADA2, và tỷ lệ trình tự bị loại bỏ này cao hơn ở V34 (94.3%) so với V12 (87.9%).
  • Sự đa dạng beta giữa các cộng đồng V12 và V34 được xác định là khác biệt đáng kể về mặt thống kê, mặc dù mức độ khác biệt là nhỏ. Ở cấp độ ngành, Actinobacteria và Verrucomicrobia được phát hiện ở mức cao hơn với V34 so với V12. Đặc biệt, ở cấp độ chi, Bifidobacterium (thuộc Actinobacteria) và Akkermansia (thuộc Verrucomicrobia) có thành phần tương đối cao hơn với V34.
  • Khi so sánh với kết quả qPCR, độ phong phú của Akkermansia được phát hiện bằng qPCR gần với dữ liệu V12, nhưng lại thấp hơn đáng kể so với dữ liệu V34. Điều này chỉ ra rằng phân tích 16S sử dụng bộ mồi V34 có xu hướng ước tính quá cao Akkermansia. Một khả năng giải thích cho sự khác biệt này là sự tương đồng cao ở vùng V34 giữa Akkermansia và một số vi khuẩn khác (ví dụ: Cronobacter), nhưng lại có sự khác biệt lớn ở vùng V12. Trình tự V34 của Cronobacter cho thấy độ tương đồng 99.32% với Akkermansia, trong khi V12 tương ứng chỉ là 71.43%. Đối với Bifidobacterium, qPCR phát hiện độ phong phú cao hơn cả dữ liệu V12 và V34. Cả hai bộ mồi 16S đều dường như ước tính hơi thấp chi này so với qPCR. Tuy nhiên, mồi V12 27Fmod đã cải thiện đáng kể khả năng phát hiện Bifidobacterium (trung bình 2.1%) so với các mồi V12 tiêu chuẩn trước đây (0.03%), mặc dù V34 vẫn cho thành phần tương đối trung bình cao hơn (3.3%). Đối với Bacteroides và Faecalibacterium (đối chứng), kết quả 16S (V12 và V34) và qPCR cho thấy xu hướng tương tự.
Hạn chế chính của nghiên cứu là chỉ sử dụng mẫu phân từ người Nhật Bản. Thành phần hệ vi sinh vật đường ruột có thể khác nhau tùy thuộc vào quốc gia và dân tộc. Do đó, kết quả này có thể không hoàn toàn tổng quát cho các quần thể khác. Các tác giả đề xuất cần có thêm các nghiên cứu so sánh sử dụng cộng đồng mock với thành phần đã biết hoặc mẫu phân từ nhiều nguồn gốc khác nhau để có cái nhìn đầy đủ hơn.

Kết luận

Dựa trên kết quả nghiên cứu, các tác giả kết luận rằng dữ liệu về thành phần vi khuẩn thu được từ vùng V34 có thể khác với độ phong phú thực tế, đặc biệt là đối với chi Akkermansia. Dữ liệu V34 cũng chứa nhiều trình tự chưa được phân loại và bị loại bỏ hơn so với V12. Những phát hiện này cho thấy việc sử dụng bộ mồi V12 được chỉnh sửa (27Fmod) là đáng mong muốn hơn trong phân tích 16S hệ vi sinh vật đường ruột của người Nhật Bản.
Tài liệu tham khảo: https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-021-07746-4

LOBI Vietnam là công ty tiên phong trong lĩnh vực Đọc trình tự gen thế hệ mới NGS (Next Generation Sequencing) và Phân tích Tin sinh học. Liên hệ hotline/Zalo 092.510.8899 để biết thêm chi tiết.

ĐỌC THÊM:  Tin sinh học và vai trò của nó trong nghiên cứu sự tiến hóa và tiềm năng probiotic của vi khuẩn lactic
ĐỌC THÊM:  Corset: Phương pháp phân tích biểu hiện gene với denovo-assembled transcriptomes

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *