EBI metagenomic một giải pháp cho lưu trữ và phân tích dữ liệu metagenomic

Metagenomic là lĩnh vực sử dụng công nghệ giải trình tự thế hệ mới được dùng để đánh giá đặc điểm của quần thể vi sinh vật ở các hệ sinh thái khác nhau như biển, hồ, đất, trong cơ thể người vv. Tuy nhiên ứng dụng metagenomic cũng gặp phải thách thức về quy trình phân tích, lữu trữ và chia sẻ dữ liệu. Nhằm giải quyết những vấn đề trên, European Bioinformatics Institute (EMBL-EBI) đã phát triển nguồn phân tích metagenomic mới (http://www.ebi.ac.uk/metagenomics/) cho phép người dùng có thể dễ dàng đăng tải, phân tích và lữu trữ dữ liệu của mình. Để tải dữ liệu lên EBI metagenomics người dùng có thể sử dụng nhiều công cụ khác nhau bao gồm cả trường trình có giao diện hoặc câu lệnh. Dự liệu trên tải lên EBI có thể giữ cá nhân trong 2 năm trước khi dữ liệu đó được công bố.

Tổng quan quy trình phân tích

pipeline

  • Quản lý chất lượng (Quality Control) là bước nhằm loại bỏ những trình tự có chất lượng thấp từ bộ dữ liệu
  • Dự đoán loại trình tự (Feature predection) là bước nhằm dự đoán giữa hai loại trình từ RNA sử dụng phần mềm rRNAselector và DNA sử dụng FragGeneScreen.
  • Phân loài (Taxomomy predection): là bước phân loài dựa trên các trình tự RNA đã dự đoán với hai database: Ribosomal Database Project và Greengenes sử dụng phần mêm QIIME v1.5.
  • Dự đoán chức năng (Function prediction): là bước dự đoán chức năng với các trình tự được dự đoán là DNA sử dụng phần mêm InterProScan 5.

Truy cập dữ liệu: Sau khi hoàn thành khai báo các thông tin về dữ liệu, thiết kế thí nghiệm, hệ thống sẽ tự động chạy tất cả quy trình theo thiết kế thí nghiệm đó. Khi nào hoàn thành hệ thống sẽ gửi lại người dùng đường đẫn đến kết quả. Dưới đây là hình ảnh minh họa kết quả.

result

 

Link NCBI: www.ncbi.nlm.nih.gov/pmc/articles/PMC3965009/

 

 

LOBI Vietnam là công ty tiên phong trong lĩnh vực Đọc trình tự gen thế hệ mới NGS (Next Generation Sequencing) và Phân tích Tin sinh học. Liên hệ hotline/Zalo 092.510.8899 để biết thêm chi tiết.

ĐỌC THÊM:  MP3 – công cụ dự đoán protein gây bệnh từ dữ liệu genomic và metagenomic
ĐỌC THÊM:  Tích hợp giải trình tự toàn bộ hệ gen và học máy để dự đoán kháng kháng sinh ở các mầm bệnh nguy hiểm: Tổng quan hệ thống kiểm tra độ nhạy kháng sinh

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *