Khám phá tiềm năng của hệ vi sinh vật và AI trong nhận dạng pháp y

Khám phá tiềm năng của hệ vi sinh vật và AI trong nhận dạng pháp y

Trong thế giới khoa học pháp y, việc xác định danh tính cá nhân tại hiện trường vụ án luôn là một yếu tố then chốt. Trong nhiều thập kỷ, chúng ta đã dựa vào các phương pháp truyền thống như công nghệ vân tay DNAkỹ thuật khuếch đại hợp chất lặp lại ngắn (STR) để thực hiện nhiệm vụ quan trọng này. Tuy nhiên, các phương pháp này không phải lúc nào cũng hoàn hảo, đặc biệt khi đối mặt với các mẫu vật pháp y đã lỗi thời, bị phân hủy nghiêm trọng, nơi mà các phương pháp nhận dạng loài truyền thống thường không đủ tính khả thi và độ chính xác.
Nhưng điều gì sẽ xảy ra nếu có một “bằng chứng” khác, một bằng chứng vô hình nhưng cực kỳ mạnh mẽ, luôn hiện diện trên cơ thể và môi trường xung quanh chúng ta? Đó chính là hệ vi sinh vật con người – một cộng đồng rộng lớn gồm vi khuẩn, nấm và virus trong mỗi cá nhân. Nghiên cứu về vi sinh vật pháp y đang nổi lên như một lĩnh vực đầy hứa hẹn, định hình lại cách chúng ta tiếp cận việc nhận dạng cá nhân.

Tại sao hệ vi sinh vật lại là một công cụ pháp y tiềm năng?

Con người là vật chủ của nhiều hệ vi sinh vật khác nhau. Mỗi cá nhân dựa trên nghề nghiệp, lối sống và sự tương tác với môi trường, có thể hình thành “dấu vân tay vi sinh vật” độc đáo. Hệ vi sinh vật này, dù vô hình, nhưng góp phần đáng kể vào cấu trúc di truyền của chúng ta và mang tính cá nhân hóa cao. So với tế bào người, vi sinh vật có lợi thế là số lượng lớn hơnổn định hơn. Điều này khiến chúng trở thành ứng cử viên tốt hơn để phát hiện các bằng chứng có ý nghĩa.

16S rRNA: Marker “vàng” trong phân tích vi sinh vật

Để khai thác tiềm năng của hệ vi sinh vật, chúng ta cần một marker (chỉ dấu) đáng tin cậy. Ở đây, gen 16S rRNA nổi bật như một lựa chọn lý tưởng. Gen 16S rRNA là một tiểu đơn vị nhỏ của RNA ribosom (rRNA) vi khuẩn, có chiều dài khoảng 1.540 nucleotides và hiện diện trong ribosome của tất cả vi khuẩn. Điều làm cho 16S rRNA trở nên đặc biệt là sự kết hợp giữa các vùng “bảo tồn cao” và các vùng “siêu biến đổi” (V1-V9). Các vùng bảo tồn giúp thiết kế các mồi khuếch đại phổ quát, trong khi các vùng siêu biến đổi chứa sự đa dạng trình tự đáng kể giữa các loài vi khuẩn khác nhau, cho phép xác định mối quan hệ di truyền và phân loại. Ví dụ, V1 có thể phân biệt Staphylococcus aureus với Staphylococcus sp. không có coagulase, V2 và V3 có thể phân biệt tất cả các loài vi khuẩn ở cấp độ chi, và V6 có thể phân biệt hầu hết các loài vi khuẩn trừ Enterobacteriaceae.

Hệ vi sinh vật và tiềm năng pháp y của chúng

Các nghiên cứu đã chỉ ra rằng sự đa dạng của hệ vi sinh vật vi khuẩn trong đất, da, nước bọt và ruột đều là những nguồn quan trọng có thể được áp dụng trong nhận dạng cá nhân pháp y.
  • Hệ vi sinh vật đất: Kiểm tra thành phần vi sinh vật của đất để xác định nguồn gốc và phân biệt các mẫu đất là các quy trình đã được thiết lập rõ ràng. Kết quả nghiên cứu cho thấy khoảng cách giữa các mẫu vật chứng và mẫu tham chiếu hiện trường vụ án gần nhau hơn so với các mẫu kiểm soát không liên quan đến hiện trường vụ án. Điều này cho thấy DNA vi khuẩn trong đất có tiềm năng cung cấp một nguồn bằng chứng hiệu quả để giải quyết các vụ án dựa vào phân tích hệ vi sinh vật trong pháp y.
  • Hệ vi sinh vật da: Đã được điều tra như một công cụ pháp y tiềm năng, đặc biệt là “hệ vi sinh vật cảm ứng” (touch microbiome) có thể được chuyển sang bề mặt, tương tự như “touch DNA”. Với việc sử dụng đa dạng nucleotide của các marker đặc trưng cho phân loại ổn định kết hợp với học có giám sát, có thể phân loại hệ vi sinh vật da từ một cá nhân cụ thể với độ chính xác lên tới 100% từ các mẫu thu được ở ba vị trí cơ thể khác nhau và có thể lưu trữ trong thời gian dài. Sáu nhóm vi sinh vật cốt lõi của da đã được xác định, cùng với các nhóm đặc trưng cho người hiến tặng, có liên quan đến việc nhận dạng cá nhân và có thể cung cấp thông tin tình báo pháp y khi “touch DNA” thất bại. Tuy nhiên, giải trình tự gen 16S rRNA hoặc giải trình tự metagenomic có độ phân giải loài và chủng hạn chế và dễ bị ảnh hưởng bởi các hiệu ứng ngẫu nhiên. Các kỹ thuật như hidSkinPlex đã được chứng minh là có độ chính xác lên tới 94% CRISPR typing thậm chí đạt độ chính xác 95.2% trong phân loại cá nhân, vượt trội so với 16S rRNA gene sequencing (52.6%) cho mục đích nhận dạng cá nhân.
  • Hệ vi sinh vật miệng (Nước bọt): Nước bọt là một chất lỏng cơ thể phổ biến với giá trị pháp y đáng kể, được sử dụng trong các cuộc điều tra hình sự: Các nghiên cứu đã chỉ ra rằng có thể phân biệt giữa hai người bằng cách sử dụng hệ vi khuẩn có trong nước bọt của họ, bất kể thời điểm lấy mẫu. Kết hợp hai gen (16S rRNA và rpoB) đã tăng cường khả năng phân biệt trong hệ vi sinh vật nước bọt. Kết hợp với mô hình dự đoán dựa trên thuật toán Random Forest có thể phân biệt nước bọt giữa các khu vực khác nhau ở cấp độ chi. Cuối cùng, sự tương đồng trong hệ vi sinh vật miệng giữa cha mẹ và con cái giảm dần theo thời gian, nhưng vẫn hữu ích cho các nghiên cứu về mối quan hệ nhiều thế hệ. 
  • Hệ vi sinh vật đường ruột (Dấu vết phân): Hệ vi sinh đường ruột của con người là duy nhất cho mỗi cá nhân. Do đó, các vi khuẩn trong các dấu vết phân để lại tại hiện trường vụ án có thể đóng vai trò là một biomarker tiềm năng cho nhận dạng cá nhân pháp y: Đàn ông được đặc trưng bởi các nhóm trong ngành Proteobacteria, trong khi phụ nữ là ngành Synergistetes. Các cá nhân có đặc điểm vi sinh khác nhau trong đường ruột cụ thể có thể được phân biệt bằng các phương pháp tin sinh học. 
ĐỌC THÊM:  Sách hay: Tin Sinh Học của PGS. TS. Nguyễn Văn Cách

Sức mạnh tổng hợp: 16S rRNA và Học máy (Machine Learning)

Dù giải trình tự gen 16S rRNA tạo ra các tập dữ liệu đa chiều khổng lồ, rất khó để phân tích và diễn giải bằng tay. Đây chính là lúc học máy (Machine Learning – ML) phát huy tác dụng. Trong học máy, máy tính được cung cấp một tập dữ liệu và các kết quả liên quan, sau đó “học” để tạo ra một thuật toán mô tả mối quan hệ giữa chúng. Điều này cho phép trích xuất thông tin có ý nghĩa từ các tập dữ liệu lớn. Các phương pháp học máy đóng vai trò quan trọng trong khoa học pháp y bao gồm:
  • Random Forest: Một phương pháp học máy được sử dụng rộng rãi với hiệu suất tốt trong các nhiệm vụ phân loại và hồi quy, hoạt động tốt trong các tình huống kích thước mẫu nhỏ. Nó đã được sử dụng để đánh giá khả năng dự đoán sự kế thừa của vi sinh vật trong các loại đất khác nhau và để xác định các biomarker vi sinh vật cốt lõi trong các phần cơ thể người.
  • Support Vector Machines – SVM: Một phương pháp học có giám sát có thể chuyển đổi vấn đề ban đầu thành một vấn đề có thể giải được tuyến tính. Kết hợp SVM với các ước tính chỉ số cố định của Wright đã cải thiện đáng kể việc nhận dạng con người bằng cách lập hồ sơ hệ vi sinh vật da, đạt độ chính xác lên tới 94.77%.
  • Hồi quy tuyến tính và hồi quy logistic: Các phương pháp thống kê được sử dụng rộng rãi để đánh giá mối liên hệ giữa các biến trong nghiên cứu y học và có thể được sử dụng trong pháp y.
Sự kết hợp giữa 16S rRNA và học máy cho phép đạt được những hiểu biết sâu sắc về phân tích thông tin vi sinh vật, mở ra một phương pháp khoa học và công nghệ mới cho các cuộc khảo sát nhận dạng cá nhân vi sinh vật pháp y.

Những thách thức và hướng đi tương lai

Mặc dù giải trình tự gen 16S rRNA có tiềm năng lớn trong việc nhận dạng cá nhân trong vi sinh vật học pháp y, nhưng vẫn còn những hạn chế và thách thức cần được giải quyết:
  • Giới hạn phạm vi: 16S rRNA chỉ phân tích cấu trúc của cộng đồng vi khuẩn, trong khi metagenomics tập trung vào toàn bộ cộng đồng vi sinh vật, bao gồm vi khuẩn, nấm và archaea.
  • Dữ liệu chưa đủ: Hiện tại, chưa có đủ dữ liệu để thiết lập tính ứng dụng và độ chính xác phổ quát của phương pháp này cho nhận dạng cá nhân và suy luận.
  • Đa dạng và phức tạp: Sự đa dạng của các loại vi sinh vật, sự phức tạp của các tương tác giữa các cộng đồng vi sinh vật và sự khác biệt trong phân bố của chúng giữa các cá thể và môi trường là những hạn chế tiềm tàng.
Lĩnh vực nhận dạng cá nhân trong vi sinh vật học pháp y vẫn đang ở giai đoạn đầu phát triển. Để trở thành một quy trình được chấp nhận rộng rãi, cần phải giải quyết các vấn đề như:
  • Thiết lập một hệ thống xét nghiệm vi sinh vật học pháp y cho nhận dạng cá nhân.
  • Tiêu chuẩn hóa việc tinh chế, thu thập và bảo quản bằng chứng.
  • Hoàn thiện quy trình nhận dạng và phân tích bằng chứng.
  • Ứng dụng hiệu quả hơn thông tin thu được từ công nghệ AI.

Kết luận

Tóm lại, giải trình tự gen 16S rRNA đang được sử dụng rộng rãi trong nhận dạng vi sinh vật pháp y cá nhân. Với khả năng cung cấp thông tin nhanh chóng, chính xác và có giá trị về nhận dạng cá nhân với chi phí thấp hơn so với giải trình tự metagenomic. Trí tuệ nhân tạo (AI), đặc biệt là thông qua học máy, có thể giúp các chuyên gia giám định pháp y trích xuất các mẫu hình toàn diện và thông tin hữu ích từ các dữ liệu khổng lồ và phức tạp, tối đa hóa giá trị của các dữ liệu này. Mặc dù còn nhiều thách thức về đạo đức, lựa chọn thuật toán và nền tảng, không nghi ngờ gì rằng học máy sẽ là một công cụ quan trọng cho những tiến bộ trong lĩnh vực nghiên cứu pháp y.
Trong tương lai gần, chúng ta hy vọng sẽ mở rộng việc thu thập mẫu từ cơ thể người và tiến hành nghiên cứu sâu hơn bằng cách sử dụng các thuật toán học máy để áp dụng vào thực tiễn pháp y. Công nghệ dựa trên AI và công nghệ thông tin tự động hứa hẹn sẽ mang lại một phương pháp thuận tiện, chính xác và lặp lại được cho khoa học pháp y, biến nhận dạng vi sinh vật thành một động lực mới trong sự phát triển của ngành này.

LOBI Vietnam là công ty tiên phong trong lĩnh vực Đọc trình tự gen thế hệ mới NGS (Next Generation Sequencing) và Phân tích Tin sinh học. Liên hệ hotline/Zalo 092.510.8899 để biết thêm chi tiết.

ĐỌC THÊM:  Metagenomics: Chọn V1V2 hay V3V4?

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *