Phần mềm miễn phí trong tin sinh học

Phần mềm miễn phí là gì?

Khi Linus Torvalds và Richard M.Stallman phát triển nhân Linux và dự án GNU, có lẽ họ cũng không lường trước được tầm quan trọng của công việc mình làm. Hệ điều hành GNU/Linux được tạo ra năm 1992 bằng cách kết hợp hai dự án trên. Quan trọng hơn, với sự ra đời của hệ điều hành này, triết lý về sự tự do trong lĩnh vực tính toán/ tin học trở thành những quy định chủ yếu về việc sử dụng các phần mềm miễn phí.

Rất nhiều phần mềm khoa học bao gồm European Molecular Biology Open Softwave Suite (EMBOSS), Mothur và công cụ xây dựng cây phát sinh loài Bayesian (PhyloBayes) được phát triển theo những quy định trong giấy phép công cộng GNU (GNU General Public License – GNU GPL) nghĩa là mã nguồn của những công cụ này được sử dụng hoàn toàn miễn phí. Khoa học, bao gồm cả lĩnh vực nghiên cứu hệ gen đang thay đổi nhanh chóng đòi hỏi những công cụ nghiên cứu liên quan phải bắt kịp. Cộng đồng khoa học là nơi tốt nhất để biết chính xác tin sinh học cần những gì, phải làm gì. GNU GPL cho phép mọi người tự do phát triển tiếp những mã nguồn có sẵn. Điều đó các phần mềm miễn phí phát triển để thích ứng với nhu cầu của người sử dụng.

Sự bùng nổ phần mềm trả phí trong tin sinh

Hiện có một làn sóng phát triển công cụ tin sinh trả phí trong vài năm qua. Phải trả phí nghĩa là không tự do/không miễn phí. Giấy phép sử dụng của những phần mềm này thường rất đắt. Phần lớn các phòng thí nghiệm khoa học không tự chủ được kinh phí hoạt động, phải dựa vào kinh phí tài trợ từ nhiều nguồn (chính phủ, các tổ chức…) và ngày càng nhiều phòng thí nghiệm sử dụng các công cụ tin sinh học ở các mức độ khác nhau. Số tiền cần thiết để có được phần mềm trả phí do đó không được sử dụng cho mục đích chính của nghiên cứu là nâng cao kiến ​​thức khoa học.

Vậy tại sao các sản phẩm phần mềm trả phí vẫn tồn tại, và tại sao chúng vẫn thu hút người dùng? Các sản phẩm trả phí như Geneious (Biomatters Ltd., Auckland, New Zealand), CLC Genomics Workbench (CLC bio, Aarhus, Denmark) and Sequencher (Gene Codes Corporation, Ann Arbor, MI, USA) thường có giao diện thân thiện với người dùng và được tích hợp nhiều công cụ tin sinh trong cùng một sản phẩm. Hầu hết công cụ tin sinh hiện nay làm việc bằng các dòng lệnh và với rất nhiều nhà khoa học, đây là một trong những khó khăn lớn nhất. Một điểm quan trọng là các phần mềm này không đòi hỏi khả năng lập trình, chỉ cần có những kỹ năng tin học cơ bản. hơn nữa, nếu phần mềm có bất kỳ vấn đề gì, công ty cung cấp sản phầm sẽ có những hỗ trợ kỹ thuật, khiến người dùng cảm thấy an tâm. Ngoài ra, trong khi hầu hết phần mềm mã nguồn mở chỉ hoạt động được trên nền tảng UNIX thì những phần mềm trả phí có thể làm việc trên tất cả hệ điều hành. Nói cách khác, họ tạo ra công cụ tin sinh học cho tất cả mọi người.

Tuy nhiên, vẫn có một vài vấn đề với các phần mềm loại này. Đầu tiên, hầu hết các công cụ tin sinh có giao diện và phải trả phí trên thực tế là miễn phí. Những công ty bán những sản phẩm này thực tế đang kiếm tiền trên mặt trái của sự miễn phí. Quan trọng hơn, việc đóng gói những phần mềm miễn phí trong giao diện trả phí khiến trong nhiều trường hợp không thể kiểm soát chất lượng và phiên bản của các phần mềm miễn phí được sử dụng. Thứ hai, lặp lại được kết quả đã công bố là điều rất quan trọng trong khoa học. Nếu một sản phẩm phần mềm trả phí được sử dụng để phân tích kết quả, điều này sẽ khiến các nhà khoa học khác cũng phải sử dụng cùng một phần mềm để thực hiện lại thí nghiệm đó nếu muốn cho ra cùng kết quả. Mặt khác, làm sao chúng ta có thể biết được kết quả là chính xác khi không thể truy cập mã nguồn và các thuật toán? Khi các cơ sở dữ liệu chung đang được sử dụng rộng rãi và ngày càng trở nên quan trọng trong các nghiên cứu thì tính chính xác của kết quả thí nghiệm càng trở nên quan trọng vì chúng góp phần xây dựng nên cơ sở dữ liệu mà nhiều người khác/ thí nghiệm khác sẽ sử dụng. Các nhà sinh học đang bước vào một kỷ nguyên mới, nơi việc giải trình tự DNA ngày càng trở nên dễ dàng. Do đó, việc sử dụng các công cụ tin sinh đang trở nên cần thiết hơn bao giờ hết. Hơn thế nữa, chi phí mua và/hoặc sử dụng các công cụ tin sinh có thể tác động xấu đến việc nghiên cứu ở các nước đang phát triển. Phần mềm mã nguồn mở được quan tâm bởi nó linh hoạt hơn và quan trọng hơn là nó hoàn toàn miễn phí.

Làm sao để duy trì các công cụ tin sinh miễn phí?

Chúng ta có thể làm gì? Câu trả lời thực ra rất đơn giản. Các nhà nghiên cứu nên sử dụng phần mềm mã nguồn mở trong các nghiên cứu của mình. Có công cụ tin sinh miễn phí cho gần như tất cả các ứng dụng. Rất dễ dàng để tìm thấy một danh sách các ứng dụng mã nguồn mở cho các nhà sinh học trên Internet.

Phát triển ứng dụng mã nguồn mở nên xem xét những điểm sau (i) xem xét ứng dụng dưới con mắt người dùng và cố gắp phát triển chúng thân thiện với người sử dụng, (ii) tạo ra những công cụ có thể sử dụng trên nhiều nền tảng và (iii) đơn giản hóa cách thức quản lý những thứ đi kèm.

Tuy nhiên, nhiều trường hợp phát triển công cụ tin sinh học không phải là trọng tâm chính của các phòng thí nghiệm, và những người chịu trách nhiệm cho các dự án không có thời gian để cải thiện giao diện. Ví dụ điển hình của các ứng dụng mã nguồn mở thân thiện với người sử dụng là Artemis (Rutherford et al., 2000) và Unipro UGENE – những phần mềm được tích hợp nhiều công cụ, có giao diện đồ họa dễ sử dụng và có thể chạy trên mọi hệ điều hành.

Các khóa học tin sinh học nên nắm bắt mã nguồn mở, các ứng dụng miễn phí và trên hết, thúc đẩy tầm quan trọng của việc sử dụng chúng. Lý tưởng nhất, các chương trình tin sinh học nên dựa trên việc sử dụng các nguồn tài nguyên mã nguồn mở, điều này sẽ tăng cường tính độc lập và tự do học thuật. Sinh viên/học viên là tương lai của tin sinh học và bằng cách tiếp xúc với phần mềm mã nguồn mở, họ sẽ có nhiều khả năng phát triển các phần mềm miễn phí và đưa ra các tiêu chuẩn mới cho lĩnh vực này. Chúng tôi nghĩ rằng khái niệm tin sinh học nên được đưa vào tất cả các chương trình học sinh học. Ví dụ, tại Đại học Laval, sinh viên ngành vi sinh và hóa sinh phải tham gia một khóa tin sinh học bắt buộc, trong đó họ được giới thiệu về ánh xạ trình tự, lắp ráp bộ gen, phân tích phát sinh loài, xác định cấu trúc protein, và những ứng dụng khác sử dụng các công cụ mã nguồn mở. Các sinh viên có thể tham gia khóa học nâng cao nếu muốn.

Cải thiện khả năng tiếp cận các công cụ miễn phí sẽ giúp làm sáng tỏ tin sinh học và như vậy, góp phần truyền bá triết lý của việc chia sẻ và miễn phí.

Theo “Freedom in bioinformatics” (Tác giả: Antony T. Vincent và Steve J. Charette)

{fcomment}

Trả lời

Email của bạn sẽ không được hiển thị công khai.