Học máy đang biến đổi tất cả các lĩnh vực khoa học sinh học và công nghiệp, nhưng thường chỉ giới hạn ở một số người dùng và tình huống.
Một nhóm các nhà nghiên cứu tại Viện Vi sinh vật trên cạn Max Planck do Tobias Erb đứng đầu đã phát triển METIS, một hệ thống phần mềm mô-đun để tối ưu hóa các hệ thống sinh học. Nhóm nghiên cứu chứng minh khả năng sử dụng và tính linh hoạt của nó với nhiều ví dụ sinh học.
>> Tham khảo: Vật liệu thế hệ mới thay đổi hành vi dựa trên kinh nghiệm trước đó.
Mặc dù kỹ thuật của các hệ thống sinh học thực sự không thể thiếu trong công nghệ sinh học và sinh học tổng hợp, nhưng ngày nay học máy đã trở nên hữu ích trong mọi lĩnh vực sinh học. Tuy nhiên, rõ ràng là việc áp dụng và cải tiến các thuật toán, quy trình tính toán được tạo thành từ danh sách các lệnh, không dễ tiếp cận.
Chúng không chỉ bị giới hạn bởi kỹ năng lập trình mà còn thường không đủ dữ liệu được dán nhãn thực nghiệm. Tại giao điểm của các công việc tính toán và thử nghiệm, cần có các phương pháp hiệu quả để thu hẹp khoảng cách giữa các thuật toán học máy và các ứng dụng của chúng cho các hệ thống sinh học.
Giờ đây, một nhóm tại Viện Vi sinh vật trên cạn Max Planck do Tobias Erb đứng đầu đã thành công trong việc dân chủ hóa việc học máy. Trong ấn phẩm gần đây của họ trên tạp chí “Nature Communications”, nhóm đã trình bày cùng với các đối tác cộng tác từ Viện INRAe ở Paris, công cụ METIS của họ.
>> Tham khảo: Chất xúc tác có liên quan tối đa đến việc sản xuất hóa chất và lưu trữ năng lượng bằng hydro.
Ứng dụng này được xây dựng theo kiến trúc mô-đun và linh hoạt đến mức không yêu cầu kỹ năng tính toán và có thể được áp dụng trên các hệ thống sinh học khác nhau và với các thiết bị phòng thí nghiệm khác nhau. METIS là viết tắt của Thử nghiệm Thử nghiệm Hướng dẫn Máy học để Cải thiện Hệ thống và cũng được đặt theo tên của nữ thần trí tuệ và thủ công cổ đại Μῆτις, lit. “tư vấn khôn ngoan.”
Yêu cầu ít dữ liệu hơn
Học tích cực, còn được gọi là thiết kế thử nghiệm tối ưu, sử dụng thuật toán học máy để đề xuất một cách tương tác nhóm thử nghiệm tiếp theo sau khi được đào tạo dựa trên kết quả trước đó, một cách tiếp cận có giá trị cho các nhà khoa học trong phòng thí nghiệm ướt, đặc biệt là khi làm việc với một số lượng hạn chế dữ liệu được dán nhãn thử nghiệm.
Nhưng một trong những điểm nghẽn chính là dữ liệu được dán nhãn thử nghiệm được tạo ra trong phòng thí nghiệm không phải lúc nào cũng đủ cao để huấn luyện các mô hình máy học.
Amir Pandi, một trong những tác giả chính của nghiên cứu cho biết: “Mặc dù học tích cực đã làm giảm nhu cầu về dữ liệu thử nghiệm, nhưng chúng tôi đã tiến xa hơn và kiểm tra các thuật toán học máy khác nhau. Thật đáng khích lệ, chúng tôi đã tìm thấy một mô hình thậm chí ít phụ thuộc vào dữ liệu hơn”.
>> Tham khảo: Thảm thực vật ở Bắc Cực có tác động lớn đến sự nóng lên.
Để thể hiện tính linh hoạt của METIS, nhóm đã sử dụng nó cho nhiều ứng dụng, bao gồm tối ưu hóa sản xuất protein, cấu trúc di truyền, kỹ thuật tổ hợp hoạt động của enzyme và chu trình chuyển hóa cố định CO2 phức tạp có tên CETCH.
Đối với chu trình CETCH, họ đã khám phá một không gian tổ hợp gồm 1025 điều kiện chỉ với 1.000 điều kiện thử nghiệm và báo cáo tầng cố định CO2 hiệu quả nhất được mô tả cho đến nay.
Tối ưu hóa hệ thống sinh học
Trong ứng dụng, nghiên cứu cung cấp các công cụ mới để dân chủ hóa và thúc đẩy các nỗ lực hiện tại trong công nghệ sinh học, sinh học tổng hợp, thiết kế mạch di truyền và kỹ thuật trao đổi chất.
Christoph Diehl, đồng tác giả chính của nghiên cứu cho biết: “METIS cho phép các nhà nghiên cứu tối ưu hóa các hệ thống sinh học đã được phát hiện hoặc tổng hợp của họ”.
“Nhưng nó cũng là một hướng dẫn tổ hợp để hiểu các tương tác phức tạp và tối ưu hóa dựa trên giả thuyết. Và lợi ích thú vị nhất có lẽ là gì: nó có thể là một hệ thống rất hữu ích để tạo nguyên mẫu cho các hệ thống mới trong tự nhiên.”
>> Tham khảo: Nghiên cứu cho thấy xử lý đất bằng ethanol bảo vệ thực vật khỏi hạn hán.
METIS là một công cụ mô-đun chạy dưới dạng sổ ghi chép Python của Google Colab và có thể được sử dụng thông qua một bản sao sổ ghi chép cá nhân trên trình duyệt web mà không cần cài đặt, đăng ký hoặc cần sức mạnh tính toán cục bộ.
Các tài liệu được cung cấp trong tài liệu này có thể hướng dẫn người dùng tùy chỉnh METIS cho các ứng dụng của họ.