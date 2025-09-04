Главная особенность DiMA заключается в том, что она значительно компактнее аналогов, но при этом демонстрирует более высокую эффективность. Система может создавать белковые последовательности, которых не существует в природе, и подбирать их в соответствии с заранее заданными условиями. Это важно для разработки препаратов, требующих белков с уникальными свойствами.

Белок представляет собой цепочку аминокислот, которая сворачивается в пространстве в определенную форму. Именно структура определяет его функции и характеристики. Ранее для генерации белков использовались языковые модели, которые формировали последовательности постепенно или целиком. Однако такие подходы требовали огромных вычислительных ресурсов и больших наборов данных.

DiMA использует новый метод — непрерывную Гауссову диффузию. На первом этапе ее обучили формировать биологически корректные белки, которые не повторяют известные природные варианты. Затем система научилась генерировать белки с заданными характеристиками, например определенной трехмерной структурой или принадлежностью к нужному семейству.

Такой подход открывает возможность создавать белковые варианты, которые не встречались в природе, но соответствуют целям исследователей. Это расширяет представления о возможных конфигурациях белков и дает новые инструменты для биотехнологий и медицины.

Результаты работы были представлены на Международной конференции по машинному обучению ICML 2025.