Научный искусственный интеллект ESM3, созданный группой американских учёных и программистов, успешно сымитировал полмиллиарда лет молекулярной эволюции, чтобы создать код ранее неизвестного белка. Учёные, курирующие этот ИИ, полагают, что новый светящийся белок, подобный тем, что встречаются у медуз и кораллов, может стать основой для разработки новых лекарственных препаратов.
Научная статья об этом
Белки — это одна из ключевых составляющих жизни на Земле, выполняющая множество функций в организме, включая построение мышц и борьбу с болезнями. Они состоят из цепочек молекул, называемых аминокислотами, последовательность которых задаётся генами. Чтобы ESM3 могла понять строение и функции белков, исследователи ввели в модель информацию о ключевых свойствах: аминокислотной последовательности, структуре и функциях, в виде последовательности букв.
Смоделированная молекула, получившая название esmGFP, существует пока только в виде компьютерного кода, но она содержит план ранее неизвестного типа зелёного флуоресцентного белка.
Последовательность, определяющая esmGFP, лишь на 58% схожа с ближайшим известным флуоресцентным белком — вариантом, обнаруженным у анемонов Entacmaea quadricolor. Остальная часть последовательности уникальна и для её естественного возникновения потребовалось бы более 500 миллионов лет, что потребовало бы 96 различных генетических мутаций. ЕsmGFP и ИИ-модель ESM3, создавшую его, представили исследователи из компании EvolutionaryScale.
ESM3 заполняет пробелы в неполном коде, предоставленном исследователями, быстро «перебирая» различные пути, варианты и этапы.
«Мы обнаружили, что ESM3 осваивает основы биологии и может генерировать функциональные белки за пределами пространства, исследованного эволюцией», — говорит Алекс Райвз, соавтор исследования и соучредитель EvolutionaryScale.
Команда обучала ESM3 на данных о 2,78 миллиардах белков, существующих в природе. Затем исследователи случайным образом скрывали части белка, и ESM3 заполняла пробелы, основываясь на полученных знаниях.
Тиффани Тейлор, эволюционный биолог из Университета Бата , рецензируя исследование, отметила:
«ИИ, такие как ESM3, позволят совершить прорыв в инженерии белков. Однако попытки смоделировать 500 миллионов лет эволюции сосредоточены на отдельных белках и не учитывают многочисленные стадии естественного отбора, которые в конечном итоге создают жизнь. Инженерия белков, управляемая ИИ, вызывает интерес, но возможно, мы слишком самонадеянны, предполагая, что сможем превзойти те процессы, которые природа оттачивала миллионы лет».