Ученые создали новый метод разработки лекарств с помощью ИИ
Ученые Стэнфорда создали новый метод на основе машинного обучения, который позволяет быстрее и точнее предсказать молекулярные изменения, необходимые для создания более эффективных лекарств на основе антител.
Статья об исследовании опубликована в журнале Science. Разработанный подход объединяет 3D-структуру белкового каркаса с большими языковыми моделями, анализирующими последовательность аминокислот. Это позволяет исследователям за считанные минуты находить редкие и желательные мутации, которые в противном случае можно было бы обнаружить только путем дорогостоящих экспериментов.
Руководители проекта — профессор биохимии Питер Ким и доцент химической инженерии Брайан Хи — смогли усовершенствовать антитело к SARS-CoV-2, которое было одобрено FDA, но затем перестало действовать против нового штамма вируса в ноябре 2022 года. Их метод позволил повысить эффективность антитела в 25 раз.
Традиционно поиск лучшей последовательности аминокислот для создания эффективного лекарства требует создания и тестирования миллионов вариантов белка. Для ускорения процесса ученые разработали алгоритмы машинного обучения, похожие на ChatGPT, которые обучаются на последовательностях аминокислот миллионов белков, чтобы предсказать желательные мутации.
Однако эти модели часто предлагают ученым нестабильные или неэффективные варианты белков. Это происходит потому, что функция белка зависит не только от последовательности аминокислот, но и от его 3D-структуры. Например, для того, чтобы вызвать иммунный ответ, антитела должны иметь нужную форму, чтобы связываться с молекулами на поверхности вирусов.
Ключом к разработке лучшего алгоритма прогнозирования, по мнению команды, стала структура. Они ограничили длинный список потенциально полезных мутаций, определенных моделью на основе последовательности, только теми, которые сохраняли бы 3D-структуру исходного белка. В декабре 2022 года команда испытала свой метод на недавно отмененном методе лечения антителами SARS-CoV-2.
Использование моделей, основанных только на последовательности, для оптимизации белка привело к скромному двукратному увеличению эффективности. Но с помощью своего подхода, учитывающего структуру, команда добилась 25-кратного увеличения.
В отличие от большинства методов использования ИИ для создания лучших лекарств, эта модель не требует ввода данных о том, что делает белок, насколько хорошо он это делает, или каких-либо лабораторных экспериментов. Поскольку структура тесно связана с функцией, координаты белка становятся показателем его эффективности.