Созданная нейросетью система CRISPR-Cas9 успешно отредактировала геном человеческих клеток
Американские исследователи представили первый нейросетевой инструмент для создания полностью искусственных систем редактирования генома на основе технологии CRISPR-Cas9. Одну из них успешно испытали на клетках человека и выложили в открытый доступ, говорится в пресс-релизе компании Profluent. Препринт публикации о создании инструмента, получившего название OpenCRISPR, доступен на ресурсе bioRxiv.org, коротко о нем рассказано на сайте проекта.
Создание систем редактирования генома на основе микробных CRISPR-связанных ферментов, таких как SpCas9, открыло новые перспективы в молекулярной биологии, медицине, сельском хозяйстве и биотехнологии. Тем не менее природные бактериальные системы, оказываясь в неестественных для них условиях эукариотических клеток, обладают значимыми функциональными недостатками — в первую очередь недостаточной эффективностью редактирования, действием вне заданной мишени и невысокой стабильностью. Это заставляет искать новые варианты системы CRISPR-Cas в микроорганизмах или оптимизировать имеющиеся для практического применения, что представляет собой долгий и трудозатратный процесс.
Чтобы упростить его, Али Мадани (Ali Madani) с коллегами из компании Profluent задействовали большую языковую модель (LLM) ProGen2, созданную ими ранее для нейросетевого дизайна белковых молекул. Для этого они провели систематический анализ данных среди 26,2 триллиона пар оснований, собранных микробных геномов и метагеномов из разных родов и биомов. Это позволило выявить более миллиона оперонов CRISPR-Cas разных типов (самый большой их датасет в настоящее время, названный CRISPR-Cas Atlas), включающих эндонуклеазы Cas, последовательности CRISPR, транс-активирующие CRISPR-РНК (tracrРНК) и прилежащие к протоспейсеру мотивы (PAM).
После этого языковую модель на основе ProGen2 настроили на работу с CRISPR-Cas Atlas и с ее помощью сгенерировали четыре миллиона последовательностей, сбалансированных по семействам белков и размеру кластеров. Их распределили по типам CRISPR-Cas и отсеяли заведомо нефункциональные варианты. Сопоставление с природными CRISPR-Cas показало, что сгенерированные последовательности расширили разнообразие в 4,8 раза. Большинство этих последовательностей совпадали с ближайшей природной лишь на 40–60 процентов, однако их конформация оказалась близкой к природной, что свидетельствовало о потенциальной функциональности. Дальнейшие эксперименты с избранным числом последовательностей и более точными инструкциями для модели позволили получить разнообразные полноценные эффекторы CRISPR-Cas II типа с совместимыми гидовыми РНК (гРНК).
Для функционального анализа выбрали 209 сгенерированных Cas9-подобных белков. Содержащими их плазмидами и плазмидами с гРНК SpCas9, нацеленными на три известных участка ДНК, трансфицировали человеческие клетки линии HEK293T. Часть Cas9-подобных белков продемонстрировала эффективность, сопоставимую или превосходящую SpCas9. После этого аналогичный эксперимент провели с использованием 48 полностью сгенерированных Cas9-подобных белков, и многие из них показали высокую эффективность и специфичность.
Наилучший из них — PF-CAS-182 — по он-таргетной эффективности был сопоставим с SpCas9, обладая при этом гораздо большей специфичностью (уровень офф-таргетного редактирования ниже на 95 процентов). Его последовательность совпадала с SpCas9 на 71,7 процента. После успешных испытаний на широком спектре геномных мишеней этот белок назвали OpenCRISPR-1 и выложили его последовательность в открытый доступ, призывая всех желающих использовать и тестировать его, давая разработчикам обратную связь. Более того, OpenCRISPR-1 совместили со сгенерированными языковой моделью адениндеаминазами и получили функциональную систему редактирования азотистых оснований, эффективно заменяющую аденин на гуанин в заданных участках ДНК.
Сотрудники Profluent выразили готовность сотрудничать с коллективами, которые нуждаются в оптимизации OpenCRISPR-1 для конкретных прикладных задач. Они также отметили, что в соответствии с этическими стандартами лицензия на технологию предусматривает некоторые ограничения — например, запрет редактирования клеток зародышевой линии.
Источник: https://nplus1.ru/news/2024/04/25/neurocrispr