De novo разработка белков, связывающихся с белком E2 вируса гепатита C, с помощью модели глубокого обучения
Нур Н. Аль-Хаяни1, Мохаммед Р. Мохайсен2,3, Сара А.А. Рашид1
1Медицинский колледж, Университет Анбара, Рамади, Ирак
2Стоматологический колледж, Университет Анбара, Рамади, Ирак
3Институт инфекционных, ветеринарных и экологических наук, Ливерпульский университет, Ливерпуль, Великобритания
Аннотация. Вирус гепатита C — тяжелое заболевание с повышенным уровнем смертности во всем мире. Лекарства на основе химических веществ обладают пагубными побочными эффектами и считаются неэффективными в борьбе с вирусными инфекциями. Изучаются передовые терапевтические стратегии с повышенной специфичностью против вирусных белков, такие как разработка высокорегулярных белков, способствующих разработке высокоэффективных ингибиторов. Здесь мы представляем использование специализированной языковой модели ProtGPT2, которая на основе глубокого обучения реализует уникальные стратегии разработки новых терапевтических связывающих молекул, которые потенциально могут имитировать рецепторы хозяина и ингибировать вирусный белок. В качестве мишени используется гликопротеин E2 оболочки вируса гепатита C клинически значимых генотипов 1a и 1b. Мы сгенерировали de novo пять белков для каждого рецептора белка хозяина, которые имитируют человеческие рецепторы, на основе взаимодействующих остатков, которые были идентифицированы инструментами базы данных PDBSum в пристыкованных комплексах хозяин-E2, созданных с помощью веб-сервера ClusPro. Оценка среднеквадратичного отклонения показала, что каждый лиганд, разработанный de novo, демонстрировал высокое сходство с человеческими рецепторами, что указывает на успешность подхода. Кроме того, между разработанными de novo полипептидами и белком E2 наблюдалось множество взаимодействий, что подчеркивает потенциал разработанных de novo белков как существенных ингибиторов. Сравнительный анализ молекулярного докинга между взаимодействующими человеческими мишенями и разработанными белками показал, что de novo белки, такие как CD81-D1 и CLDN-D4, являются наиболее эффективными ингибиторами, имеющими самую низкую энергию связывания при взаимодействии с наиболее консервативными областями белка E2. Эти созданные белки могут ингибировать взаимодействие E2 с рецепторами хозяина CD81 и CLDN.
Ключевые слова: противовирусные препараты прямого действия, de novo разработка белков, глубокое машинное обучение, генеративная языковая модель ProtGPT2, вирус гепатита С, оболочечный гликопротеин E2, химические вакцины.