Параметри
Аналіз закономірностей фолдингу білків методами пояснення штучного інтелекту
Дата випуску :
2024
Автор(и) :
Попов Артем Валерійович
Науковий(і) керівник(и)/редактор(и) :
Анотація :
Прогнозування структур білків за послідовностями амінокислот є складною задачею для обчислювальної біології з широкими наслідками для різних галузей, включаючи проектування ліків та дослідження хвороб. Нещодавні досягнення в глибокому навчанні дозволяють отримати високоточні моделі фолдингу, які, однак, не піддаються інтерпретації через свою black-box природу.
В цій роботі вивели частину закономірностей фолдингу білків із індивідуальних властивостей амінокислот на основі інсайдів з модуля нейромережі для de-novo згортки AminoBERT.
У результаті аналізу було встановлено частину основних залежностей, необхідних для передбачення вторинної та третинної структури із первинної. Для отримання та перевірки цих закономірностей було отримано локальні (12 вторинної структури та 14 третинної структури) та глобальні (2 вторинної та 1 третинної) моделі фолдингу
При аналізі векторів-вставок було проведено лінійну регресію для визначення основних фізико-хімічних закономірностей, що розміщують амінокислоти у векторному просторі вставок. Встановлено, що маса, гідрофобність, дипольний момент та частота пояснюють 48-49% варіативності дистанцій між векторами. Було також визначено, що ці
властивості далі залишаються важливими для розрізнення вторинних та третинних структур .
Для визначення закономірностей вторинної структури було розраховано 12 локальних та 2 глобальні моделі, за допомогою яких виведено та підтверджено найбільш розповсюджені особливості, що визначають вторинну структуру. Серед них була встановлена характерна залежність від позиції в послідовності, що нагадує гаусову криву, інверсія залежності від гідрофобності для бета ланцюга при віддаленні від позиції передбачення, менша залежність альфа спіралі від гідрофобності, ніж для
бета ланцюга, і навпаки для дипольного моменту. Нарешті, певні структурні дескриптори також відрізняються між бета ланцюгом та альфа спіраллю - для альфа спіралі характерна залежність від поверхні, тоді як для бета ланцюга - від об’єму. Серед невпорядкованих найкраще класифікуються випадковий клубок, невпорядкований регіон та повороти, де різниця між вигинами та поворотами пов’язана різними залежностями від рКа біля точки передбачення та дипольного моменту.
Для третинної структури побудували простіші моделі для фолдингу на основі передбачення матриць дистанцій, розрахували пояснення та встановили найважливіші характеристики. Ними виявились позиційна відстань, гідрофобність, дипольний момент та частота амінокислот у послідовностях. Було підтверджено зменшення відстані між термінальними регіонами білка, що є можливим проспектом для покращення майбутньої простої глобальної моделі фолдингу білка.
В цій роботі вивели частину закономірностей фолдингу білків із індивідуальних властивостей амінокислот на основі інсайдів з модуля нейромережі для de-novo згортки AminoBERT.
У результаті аналізу було встановлено частину основних залежностей, необхідних для передбачення вторинної та третинної структури із первинної. Для отримання та перевірки цих закономірностей було отримано локальні (12 вторинної структури та 14 третинної структури) та глобальні (2 вторинної та 1 третинної) моделі фолдингу
При аналізі векторів-вставок було проведено лінійну регресію для визначення основних фізико-хімічних закономірностей, що розміщують амінокислоти у векторному просторі вставок. Встановлено, що маса, гідрофобність, дипольний момент та частота пояснюють 48-49% варіативності дистанцій між векторами. Було також визначено, що ці
властивості далі залишаються важливими для розрізнення вторинних та третинних структур .
Для визначення закономірностей вторинної структури було розраховано 12 локальних та 2 глобальні моделі, за допомогою яких виведено та підтверджено найбільш розповсюджені особливості, що визначають вторинну структуру. Серед них була встановлена характерна залежність від позиції в послідовності, що нагадує гаусову криву, інверсія залежності від гідрофобності для бета ланцюга при віддаленні від позиції передбачення, менша залежність альфа спіралі від гідрофобності, ніж для
бета ланцюга, і навпаки для дипольного моменту. Нарешті, певні структурні дескриптори також відрізняються між бета ланцюгом та альфа спіраллю - для альфа спіралі характерна залежність від поверхні, тоді як для бета ланцюга - від об’єму. Серед невпорядкованих найкраще класифікуються випадковий клубок, невпорядкований регіон та повороти, де різниця між вигинами та поворотами пов’язана різними залежностями від рКа біля точки передбачення та дипольного моменту.
Для третинної структури побудували простіші моделі для фолдингу на основі передбачення матриць дистанцій, розрахували пояснення та встановили найважливіші характеристики. Ними виявились позиційна відстань, гідрофобність, дипольний момент та частота амінокислот у послідовностях. Було підтверджено зменшення відстані між термінальними регіонами білка, що є можливим проспектом для покращення майбутньої простої глобальної моделі фолдингу білка.
Бібліографічний опис :
Попов А.В. Аналіз закономірностей фолдингу білків методами пояснення штучного інтелекту : випускна кваліфікаційна робота магістра : 091 Біологія та біохімія / наук. кер. І. С. Войтешенко. Київ, 2024. 94 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
4.35 MB
Контрольна сума:
(MD5):af1ca9834628aadbe0a4f1c7734b1c9b
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC