Международная группа ученых сделала большое обновление HOCOMOCO — базы моделей нуклеотидных последовательностей участков ДНК, связывающих транскрипционные факторы, созданной в 2013 году. Статья опубликована в журнале Nucleic Acid Research.
HOCOMOCO в переводе на русский расшифровывается как «Обширная коллекция моделей для Homo Sapiens». В этой базе хранятся модели участков связывания транскрипционных факторов. Каждая такая модель — это математическое представление участков ДНК, с которыми может связываться транскрипционный фактор — один из белков, которые подавляют или, наоборот, активируют работу различных генов. В геноме человека закодировано более полутора тысяч транскрипционных факторов. В базе данных хранятся модели участков связывания транскрипционных факторов для мышиных и человеческих ортологов — генов, которые произошли от одного и того же гена у вида — общего предка мыши и человека.
К такой базе, как HOCOMOCO, обращаются исследователи со всего мира для своих экспериментов. С помощью моделей из базы можно, например, предсказывать места связывания транскрипционных факторов с нуклеотидами в цепочке ДНК. То есть с такими местами в геноме, на экспрессию генов в которых как раз влияют транскрипционные факторы. После этого на основе предсказанных мест связывания можно строить модели регуляторных сетей, которые объясняют механизмы переключения генов в различных условиях. Такие сети нужны для понимания биологической картины экспрессии генов в том или ином процессе, например при развитии рака.
Для того чтобы создать такую базу, ученые собирали результаты экспериментов по исследованию взаимодействий ДНК и транскрипционных факторов из нескольких открытых баз данных. Большую роль в этой работе сыграли сотрудники ФИЦ информационных и вычислительных технологий Сибирского отделения РАН под руководством Федора Колпакова, заведующего лабораторией биоинформатики. Благодаря их работе удалось получить огромную коллекцию фрагментов ДНК, связывающихся с белками. Для создания HOCOMOCO в этих фрагментах с помощью вычислительного анализа ДНК-текста были найдены мотивы — небольшие последовательности ДНК, с которыми связываются транскрипционные факторы. Прежде чем мотивы попадут в итоговую базу данных, их аннотируют — с помощью специальных инструментов определяют структуру соответствующих белков и их функцию. Дальше для мотивов определяют надежность, показывающую, насколько достоверно взаимодействие несущей мотив ДНК и транскрипционного фактора в экспериментах разного вида.
Но это не единственная проверка. Перед попаданием в базу каждая модель проходит вычислительные эксперименты на то, насколько хорошо она помогает предсказывать места связывания ДНК с транскрипционным фактором. Результаты вычислительных экспериментов сравниваются с реальными данными, полученными в лаборатории. На основе нескольких разных сравнений каждой модели выставляются оценки точности, чувствительности и специфичности. После всех этих процедур составляется итоговая строчка для каждой модели в общую базу. База открыта, и ученые со всего мира могут использовать данные из нее для планирования своих экспериментов. По сравнению с предыдущей версией, в HOCOMOCO появилось больше новых моделей, возросли их точность и валидность. Кроме этого, построены коллекции специальных моделей для предсказания ДНК-белковых взаимодействий in vivo, in vitro, а также для предсказания индивидуальных вариантов в геноме, влияющих на связывание белков-регуляторов.
«Мы считаем, что HOCOMOCO — это надежная база данных, расширяющая возможности молекулярной биологии и эпигенетики. Для ее пополнения и обновления наша команда изучила данные 14 183 экспериментов ChIP-секвенирования и 2554 экспериментов HT-SELEX, что дало возможность получить более 400 тысяч мотивов-кандидатов, из которых было отобрано 1443 мотива, характеризующих участки ДНК, связывающие 949 транскрипционных факторов человека и 720 их аналогов у мыши», — говорит Всеволод Макеев, член-корреспондент РАН, заведующий лабораторией системной биологии и вычислительной генетики ИОГен им. Н.И. Вавилова РАН, заведующий кафедрой биоинформатики и системной биологии МФТИ.
В работе принимали участие ученые из Института общей генетики им. Н.И. Вавилова РАН, ФИЦ информационных и вычислительных технологий (Новосибирск), Института исследования белка РАН, МГУ им. М.В. Ломоносова, МФТИ, Института биохимии и генетики Уфимского ФИЦ РАН, Сколтеха, Института проблем передачи информации РАН, НИТУ «Сириус», ООО «Биософт.Ру» (Новосибирск), НИЦ биотехнологии РАН, Института фундаментальной медицины и биологии (Казань), а также из США и Канады.
Информация предоставлена пресс-службой МФТИ
Источник фото: ru.123rf.com
Информация взята с портала «Научная Россия» (https://scientificrussia.ru/)
Рекомендуем посетить:
Федеральное агентство по делам молодёжи (Росмолодёжь)
Десятилетие науки и технологий
Федеральный портал "Российское образование"
Электронный банк заданий для оценки функциональной грамотности
Единая коллекция цифровых образовательных ресурсов
Навигатор для современных родителей "Растим детей"
Проект "Школа Минпросвещения России"
Уважаемые коллеги!
В рамках подготовки обращений в Министерство науки и высшего образования Российской Федерации принимаем предложения по внесению дополнений и изменений в федеральные программы:
Федеральную научно-техническую программу развития генетических технологий на 2019-2030 годы, утвержденную постановлением Правительства Российской Федерации от 22 апреля 2019 года № 479, Федеральную научно-техническую программу развития синхротронных и нейтронных исследований и исследовательской инфраструктуры на период до 2030 года и дальнейшую перспективу, утвержденную постановлением Правительства Российской Федерации от 16 марта 2020 года №287.
Предложения принимаются на электронную почту sci-idea@mail.ru
АКТУАЛЬНО
17−19 декабря 2024 года
Белорусский государственный университет
Пятая международная научная конференция
«Математическое моделирование и дифференциальные уравнения»,
посвященная столетию со дня рождения Е.А. Иванова и Н.И. Бриша
11 декабря 2024 г.
Витебский государственный университет имени П.М. Машерова (Республика Беларусь)
Международный круглый стол «Психология: рефлексия настоящего в контексте будущего»
Целевое обучение в организациях высшего образования
Молодые ученые (достижения и поддержка)
Федеральный институт педагогических измерений:
видеоконсультации разработчиков КИМ ЕГЭ
Обучающие мероприятия для родителей
Единая информационная система проведения конкурсов на замещение должностей научных работников
Портал госслужбы (вакансии и кадровый резерв в федеральных и региональных органах власти)
Обсуждение проектов нормативных правовых актов
ФЕДЕРАЛЬНЫЙ ЗАКОН от 29 декабря 2012 года № 273-ФЗ
"Об образовании в Российской Федерации"
Комментарий к Федеральному закону "Об образовании в Российской Федерации"
ФЕДЕРАЛЬНЫЙ ЗАКОН от 23 августа 1996 года № 127-ФЗ
"О науке и государственной научно-технической политике"
УКАЗ ПРЕЗИДЕНТА РОССИЙСКОЙ ФЕДЕРАЦИИ от 28 февраля 2024 года № 145
"О Стратегии научно-технологического развития Российской Федерации"
ПОСТАНОВЛЕНИЕ ПРАВИТЕЛЬСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ от 29 марта 2019 года № 377
ПОСТАНОВЛЕНИЕ ПРАВИТЕЛЬСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ от 26 декабря 2017 года № 1642
"Об утверждении государственной программы Российской Федерации "Развитие образования"
ПРИКАЗ МИНИСТЕРСТВА ПРОСВЕЩЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ от 18 мая 2023 года № 370
"Об утверждении федеральной образовательной программы основного общего образования"
ПРИКАЗ МИНИСТЕРСТВА ПРОСВЕЩЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ от 18 мая 2023 года № 372
"Об утверждении федеральной образовательной программы начального общего образования"
ПРИКАЗ МИНИСТЕРСТВА ПРОСВЕЩЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ от 18 мая 2023 года № 371
"Об утверждении федеральной образовательной программы среднего общего образования"
ОТЧЕТЫ. ДОКЛАДЫ. СТАТИСТИКА
Российский статистический ежегодник. 2023
Статистические сборники Высшей школы экономики
Наука. Технологии. Инновации. 2024
Индикаторы инновационной деятельности. 2024