Институт перспективных исследований проблем
искусственного интеллекта и интеллектуальных систем
МГУ имени М.В. Ломоносова
Целью Института является проведение фундаментальных и прикладных исследований в области искусственного интеллекта, а также междисциплинарных исследований с применением методов искусственного интеллекта.
Принципы работы Института — междисциплинарная кооперация, создание лабораторий в перспективных областях ИИ, реализация совместных исследований с ведущими российскими научными организациями и корпорациями.
Институт также проводит собственную образовательную программу в области анализа больших данных и машинного обучения AI Masters.

Наши лаборатории
-
«Машинное обучение и семантический анализ»Руководитель: Воронцов Константин Вячеславович, доктор физико-математических наук, профессор РАН
Специалист в области интеллектуального анализа данных, машинного обучения, прикладной статистики, автоматической обработки и понимания текстов естественного языка, информационного поиска. Руководил 30+ научно-исследовательскими проектами.
Проекты:
- Поисково-рекомендательный сервис «Мастерская знаний». Проект направлен на создание технологий автоматизации тех этапов научных исследований, которые связаны с поиском, анализом и обработкой больших объёмов текстовой научно-технической информации. Основные функции сервиса: рекомендации научных статей при составлении тематических подборок, мониторинг новой релевантной подборке информации, автоматизация реферирования подборок, автоматическое выделение трендов научных исследований, оценивание когнитивной сложности текста и рекомендация порядка чтения, тематизация и предметизация научно-технической информации, генерация «карт знаний» и других визуальных представлений в рамках концепции дистантного чтения (distant reading).
- Система анализа новостных потоков. Проект направлен на создание технологий и общедоступных сервисов для выявления потенциально опасного дискурса в средствах массовой информации и социальных медиа, включая выявление фейковых новостей, противоречий, замалчивания, приёмов манипулирования общественным мнением, пропаганды, идеологической и информационной войны, а также определение целевых аудиторий воздействий и оценивание возможных психоэмоциональных реакций.
- Цифровая платформа «ЦИПФ» для автоматизации процессов управления профессиональной, социальной и политической активностью молодёжи путём мониторинга и автоматизированного социологического анализа данных СМИ и социальных медиа, дальнейшего экспертного оценивания, автоматизированного скоринга и поддержки позитивных молодёжных активностей.
- Депозитарий учебных прикладных задач анализа данных и машинного обучения в различных отраслях. Описание каждой задачи содержит научно-популярный и образовательный контент, открытые наборы данных, открытый код базовых решений и метрик качества, средства автоматического контроля знаний. Депозитарий позволит ускорить формирование модульных практико-ориентированных образовательных курсов для подготовки специалистов на стыке науки о данных, искусственного интеллекта и различных прикладных областей.
-
«Интеллектуальный анализ видео»Руководитель: Ватолин Дмитрий Сергеевич, кандидат физико-математических наук
Специализируется на исследованиях в области алгоритмов сжатия видео, современных методах измерения качества и обработки цифрового видео. Руководил 40+ проектами с компаниями Intel, Cisco, Real Networks, Samsung, Broadcom, Huawei, Tencent и др. Участвовал в запуске 7 стартапов, возраст 4 из которых перевалил за 15 лет.
Проекты:
- Разработка метрик оценки качества видео, устойчивых к атакам. В результате проведения анализа устойчивости методов оценки качества видео определяеются потенциальные способы повышения их устойчивости и предлагаются новые признаки для создания новых метрик качеста.
- Разработка платформы для субъективной оценки качества медиаданных. В рамках проекта проводятся исследования методов получения эталонных наборов субъективных оценок качества изображений и видео, а также исследования влияния различных искажений на субъективные оценки и объективные метрики оценки качества.
- Разработка бенчмарков для различных алгоритмов обработки видео. В каждый бенчмарк включается по возможности уникальный набор данных, покрывающий различные тестовые случаи для своей задачи или конкретные тестовые случаи, важные для исследований в этой области; результаты субъективного сравнения; набор метрик, имеющих высокую корреляцию с субъективным сравнением и демонстрирующих различные характеристики алгоритмов.
- Разработка методологии оценки методов повышения разрешения. В рамках проекта разрабатывается метод объективной оценки корректного восстановления деталей при использовании методов повышения разрешения видео, на основе которого проводится анализ современных подходов.
- Разработка интеллектуального метода сжатия видео, учитывающего человеческое восприятие. В рамках задачи осуществляется исследование методов построения карт внимания. Планируется понижение размера файла более 20% при сохранении визуального качества по результатам субъективного исследования.
-
«Искусственный интеллект в биоинформатике и медицине»Руководитель: Аульченко Юрий Сергеевич, доктор биологических наук
Специалист в области количественной генетики и биоинформатики. Разработал оригинальные методы полногеномного анализа ассоциаций, позволяющего устанавливать связь между изменчивостью нуклеотидной последовательности генома и количественными признаками. Созданные методы обладают рекордной производительностью, что позволило решить проблему полногеномного анализа ассоциаций геномных данных по большим популяциям человека и животных.
Проекты:
- Проект STVAE. Создание фреймворка для анализа данных транскриптомики — предсказания поведения генов клетки в результате внешнего воздействия, предсказания наиболее эффективной терапии второй линии при лечении опухоли, предсказания последствия нокаута генов, устранения серийных эффектов в данных, изучения фундаментальных основ взаимодействия генов, систематического сбора и гармонизации датасетов single cell RNAseq пригодных для машинного обучения.
- Проект Protomenal. Создание фреймворка для анализа белковых последовательностей, предсказания функциональных свойств белков на основе multitask learning, и направленной модификации белков с целью изменения/улучшения их свойств (редизайн белков).
- Гликозилирование белков человека. Разработка методов анализа больших данных гликомики в связке с мультиомиксными данными. Включает в себя создание методов разложения спектра гликанов, установление генетического контроля N-гликозилирования белков, обработку сопутствующих изображений. Конечной целью является разработка новых способов диагностики заболеваний, создание лекарств нового поколения и репозиционирования лекарств (drugs repurposing).
Новости
Лаборатория «Интеллектуальный анализ видео» подала две статьи на Data Compression Conference 2023
Ученые Максим Железов, Евгений Ляпустин, Андрей Москаленко и Дмитрий Ватолин в своей статье «Choosing the best projection for 360 video» сранивают эффективность различных проекций для видео 360 на различных кодеках, включая AV1, HEVC, VP9 и AVC. Тип такого контента достаточно трудный в связи с растущей ошибкой при перепроецировании, вызванной кодеками. Поэтому в статье проводится сравнение различных проекций и различных пар кодеков, чтобы выявить наиболее устойчивую проекцию к кодированию. Результаты, представленные в статье, используют как объективные метрики, так и субъективное сравнение на статичных областях просмотра.
Субъективное измерение качества изображения играет решающую роль в разработке приложений для обработки изображений. Метрики визуального качества служат для аппроксимация результатов субъективной оценки. В связи с этим разрабатывается все больше и больше метрик, но их ограничения мало исследованы. Ученые Максим Синюков, Дмитрий Куликов и Дмитрий Ватолин в статье «Applicability limitations of differentiable full-reference image-quality metrics» рассматривают ограничения метрик качества изображений: они показывают, как предобработка изображений до сжатия может искусственно повышать популярные метрики DISTS, LPIPS, HaarPSI и VIF, а также то, что метрики не соответствуют субъективному качеству изображений. Они предлагают серию нейросетевых моделей предобработки изображений, которые увеличивают DISTS до 34,5 %, LPIPS до 36,8 %, VIF до 98,0 % и HaarPSI до 22,6 % в случае изображений, сжатых в формате JPEG. Субъективное сравнение предварительно обработанных изображений показало, что для большинства исследованных ими метрик качество изображения падает или остается неизменным, что ограничивает применимость этих метрик.
Лаборатория «Искусственный интеллект в биоинформатике и медицине» работает над созданием нейросети, способной объединять знания из разных публикаций
В мире работает много коллективов учёных молекулярных биологов, которые изучают эффект от воздействия каким-либо препаратом на клетки человека. Таким образом они ищут потенциальные лекарства. После года или нескольких лет работы одного коллектива получается результат — новые знания и соответствующий набор данных. Часть исследований публикуется в открытых источниках — научных статьях. В одной публикации, как правило, представлен один или несколько типов клеток и один или несколько препаратов. А что, если создать нейросеть, способную объединять знания из разных публикаций? Тогда препарат, используемый в одном исследовании, можно было бы виртуально испытать на клетках, полученных в другом исследовании. Над созданием такой нейросети трудится Лаборатория «Искусственный интеллект в биоинформатике и медицине».
Проведена большая работа по подготовке публичных датасетов секвенирования единичных клеток scRNAseq для использования в обучении нейросетей. После оценки качества данных отобрано 50 датасетов, содержащих результаты транскриптомных исследований и 559 биологических образцов. Лаборатория приступила к созданию нейросети, способной предсказывать результат воздействия любого из 71 препаратов на любую из 21 тканей и клеточных линий человека. Это может помочь в подборе индивидуальных лекарственных препаратов против рака, аутоиммунных заболеваний и вирусных инфекций.