
Студенты из России разработали модели создания визуальных субтитров для слабослышащих
🔥 Объявлены победители хакатона AIRI и МТУСИ OmniSub 2026. В соревновании по визуальным субтитрам приняли участие более 20 команд из России, Вьетнама, Эфиопии и Индии.
🎯 Соревнование по визуальным субтитрам OmniSub 2026 было направлено на решение задач, связанных с автоматическим созданием субтитров для видеоданных без звукового сопровождения речью, и призвано повысить доступность информации для людей с нарушениями слуха.
🧑💻 От участников соревнования требовалось разработать решение, обеспечивающее поиск лица диктора на видео, локализацию и стабилизацию области рта человека с обеспечением распознавания речи в сложных условиях, включающих повороты головы, освещение и другие искажения кадра. Оценка проводилась по метрикам точности на русском и английском языке.
🎓 Хакатон был открыт для студентов бакалавриата, магистратуры, специалитета и аспирантуры из технических университетов стран БРИКС, СНГ, Кубы и Вьетнама.
🏆 Призовые места разделили между собой участники из Центрального Университета, ИПА РАН, МТУСИ и НТУ Сириус, разделившие между собой призовой фонд в полмиллиона рублей.
«Я рад наблюдать важную тенденцию — студенты интересуются решением социально значимых задач, когда демонстрация навыков работы с технологиями искусственного интеллекта не ограничивается техническими метриками, но служит идее повышения доступности технологий и улучшения качества жизни. Это важная задача для каждого ученого и специалиста по ИИ», — Олег Рогов, к.ф.-м.н., руководитель лаборатории безопасного ИИ AIRI-МТУСИ
«Это уже наш третий по счету совместный хакатон, организованный AIRI и МТУСИ для студентов, увлеченных исследованиями в сфере ИИ. Мы видим, как с каждым годом растет профессиональный уровень участников наших соревнований и качество решений призеров. Отмечаем в текущем соревновании, что креативность в препроцессинге данных может дать такой же прирост качества, как и усложнение архитектуры нейросети. Надеемся сохранить научные связи с призерами для участия в совместных исследовательских проектах, где требуется проявлять нестандартное мышление и творческий подход в ответах на вызовы нового времени», — Дмитрий Болохов, начальник центра искусственного интеллекта и перспективных проектов МТУСИ.
«Для меня задача хакатона стала интересным вызовом своей нестандартностью. До соревнования я не задумывался, насколько активно сегодня развиваются технологии автоматического чтения по губам. Ранее я уже работал с аудио и распознаванием речи и был удивлен тем, как хорошо знакомые архитектуры нейросетей адаптируются под генерацию субтитров только по видео без аудио, и насколько при этом удается сохранить качество», — Тимур Гарифуллин, призер соревнования, студент Центрального Университета Если у вас установлено приложение,
вы можете сразу перейти в канал