Академия наук Республики Татарстан
Академия наук Республики Татарстан совместно со Сбером завершила важный этап работы по развитию технологий искусственного интеллекта для национальных языков: нейросетевая модель ГигаЧат освоила татарский язык
В рамках проекта был сформирован масштабный и качественно выверенный корпус данных на татарском языке, включающий произведения литературы, публикации прессы, учебные пособия, ресурсы Национального корпуса татарского языка «Туган тел» Института прикладной семиотики АН РТ, а также другие верифицированные открытые текстовые источники. Это позволило заметно повысить качество понимания и генерации текста на татарском языке.
Особую значимость проекту придает то, что первым результатом совместной работы по адаптации модели к языкам народов России стало именно обучение ГигаЧат татарскому языку.
Для Республики Татарстан это не только технологическое достижение, но и важный шаг в сохранении, изучении и развитии татарского языка в условиях глобальной цифровизации.
Развитие этого направления ведется в рамках стратегии по сохранению языкового многообразия народов России. Речь идет не просто о технологической адаптации, а о создании условий для полноценного использования татарского языка в современных цифровых сервисах и интеллектуальных системах.
Новые возможности открываются для образования, науки, медиа и повседневной коммуникации: пользователи смогут обращаться к нейросети на татарском языке, а значит, использовать современные цифровые инструменты без утраты связи с родным языком и культурной традицией.
Проект формирует основу для дальнейшего расширения практик использования национальных языков в цифровой среде. В дальнейшем наработанный подход может быть масштабирован и на другие языки народов России. Если у вас установлено приложение,
вы можете сразу перейти в канал