Top.Mail.Ru
Технологии

Версия сайта

ru kz

Актуальное

Все категории

ИИ, говорящий на казахском языке: в Назарбаев Университете создали цифровой прототип человека

Опубликовано:

Umay (Ұмай)
Фото: АОО "Назарбаев Университет"

В Институте умных систем и искусственного интеллекта (ISSAI) при Назарбаев Университете создали цифровой прототип человека – помощницу Umay, сообщили в университете.

В эпоху стремительного развития технологий ISSAI при Назарбаев Университете продолжает искать пути эффективного взаимодействия человека и компьютера на казахском языке. Очередным прорывом в этом направлении стал первый цифровой прототип человека – помощница по имени Umay (Ұмай), которую недавно с гордостью презентовала команда ISSAI.

Umay представляет собой виртуального помощника, владеющего государственным языком, созданного в цифровой форме в виде реалистичного человеческого аватара женского пола. Ее возможности охватывают широкий спектр областей, включая науку, образование, историю, технологии и медицину.

Имя богини-матери из тюркской мифологии дано аватару символично. Во-первых, это связь с казахской культурой, во-вторых, Ұмай - первый прототип цифрового человека, по задумке команды станет прародительницей будущих цифровых помощников.

"Нашей главной целью было показать передовые возможности казахстанской интеллектуальной силы, а именно небольшой команды ISSAI, и заявить: "Мы можем делать это в Казахстане". Umay использует ряд ключевых технологий, разработанных нашим институтом. К ним относятся преобразование текста в речь, автоматическое распознавание речи, нейронный машинный перевод, быстрое проектирование и фотореалистичный аватар", - отметил директор ISSAI, заведующий кафедрой робототехники и профессор в Школе инженерных и цифровых наук Назарбаев Университета Атакан Варол.

Umay (Ұмай)
Фото: АОО "Назарбаев Университет"

По словам доктора Варола, основной технической задачей проекта была системная интеграция, то есть команде нужно было заставить работать множество ИИ-систем одновременно. Так, прототип использует ChatGPT от OpenAI, хотя он известен своей неоптимальной работой на казахском языке. Чтобы преодолеть это ограничение, Umay использует усовершенствованную модель нейронного машинного перевода Tilmash, которая также разработана в ISSAI Назарбаев Университета. Эта программа помогает переводить запросы пользователей на английский язык и впоследствии преобразует ответы, данные ChatGPT, обратно на казахский язык.

Umay (Ұмай)
Фото: АОО Назарбаев Университет

"Наш институт ранее создал систему двустороннего машинного перевода на 4 языка под названием Tilmash. Эта модель, собранная на основе большого текстов в разных стилях, может конкурировать с переводчиками Google и Yandex. Модель переводит озвученные на казахском запросы на английский, и затем ответы от ChatGPT переводит с английского на казахский язык", - объясняет один из разработчиков Umay, старший аналитик данных ISSAI Аскат Куздеуов.

Благодаря программному продукту Unreal Engine 5, Umay обеспечивает высококачественную лицевую анимацию в реальном времени. Она объединяет передовые речевые технологии, разработанные в ISSAI, в том числе автоматическое распознавание речи (ASR) и преобразование текста в речь (TTS), для облегчения естественного и свободного общения на казахском языке.

Umay (Ұмай)
Фото: АОО "Назарбаев Университет"

При дальнейшем развитии, Umay может стать дополнением к рабочей силе для повышения эффективности и снижения затрат во многих областях. Для дальнейшей настройки и применения Umay необходима собственная большая языковая модель, то есть казахский искусственный разум. Обучение большой языковой модели требует огромного хранилища данных и вычислительных ресурсов. Это только начало большого пути, требующего поддержки от государства и общества, отмечают аналитики Назарбаев Университета.

Как работает цифровой помощник можно увидеть на видео:

Институт умных систем и искусственного интеллекта (ISSAI) был основан в сентябре 2019 года, с целью служить движущей силой исследований и инноваций в цифровой сфере Казахстана в области исследований искусственного интеллекта. Институт проводит междисциплинарные исследования в области машинного интеллекта для решения реальных проблем промышленности и общества. Среди успешных проектов института: оптические тактильные датчики со встроенным глубоким обучением, модель обнаружения объектов на рентгеновских снимках в вагонах поездов и грузовиках, классификатор патологии рентгенографии грудной клетки с пояснительной визуализацией, набор данных "Говорящие Лица", сочетающие тепловые, визуальные и аудиопотоки данных, очки дополненной реальности, помогающие людям с нарушением памяти, и другое.

Оригинал статьи: https://www.nur.kz/technologies/software/2050842-ii-govoryaschiy-na-kazahskom-yazyke-v-nazarbaev-universitete-sozdali-tsifrovoy-prototip-cheloveka/

pixel