jitsu gif
    Провели подряд дней с нами
    Зарина Алиева
    Зарина Алиева
    Бывший сотрудник

    Большая казахская языковая модель: специалисты ISSAI Nazarbayev University представили KAZ-LLM

    Касым-Жомарт Токаев в Nazarbayev University
    Фото: пресс-служба Акорды

    Исследователи Института интеллектуальных систем и искусственного интеллекта (ISSAI) Nazarbayev University (NU) представили главе государству Касым-Жомарту Токаеву большую языковую модель казахского языка ISSAI KAZ-LLM, разработанную на основе нейронной сети. Это основа казахского чата GPT, об этом сообщили в университете.

    Как пояснили специалисты, применение KAZ-LLM повсеместно – от переводов казахского языка и генерации контента до обработки объемных текстов.

    Адаптированный к уникальному многоязычному и мультикультурному контексту страны, ISSAI KAZ-LLM разработана для казахского, русского и английского языков с дополнительной поддержкой турецкого, что позволяет устранить языковые пробелы и продвинуть генеративный искусственный интеллект для языков с ограниченными ресурсами, к которым и относится казахский язык.

    Команда ISSAI собрала, обработала, синтезировала и перевела более 150 млрд токенов (то есть слова или подслова), что обеспечило надежную языковую работу. Уровень обучения ISSAI KAZ-LLM очень высок и конкурирует в результатах на казахском, русском и английском языках на уровне мировых лидеров в области искусственного интеллекта.

    Команда ISSAI
    Фото: Nazarbayev University

    Помимо этого ISSAI KAZ-LLM предоставил практический опыт местным IT-талантам, укрепив возможности национального искусственного интеллекта. Проект способствовал не только созданию передового инструмента искусственного интеллекта, но и росту числа казахстанских специалистов в области искусственного интеллекта.

    Казахстанские исследователи участвовали во всех этапах процесса, от подготовки данных до внедрения моделей, создавая основу для устойчивых инноваций в области искусственного интеллекта. Сотрудничество с ведущими казахстанскими институтами позволило создать инструменты сравнительного анализа и наборы данных, адаптированные для казахского языка с помощью лингвистов и передовых методов машинного перевода.

    Проект был начат в апреле 2024 года и тренировка модели заняла у разработчиков около 5 месяцев. Тренировочные данные были собраны только из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Были также использованы данные, предоставленные различными организациями.

    Хусейн Атакан Варол
    Хусейн Атакан Варол. Фото: Nazarbayev University

    "Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологической экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 млрд и 70 млрд параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели, выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель, как на сложных серверах, так и на ноутбуках", - рассказал директор ISSAI, профессор NU Хусейн Атакан Варол.

    ISSAI KAZ-LLM
    Изображение: Nazarbayev University

    ISSAI рассматривает разработку систем искусственного интеллекта следующего поколения, включая модели языкового видения, и расширить эти модели для поддержки дополнительных тюркских и региональных языков. Эти усилия могут быть направлены на укрепление региональных связей, содействие языковой интеграции и содействие значительному экономическому и технологическому влиянию в Казахстане и за его пределами, считают специалисты.

    Проект ISSAI KAZ-LLM стал возможен благодаря поддержке Фонда развития NU и NIS, а также Astana Hub и QazCode (Beeline), а разработка велась независимо от государственного финансирования.

    Узнавайте обо всем первыми

    Подпишитесь и узнавайте о свежих новостях Казахстана, фото, видео и других эксклюзивах

    Instagram
    Закладки
    Пока здесь пусто
    Используйте кнопку «
    » на странице публикации, чтобы сохранить её в свой личный список закладок.