ИИ поможет обрабатывать информацию и анализировать документы на татарском

Цифровая экосистема представила разработанную MTS AI новую версию большой языковой модели (18+) для работы с текстами на татарском языке. По словам разработчиков, эта модель входит в число лидирующих LLM (большие языковые модели глубокого обучения, которые предварительно обучены на крупных объемах данных) в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 млрд параметров, а также большим контекстным окном до 32 тыс. токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. — Создавая большую языковую модель на татарском, разработчики MTS AI хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху, — сказал исполнительный директор MTS AI Дмитрий Марков. Чтобы модель смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

Читайте на 123ru.net