China Telecom обучила 2 БЯМ полностью на отечественных чипах
Одна из новых моделей, название которой пока не раскрыто, содержит 1 триллион параметров, что делает её одной из самых крупных в мире. Вторая модель, TeleChat2-115B, имеет более 100 миллиардов параметров. Количество параметров напрямую влияет на способность модели обрабатывать большие объемы данных и выполнять сложные задачи, такие как генерация текстов и ответы на вопросы, с высокой точностью и эффективностью. Обучение таких моделей требует значительных вычислительных ресурсов: мощных процессоров и графических ускорителей. Читать дальше...