Российские айтишники создали новый способ сжатия нейросетей
Сотрудники Yandex Research, IST Austria и Kaust придумали интересные методы сжатия нейросетей, позволяющие значительно уменьшить затраты бизнеса. Об этом сообщили в Yandex. Для быстрого получения качественных ответов языковой модели требуется много дорогих графических процессоров с большой мощностью. Разработчики сделали модель меньше в несколько раз, поэтому для ее запуска не нужны очень мощные устройства. Предложенные методы […]