DeepSeek научилась тренировать языковые ИИ-модели без оглядки на ограничения по скорости памяти
Как отмечалось недавно, пропускная способность памяти, используемой в инфраструктуре ИИ, становится одним из серьёзных ограничителей дальнейшего роста быстродействия языковых моделей. Представители DeepSeek утверждают, что разработали метод обучения ИИ-моделей, который позволяет обойти подобные ограничения со стороны памяти. Источник изображения: Unsplash, Solen Feyissa