Новости по-русски

Alibaba Cloud заявляет, что сократила использование графических процессоров Nvidia AI на 82% благодаря новой системе объединения ресурсов

Alibaba Cloud заявляет, что их система пулинга Aegaeon снижает количество требуемых графических процессоров Nvidia на 82% для обслуживания больших языковых моделей (LLM) в ходе многомесячного бета-тестирования на платформе Model Studio. Эти результаты описаны в рецензируемой статье, представленной на симпозиуме ACM по операционным системам (SOSP) 2025 года в Сеуле, где предполагается, что облачные провайдеры могут повысить эффективность инференса на...

Читать далее

Читайте на сайте