Новое поколение языковых моделей: OLMo 2

Начнем с небольшой предыстории. Представьте себе: утро, офис Allen Institute for AI, разработчики пьют кофе и ворчат на текущий рынок языковых моделей. Все закрыто, метрики — только на картинках, данные спрятаны под NDA, а лицензии такие, что использовать модель в реальном продукте — как играть в рулетку с юристами.

И вот кто‑то из команды говорит: «А что, если мы сделаем всё наоборот? Полностью открытая модель, никаких секретов, всё доступно для проверки и использования». Так родилась идея OLMo.

Что же произошло дальше?

Читайте на 123ru.net