Новое поколение языковых моделей: OLMo 2
Начнем с небольшой предыстории. Представьте себе: утро, офис Allen Institute for AI, разработчики пьют кофе и ворчат на текущий рынок языковых моделей. Все закрыто, метрики — только на картинках, данные спрятаны под NDA, а лицензии такие, что использовать модель в реальном продукте — как играть в рулетку с юристами.
И вот кто‑то из команды говорит: «А что, если мы сделаем всё наоборот? Полностью открытая модель, никаких секретов, всё доступно для проверки и использования». Так родилась идея OLMo.
Что же произошло дальше?