OpenAI представила разработчикам настройку голосового режима
OpenAI анонсировала несколько новых инструментов, включая публичную бета-версию Realtime API для создания приложений с возможностью голосовых ответов с низкой задержкой. Об этом пишет TechCrunch.
Благодаря новой функции разработчики могут создавать в своих приложениях голосовое общение в реальном времени с поддержкой шести голосов.
Руководитель отдела разработки Ромен Юет в качестве примера показал приложение для планирования поездок, которое позволяет устно общаться с ИИ-помощником.
Среди других анонсов OpenAI — настройка «зрения» искусственного интеллекта, которая поможет разработчикам улучшить визуальное понимание нейросети.
Также представлена функция использования более крупных моделей вроде o1-preview и GPT-4o для обучения меньших.
Директор по продуктам OpenAI Кевин Вайль отметил, что недавние уходы технического директора Миры Мурати и главного научного директора Боба МакГрю не повлияют на работу компании.
Тем временем один из соучредителей OpenAI Дюрк Кингма присоединился к конкурирующему ИИ-стартапу Anthropic.
Personal news: I'm joining @AnthropicAI! ???? Anthropic's approach to AI development resonates significantly with my own beliefs; looking forward to contributing to Anthropic's mission of developing powerful AI systems responsibly. Can't wait to work with their talented team,…
— Durk Kingma (@dpkingma) October 1, 2024
Он ушел из компании Сэма Альтмана в 2018 году, решив стать бизнес-ангелом и консультантом для ИИ-стартапов.
Anthropic основан в 2021 году бывшим вице-президентом OpenAI Дарио Амодеем и его сестрой Даниэлой Амодей.
В августе фирма переманила соучредителя компании-разработчика ChatGPT Джона Шульмана. В мае она наняла бывшего руководителя по безопасности OpenAI Яна Лейке.
Напомним, стартап Альтмана ведет переговоры о привлечении $6,5 млрд при оценке в $150 млрд.
В сентябре он анонсировал запуск расширенного голосового режима ChatGPT.