OpenAI выпускает три голосовые модели в Realtime API; GPT-Realtime-2 предлагает контекстное окно на 128K

Beating: OpenAI выпустила три голосовые модели в своей Realtime API: GPT-Realtime-2 для голосового общения с рассуждениями, GPT-Realtime-Translate для перевода в реальном времени и GPT-Realtime-Whisper для потоковой транскрибации. GPT-Realtime-2 — первая голосовая модель OpenAI с возможностями рассуждений на уровне GPT-5: она расширяет контекстное окно с 32K до 128K токенов и поддерживает до 1-2 часов плотного разговора.

GPT-Realtime-2 улучшила на 15,2% результат в бенчмарке Big Bench Audio и на 13,8% — в Audio MultiChallenge по сравнению с GPT-Realtime-1.5. GPT-Realtime-Translate поддерживает 70+ входных языков и перевод на 13 выходных языков. Цены: GPT-Realtime-2 — $32 за 32k входных токенов и $64 за 128k выходных токенов; Translate — $0,034 за минуту; Whisper — $0,017 за минуту.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев