A Cartesia lança os modelos Sonic-3,5 TTS e Ink-2 STT para IA de voz em tempo real

S-1,25%
SONIC-1,77%
De acordo com a Beating, a startup de voz com IA Cartesia anunciou o lançamento de Sonic-3.5 e Ink-2, formando uma stack unificada de tecnologia de agentes de voz em tempo real. O Sonic-3.5 faz conversão de texto para fala com uma latência de 90 milissegundos para o primeiro token e suporta 42 línguas. O Ink-2 fornece reconhecimento de fala para texto com uma taxa de erro de palavras de 3,6% e detecção nativa de mudanças de turno com base na compreensão semântica, em vez de apenas na duração do silêncio. Ambos os modelos integram-se através de uma única API com streaming bidirecional para minimizar atrasos na transmissão.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário