CEO da Speechify: os custos dos tokens de IA em breve irão exceder os salários dos colaboradores

CryptoFrontier

Cliff Weitzman, fundador e CEO da Speechify AI, defende num episódio da série de vídeos da 20VC que as empresas de software modernas precisam de reestruturar fundamentalmente as suas operações para conseguir suportar os custos crescentes de computação para IA. Weitzman sustenta que as práticas tradicionais de gestão não sobreviverão a esta mudança e que as empresas devem eliminar qualquer projeto que não conduza diretamente clientes pagantes para financiar as despesas com machine intelligence.

Estratégia orientada a vendas como princípio central

Weitzman defende uma abordagem centrada nas vendas para todas as decisões da empresa. Vê o marketing como uma equação de conversão, e não como um exercício de construção de marca, afirmando: “O crescimento é apenas um jogo de arbitragem. Estás a competir com cada uma das outras pessoas do mundo que quer colocar o teu produto à frente dos utilizadores.”

Sob esta filosofia, a Speechify testa quase mil anúncios gerados por IA por dia para identificar o que realmente converte utilizadores em clientes pagantes. Weitzman sublinha: “Faz apenas coisas que resultem em conversão. Se não consegues pessoas que convertam no teu produto, não há qualquer razão para fazeres o trabalho que estás a fazer.”

Publicidade com IA e segmentação por dados

À medida que as empresas se deslocam para ferramentas de chat com IA que capturam dados pessoais dos utilizadores, surgem novas oportunidades de publicidade, em paralelo com riscos para a privacidade. Weitzman aponta o potencial desses dados: “Enorme. Porque sabe tanto sobre ti… a OpenAI sabe tudo sobre o teu historial e sobre aquilo que te interessa dentro da tua psique.”

Argumenta que os custos elevados de publicidade se tornam irrelevantes se o retorno do investimento for demonstrado com a monitorização correta. “Podes pagar um CPM alto desde que as pessoas convertam e desde que tenhas atribuição”, explica Weitzman, referindo que o recém-lançado SDK da OpenAI para tracking é “realmente importante” para esta abordagem.

Gastos com tokens como despesa operacional normal

Weitzman prevê uma mudança fundamental nos orçamentos das empresas: “No próximo ano espero que gastemos mais em tokens do que gastamos em salários. Neste momento é algo atípico, mas não acho que venha a ser atípico a longo prazo.”

Para garantir que as ferramentas de IA são realmente utilizadas, ele exige que os colaboradores submetam screenshots ou gravações em vídeo que demonstrem o seu trabalho diário com a tecnologia. Líderes de engenharia precisam de pressionar as equipas para esgotarem milhares de créditos de computação todos os dias.

Velocidade operacional através da eliminação de reuniões

Weitzman impõe práticas operacionais rigorosas desenhadas para acelerar o desenvolvimento do produto:

  • Os funcionários enviam objetivos diários aos seus chefes
  • Chamadas telefónicas substituem longos encadeamentos de mensagens
  • As revisões são aceleradas para trabalho entre projetos
  • É imposto um tempo de resposta de 60 segundos para mensagens internas
  • Reuniões tradicionais de status são proibidas

Ele argumenta que reuniões do tipo “uma pessoa fala enquanto as outras apenas escutam passivamente” abrandam desnecessariamente as empresas.

Produção como único métrica de desempenho

No sistema de gestão de Weitzman, o código enviado substitui avaliações tradicionais de desempenho. “Se criaste algo incrível mas não está em produção, é uma perda de tempo… não recebes qualquer crédito a menos que esteja em produção… não precisas de uma avaliação de desempenho.”

Otimização de infraestruturas e economia por unidade

Weitzman reconhece que, no início, as despesas com computação eram tão elevadas que a Speechify “se sentiu mais como operar uma instituição de caridade do que como um negócio”. A empresa otimizou a infraestrutura até o processamento de um milhão de caracteres custar apenas alguns dólares.

Ele acompanha de perto a economia por unidade, avaliando se cada interação do utilizador gera lucro e esperando planos para reduzir custos de computação ao longo do tempo. Embora acredite que perdas temporárias financiadas por capital de risco destinado a fornecedores de infraestruturas de IA são uma estratégia válida no início, salienta que resolver os custos de computação é essencial para a rentabilidade final.

Implicações mais amplas na desigualdade

Weitzman defende que a vantagem de poder computacional caro favorece as grandes empresas tecnológicas e interrompe percursos de carreira tradicionais. Aconselha os indivíduos a defenderem-se neste contexto, aplicando o princípio a indústrias reguladas como a saúde: “O problema não são os médicos, o problema é o sistema.”

Sustenta que o acesso à tecnologia está a tornar-se essencial para a sobrevivência económica, dizendo “Não ter um telefone é insano”, já que os smartphones se tornaram uma necessidade básica.

Contra-ponto: investigação externa e perspetivas alternativas

Embora a abordagem de Weitzman destaque uma adoção agressiva de IA e gastos, investigação externa apresenta nuances:

Sobre publicidade gerada por IA: Um estudo de 2026 coberto pela MarTech descobriu que 57% dos consumidores confiam mais nas marcas quando estas usam IA, mas 34% estão preocupados com a privacidade dos dados e 24% não gostam de experiências demasiado personalizadas. Isto sugere que os testes agressivos de anúncios com IA podem melhorar a conversão, mas existe o risco de entrar no que Weitzman chama de “zona arrepiante” se a personalização exceder o conforto do utilizador.

Sobre gastos com tokens e output: O relatório DORA de 2025 da Google argumenta que a IA amplifica principalmente as forças e fraquezas existentes de uma organização, com os maiores retornos a virem da melhoria dos sistemas organizacionais subjacentes, e não apenas da adição de ferramentas. Isto sugere que empurrar os colaboradores a esgotarem mais créditos de computação pode aumentar a atividade sem garantir melhores produtos, a menos que o fluxo de trabalho, os processos de revisão e a cultura de engenharia sejam fortes.

Sobre dinâmicas do custo de computação: A Nvidia reportou em 2025 que os custos de inferência têm vindo a cair devido à otimização de modelos e melhorias na infraestrutura. No entanto, a análise de infraestruturas de IA da ARK para 2026 ainda prevê que os gastos com infraestruturas de IA quase tripliquem, passando de 500 mil milhões de dólares em 2025 para quase 1,5 biliões de dólares até 2030. Isto sugere que os vencedores serão as empresas que transformem a queda dos custos por unidade e o aumento da procura em margens sustentáveis, e não apenas as que gastem mais em computação.


Este resumo baseia-se num episódio da série de vídeos da 20VC com Cliff Weitzman e foi criado com assistência de IA e revisão editorial.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário