Lagosta a consumir Tokens furiosamente, chegou a fatura do aumento de preços na nuvem

robot
Geração de resumo em curso

“Lagosta” (OpenClaw) está a provocar uma onda de aumentos de preços de tokens, que está a colocar os fornecedores de cloud numa posição embaraçosa: quanto mais os utilizadores usam, maior é a perda para eles próprios. Em 18 de março, Alibaba Cloud e Baidu Cloud decidiram deixar de pagar silenciosamente, anunciando no mesmo dia que irão aumentar os preços dos produtos e serviços de computação de IA e armazenamento a partir de 18 de abril, com um aumento máximo de 34%. Na verdade, quem começou a limitar perdas foi a Tencent Cloud, que uma semana antes já tinha aumentado os preços de dois modelos de desenvolvimento próprio, com um aumento superior a 450%.

Quer seja ao aumentar o “aluguer” de cartões de computação e recursos de armazenamento, quer ao cortar diretamente na API de modelos (Interface de Programação de Aplicações), somando-se ao ciclo de aumento de preços de chips de armazenamento previsto para o segundo semestre de 2025, as três empresas de cloud enfrentam uma pressão de custos significativa, com uma reação em cadeia que continua a evoluir. Nem todas as empresas de cloud estão a seguir a tendência; a JD Cloud anunciou publicamente que os seus produtos principais não irão aumentar de preço. Outros fornecedores de cloud permanecem temporariamente inalterados.

Este aumento de preços não é por acaso; várias empresas estrangeiras de cloud já tinham aumentado os preços dos seus produtos principais em janeiro. O AI Agent (Agente de IA) faz com que as chamadas à API consumam mais poder de computação, que é a base, enquanto os tokens são o produto, e a fatura da cloud, provocada pela “Lagosta”, chega até às empresas.

Duas grandes empresas de cloud aumentam preços em conjunto

Em 18 de março, Alibaba Cloud e Baidu Cloud anunciaram ambos o aumento de preços. Segundo os anúncios oficiais, a Alibaba Cloud ajustará os preços de serviços relacionados com cartões de computação como o Zhenwu 810E, e serviços como o CPFS (versão de inteligência de cálculo), com um aumento máximo de 34%; a Baidu Cloud aumentará os preços de produtos de computação de IA em cerca de 5% a 30%, e o armazenamento de ficheiros paralelo em cerca de 30%. Ambas as empresas atribuem o aumento ao “explosivo crescimento da procura global por IA”.

Nesta onda de aumentos, a Tencent Cloud foi a mais rápida a agir. Uma semana antes, já tinha anunciado o aumento de preços de dois modelos de desenvolvimento próprio, Tencent HY2.0 Instruct e Tencent HY2.0 Think. Por exemplo, antes do ajuste, o preço de entrada do Tencent HY2.0 Instruct era de 0,0008 yuan por mil tokens; após o aumento, passou para 0,004505 yuan, um aumento de 463%. Além disso, a Tencent Cloud terminou a fase de testes gratuitos de três modelos — GLM 5, MiniMax 2.5 e Kimi 2.5 — passando a oferecer apenas serviços comerciais.

“Este aumento de preços não nos afeta”, afirmou um responsável técnico de uma pequena empresa que gere um site, ao Beijing Business Daily. “Usamos a Baidu Cloud, mas não comprámos poder de computação de IA nem armazenamento de ficheiros paralelo.”

Segundo o site oficial, o serviço de armazenamento de ficheiros paralelo da Baidu Cloud, PFS, é um sistema totalmente gerido, simples e escalável, que oferece acesso de milissegundos a operações de leitura e escrita de dados de alta IOPS (operações por segundo) para cenários de computação de alto desempenho. As aplicações incluem treino e inferência de IA, condução autónoma, computação de alto desempenho e renderização de vídeos.

Para clientes de longa data, a subida de preços da Baidu Cloud e Alibaba Cloud não tem impacto imediato. Segundo os anúncios, ambos irão aplicar os novos preços a partir de 18 de abril de 2026, às 00:00 (horário de Pequim). Clientes que já tenham adquirido produtos ou serviços antes dessa data manterão os preços atuais durante o ciclo de faturação em curso, e os novos preços aplicar-se-ão nas renovações subsequentes.

“Não há alternativa, temos de repassar os custos”

No mesmo dia em que Alibaba Cloud e Baidu Cloud anunciaram os aumentos, a Tencent divulgou os resultados financeiros do quarto trimestre e do ano de 2025, com o presidente e CEO Ma Huateng a afirmar que a Tencent Cloud atingiria lucros em escala em 2025.

Durante a conferência de resultados, os executivos da Tencent comentaram que o aumento dos preços dos chips de armazenamento se deve ao crescimento explosivo da procura por IA, que impulsionou a recuperação da procura por DRAM e memória de alta largura de banda (HBM), bem como por CPUs, SSDs e HDDs. Atualmente, os pedidos precisam de ser feitos com meses, trimestres ou até anos de antecedência. Os fornecedores priorizam os clientes maiores e mais estáveis, como a Tencent Cloud. Pequenos fornecedores de cloud já têm dificuldades em garantir uma cadeia de abastecimento estável.

Neste contexto, os altos responsáveis da Tencent consideram que o setor não tem alternativa senão transferir o aumento de custos para os preços finais.

Ao falar com o diretor do laboratório CHIP China, Luo Guozhao, este afirmou diretamente ao Beijing Business Daily: “A propagação do aumento de preços é inevitável”.

“Os preços de DRAM, SSD NAND e HDD aumentaram várias vezes, e estes componentes representam uma grande parte dos custos de equipamentos de serviços de cloud. Há uma ideia errada de que os aceleradores de IA ou GPUs (Unidades de Processamento Gráfico) são caros, mas na verdade o uso destes produtos de alto preço é limitado. Com um CPU e 6 a 8 canais de memória, mesmo numa configuração mínima, o custo é maior do que o do CPU, mesmo sem aumento de preços”, explicou Luo Guozhao, detalhando a cadeia de fornecimento de computação em cloud.

Sobre a capacidade de computação de IA, ele acrescentou: “A ampla implantação de servidores de IA e centros de computação intensifica a escassez de chips, especialmente de memória e SSD. Nos últimos dois anos, os produtos relacionados com IA têm recebido muita atenção dos consumidores comuns, o que aumenta ainda mais a procura e, consequentemente, os preços sobem”.

De tokens a poder de computação

A escalada de preços na cadeia de fornecimento é apenas um lado da pressão de custos para as empresas de cloud; a causa aparente é o aumento do consumo de tokens provocado pelo AI Agent, cujo nome de utilizador é “Lagosta”.

Ao contrário de uma conversa tradicional de IA, que consome poucos tokens por interação, a “Lagosta” executa tarefas autonomamente, chamando ferramentas continuamente, com cada operação a consumir uma grande quantidade de tokens.

“Os preços certamente vão ficar mais baixos no futuro”, afirmou Fu Sheng, presidente e CEO da Cheetah Mobile, ao falar sobre os custos de “criar uma lagosta”. Ele explicou: “Atualmente, os principais obstáculos são a eletricidade e os chips, que precisam de tempo para serem resolvidos. Na verdade, há espaço para otimizar a estrutura do software. Por que o DeepSeek de 2025 foi tão popular? Porque melhorou a eficiência da arquitetura. À medida que o consumo de tokens aumenta, as pessoas percebem que algumas partes do sistema podem ser menos complexas, o que reduz os custos. Em geral, podemos diminuir os custos de energia, chips e algoritmos”.

Este conflito com os aumentos de preços atuais das empresas de cloud é explicado por Luo Guozhao como uma mudança de modelo de negócio e uma ação de mercado. “Antes do surgimento da ‘Lagosta’, os utilizadores individuais tinham pouca vontade de pagar por tokens. Na altura, o uso era baixo e a volatilidade também, pelo que os utilizadores aceitavam usar de forma gratuita, o que as empresas de cloud toleravam. Mas, com o consumo contínuo de tokens em grande escala, tornou-se inevitável cobrar por eles. As empresas de cloud podem ajustar a sua estratégia de preços de acordo com a procura dos utilizadores”.

Na verdade, esta subida de preços já começou há dois meses. Em 22 de janeiro, a AWS anunciou um aumento de 15% nos preços do EC2 para treino de grandes modelos. Em 27 de janeiro, a Google Cloud anunciou aumentos de preços de até 100% em serviços de transferência de dados, IA e infraestrutura de computação.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar