Em uma reviravolta surpreendente no mundo altamente competitivo da negociação algorítmica, uma nova classe de modelos de inteligência artificial de baixo custo da China está dando uma verdadeira aula para seus rivais americanos com orçamentos bilionários. Uma competição de negociação de criptomoedas em andamento, organizada pela plataforma de análise de blockchain COINGLASS, mostrou que, quando se trata de navegar pelos voláteis mercados de ativos digitais, um orçamento maior não significa necessariamente um desempenho melhor. Na verdade, os resultados mostram exatamente o oposto, com os modelos chineses DeepSeek e Qwen3 Max garantindo as primeiras posições, enquanto o ChatGPT-5 da OPENAI sofreu um colapso catastrófico.
O experimento ao vivo, que fornece a cada chatbot de IA generativa uma conta de 10.000 dólares para negociar na exchange descentralizada Hyperliquid, proporcionou uma visão transparente e muitas vezes brutal da tomada de decisões dos modelos no mundo real. Na última atualização, o DeepSeek, um modelo desenvolvido na China, era o único participante com retorno positivo, com um lucro não realizado de 9,1%. Em segundo lugar estava o Qwen3 Max, outro modelo chinês da ALIBABA CLOUD, com uma perda não realizada insignificante de apenas 0,5%. Mais abaixo na classificação estava o Grok, com uma perda de 1,24%, e em último lugar, bem distante, o ChatGPT-5. A potência da OPENAI, amplamente considerada o modelo mais avançado do mundo, acumulou uma perda de mais de 66%, reduzindo seu capital inicial de 10.000 dólares para apenas 3.453 dólares.

Esse resultado é especialmente chocante, dada a disparidade astronômica de recursos. O sucesso do DeepSeek, que se baseou em posições compradas alavancadas em criptomoedas importantes como Bitcoin, Ether e Solana, foi alcançado por um modelo desenvolvido com um custo total de treinamento de apenas 5,3 milhões de dólares. Em contraste, a OPENAI, criadora do ChatGPT, tornou-se a maior startup do mundo, levantando um total de 57 bilhões de dólares em capital e atingindo uma avaliação de 500 bilhões de dólares.

Embora o custo exato do ChatGPT-5 não seja público, estimativas colocam seu orçamento de treinamento entre 1,7 bilhão e 2,5 bilhões de dólares, um valor centenas de vezes maior do que o do DeepSeek. Isso é o equivalente a uma equipe local de kart superando um campeão de Fórmula 1. Essa reviravolta é uma parte fundamental da história. Há apenas algumas semanas, o Grok 4 era o vencedor aclamado da competição, tendo conquistado as manchetes por prever com precisão o fundo do mercado e transformar seu investimento inicial em um ganho de 500% por meio de negociações agressivas e de alta alavancagem. No entanto, essa mesma estratégia de alta convicção parece ter sido sua ruína em um mercado volátil, eliminando sua vantagem inicial e demonstrando a extrema volatilidade de sua abordagem. Os modelos que o substituíram no topo, embora ainda usem alavancagem, parecem estar navegando pela volatilidade com mais resiliência.
Essa diferença de desempenho levou especialistas a especular que os dados de treinamento e o propósito principal dos modelos são os principais diferenciais. Nicolai Sondergaard, analista de pesquisa da plataforma de inteligência cripto NANSEN, observou que o ChatGPT é um modelo “de propósito geral” fantástico, projetado para ser um modelo multifuncional. O DeepSeek, no entanto, tem uma formação mais especializada, com forte foco em programação e dados técnicos, o que pode lhe conferir uma vantagem significativa e inerente em um campo tão denso em dados e técnico quanto o comércio de criptomoedas. Os resultados dos modelos mostram grandes oscilações de preços, com bots ganhando milhares em um dia apenas para serem pegos em uma negociação ruim que anula seus ganhos, confirmando que todos estão usando estratégias de alto risco e alavancagem.

Outros especialistas, como o ex-trader quantitativo Kasper Vandeloock, argumentam que os resultados podem ser simplesmente uma questão de engineering of prompts. Ele sugeriu que o desempenho de qualquer grande modelo de linguagem depende muito das instruções que lhe são dadas, e que os prompts padrão usados para o ChatGPT e o Gemini podem ser simplesmente piores para a tarefa de negociação, potencialmente prejudicando-os desde o início. Embora a competição ofereça um vislumbre fascinante do futuro da negociação autônoma, ela também serve como um aviso claro de que essas ferramentas estão longe de serem confiáveis. Por enquanto, elas permanecem caixas-pretas altamente imprevisíveis e, no cassino das criptomoedas, um especialista focado e de baixo custo ainda pode superar um modelo generalista bilionário.
