
O lançamento silencioso do chatbot de inteligência artificial chinês DeepSeek-R1 em 20 de janeiro de 2025 gerou um frenesi no mundo da tecnologia. Apenas dois dias depois, a equipe da plataforma divulgou um relatório técnico de 22 páginas, no qual comparava seu desempenho com o de gigantes como o ChatGPT, da OpenAI, e o Claude, da Anthropic. Inicialmente, muitos especialistas foram céticos, questionando a veracidade das alegações, temendo tratar-se de mera propaganda do governo chinês.
Esse ceticismo foi rapidamente superado, à medida que os especialistas começaram a testar o modelo e perceberam sua capacidade real de competir com as tecnologias de ponta das big techs americanas. Em pouco tempo, a disputa entre EUA e China pela liderança no setor de IA se intensificou, provocando uma queda drástica nas ações das maiores empresas de tecnologia dos Estados Unidos, que perderam US$ 1 trilhão em valor de mercado apenas no dia 27 de janeiro.
Além de levantar questões sobre o uso de dados do ChatGPT para treinar o modelo e sobre sua censura a tópicos controversos sob a ótica do Partido Comunista Chinês, o DeepSeek chamou a atenção pela inovação tecnológica que trazia. Para o pesquisador brasileiro Cleber Zanchettin, especialista em inteligência artificial da Universidade Federal de Pernambuco (CIn-UFPE), a plataforma foi além do esperado e se destacou por sua abordagem única.
Em entrevista à BBC News Brasil, Zanchettin explicou por que o DeepSeek impressionou, destacando quatro aspectos essenciais que diferem o modelo da maioria das outras empresas no setor.
1. Código aberto
Uma das maiores inovações do DeepSeek foi a decisão de adotar um código aberto, o que é raro entre as empresas de IA de grande escala. A maioria das plataformas, como o ChatGPT e o Claude, mantém o código por trás da interface em sigilo. O DeepSeek, por outro lado, divulgou sua “receita” para o treinamento do modelo, algo que vai além do que outras empresas, como o LLaMA da Meta, disponibilizam.
Zanchettin explica que essa transparência oferece uma nova visão sobre como os modelos de IA são treinados, proporcionando aos pesquisadores uma compreensão mais clara das cadeias de raciocínio que sustentam esses sistemas, o que poderia ser revolucionário no avanço da pesquisa.
2. Raciocínio explícito
Outra característica que se destaca no DeepSeek é o raciocínio explícito que o modelo apresenta ao responder questões. Com a opção “DeepThink”, os usuários podem observar o passo a passo do raciocínio do chatbot, algo que raramente é visto em outros modelos. Em testes, o DeepSeek mostrou um processo de reflexão complexo e iterativo, tentando diversas abordagens até chegar a uma resposta.
Isso permite que especialistas e desenvolvedores entendam melhor a robustez do modelo e avaliem suas capacidades de forma mais precisa, o que é especialmente importante para a interpretação das respostas e a avaliação da confiabilidade do sistema.
3. Aprendizagem por reforço
O DeepSeek também se diferencia por sua abordagem de aprendizagem por reforço. Enquanto a maioria dos modelos de IA precisa de intervenção humana constante (o modelo “humano no loop”), o DeepSeek consegue aprender de maneira mais autônoma, com base em um sistema de recompensas. Isso significa que, ao longo do tempo, o modelo se torna mais eficiente por conta própria, com menos necessidade de ajustes humanos.
Zanchettin destaca que isso torna o processo de treinamento não só mais barato, mas também mais escalável, o que pode permitir que mais empresas e grupos de pesquisa, até mesmo fora das grandes potências, participem da inovação em IA.
4. Da restrição à inovação
O sucesso do DeepSeek também é notável considerando as restrições impostas pelos Estados Unidos à China. O país asiático tem enfrentado dificuldades para obter chips de última geração, o que se pensava ser um grande obstáculo ao seu progresso em IA. No entanto, o DeepSeek conseguiu alcançar resultados impressionantes mesmo sem os melhores recursos, provando que limitações podem, na verdade, gerar inovações criativas.
Para Zanchettin, essa inovação diante da escassez de recursos reflete um princípio que muitos brasileiros conhecem bem: as dificuldades podem abrir novas oportunidades. Ele acredita que, com a redução de custos e barreiras, mais pesquisadores e empresas ao redor do mundo terão condições de competir no campo da inteligência artificial, o que pode acelerar ainda mais o desenvolvimento da tecnologia.
A Revolução da IA
A chegada do DeepSeek não só altera a dinâmica entre EUA e China, mas também sinaliza uma possível mudança no setor de IA, com novas possibilidades de desenvolvimento em um cenário mais inclusivo e acessível. Com o modelo da DeepSeek, o mercado de IA promete se diversificar, permitindo que empresas menores e pesquisadores de diferentes partes do mundo possam competir com as grandes corporações.
Como conclui Zanchettin, a inovação por trás do DeepSeek pode resultar em um “renascimento” da IA, em que mais talentos terão a oportunidade de impactar o setor de forma significativa e com menos recursos.
A corrida pela supremacia tecnológica entre China e Estados Unidos está apenas começando, e, com modelos como o DeepSeek, as próximas décadas podem reservar muitas surpresas.