A DeepSeek, uma startup chinesa de inteligência artificial (IA), tem se destacado como um ponto central nas discussões sobre o futuro da tecnologia. Seu assistente de IA recentemente superou o ChatGPT, alcançando o topo das avaliações na App Store dos Estados Unidos. Além disso, o modelo de IA da empresa, o DeepSeek-R1, vem desafiando grandes nomes do setor, como OpenAI e Meta, com uma proposta de custos mais baixos e resultados surpreendentes em termos de eficiência. Esse avanço está gerando reflexos no mercado, afetando as ações de gigantes como Nvidia, Microsoft e Meta.
Veja a seguir tudo o que sabemos sobre essa inovação.
O que é DeepSeek?
Criada em 2023 na China, a DeepSeek surgiu como um projeto de pesquisa da High-Flyer, um fundo quantitativo avaliado em US$ 8 bilhões. Desde então, tem se destacado como uma das startups de IA mais comentadas globalmente. A empresa iniciou sua jornada com o objetivo de desenvolver modelos de IA altamente eficientes, priorizando a pesquisa fundamental em vez de focar no lucro imediato. Essa abordagem a diferencia de outras empresas que buscam resultados comerciais rápidos. Modelos como o DeepSeek-R1 foram projetados para realizar tarefas cognitivas complexas e já competem com soluções de gigantes como o OpenAI 1, de acordo com o Wall Street Journal. Mesmo enfrentando desafios como o uso de chips mais acessíveis e restrições de exportação dos EUA, a DeepSeek conseguiu alcançar um desempenho de alto nível no mercado.
O que torna a DeepSeek especial?
Redução de custos e maior eficiência: A DeepSeek conseguiu reduzir consideravelmente os custos envolvidos no treinamento de seus modelos de IA. De acordo com a revista Nature, o treinamento do DeepSeek-R1 teve um custo de cerca de US$ 6 milhões, enquanto modelos como o Llama 3.1, da Meta, ultrapassaram os US$ 60 milhões.
Avanços tecnológicos: A empresa emprega técnicas inovadoras, como:
- Aprendizado por Reforço: permite que os modelos melhorem por meio da prática, ajustando-se conforme os erros e acertos.
- Arquitetura Mixture-of-Experts (MoE): ativa apenas uma parte dos parâmetros do modelo, direcionando os recursos computacionais para tarefas específicas.
- Atenção Latente Multi-Head (MLA): aprimora a capacidade de identificar padrões complexos e processar grandes volumes de dados.
Modelo parcialmente aberto: A DeepSeek adota uma abordagem de código parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos. Essa estratégia busca democratizar o acesso à IA avançada e incentivar a colaboração dentro da comunidade científica global.
Quem está por trás da DeepSeek?
Liang Wenfeng, um experiente gestor de hedge fund com sólida trajetória nas áreas de tecnologia e finanças, é o fundador da DeepSeek. Para dar vida à startup, ele montou um time promissor, composto majoritariamente por jovens talentos recém-formados em renomadas universidades chinesas, como Tsinghua e Peking. Esse modelo de gestão tem fomentado uma cultura de inovação dentro da empresa, permitindo avanços criativos e diferenciados no campo da inteligência artificial.
Em uma entrevista à mídia chinesa 36Kr, Wenfeng explicou que a criação da DeepSeek foi impulsionada por um propósito científico, e não por interesses comerciais. Segundo ele, “o foco não era obter lucros rápidos, mas sim enfrentar os desafios mais complexos da humanidade.”
O impacto da DeepSeek no mercado global
O desempenho surpreendente do modelo DeepSeek R1 e seu aplicativo de IA abalou o domínio das gigantes da tecnologia nos Estados Unidos. O impacto foi tão expressivo que, nesta segunda-feira (27), os futuros do Nasdaq registraram uma queda superior a 4%, afetando diretamente ações de empresas como Nvidia, Microsoft e Meta.
De acordo com a Forbes, o modelo da DeepSeek questiona a ideia de que chips de alto custo e tecnologia avançada são indispensáveis para criar soluções de inteligência artificial de ponta. Ao adotar tecnologias mais acessíveis, a startup chinesa mostra que as grandes corporações americanas podem precisar revisar suas abordagens e buscar formas de reduzir custos para manter sua competitividade no mercado global.
Geopolítica tecnológica
As limitações impostas pelos EUA à exportação de chips avançados, como o Nvidia H100, levaram a DeepSeek a criar soluções alternativas que se destacam pela inovação e eficiência.
Esses avanços estão desafiando a liderança americana no setor, destacando a habilidade da China de encontrar novos caminhos tecnológicos, mesmo diante de sanções.
Segundo Wendy Chang, analista do Mercator Institute, “a DeepSeek provou que é possível desenvolver modelos avançados de IA sem depender de orçamentos exorbitantes, o que representa uma mudança significativa no cenário global.”
Possíveis desafios da DeepSeek
Apesar do crescimento impressionante, a DeepSeek enfrenta obstáculos significativos:
- Construção de Credibilidade Internacional: Para competir com grandes nomes como OpenAI e Google, a startup precisa fortalecer sua imagem global e conquistar a confiança de mercados fora da China.
- Restrição Governamental: As regulações impostas pelo governo chinês podem limitar o alcance e a adoção de seus modelos em outros países.
- Desafios Tecnológicos: Com acesso restrito a hardware de ponta, a DeepSeek terá de investir em soluções criativas para superar limitações computacionais.
DeepSeek no futuro, o que esperar?
Analistas avaliam que a DeepSeek tem o potencial de transformar o setor de inteligência artificial, pressionando empresas consolidadas a reduzir despesas e investir em tecnologias mais sustentáveis. Para François Chollet, pesquisador baseado em Seattle, o avanço da startup é um exemplo de que inovação e eficiência podem ser tão relevantes quanto a força computacional. Em entrevista à Nature, ele destacou ainda como o crescimento da DeepSeek reforça o papel estratégico da IA na disputa tecnológica entre China e Estados Unidos.