Deepseek alcançou algo espetacular em questão de meses, ao mesmo tempo em que entregava um choque maciço ao mercado de ações dos EUA. A empresa de IA divulgou um rival de chatgpt impressionante chamado Deepseek AI, e se tornou viral há algumas semanas. Nenhuma outra empresa de IA alcançou o que a DeepSeek fez, nem mesmo o Google.
A parte mais impressionante foi que, devido às sanções dos EUA, a Deepseek não teve acesso às GPUs mais recentes para o desenvolvimento da IA. Então eles criaram ferramentas de software para treinar uma IA, bem como os modelos de raciocínio da OpenAI por uma fração do custo. Esse feito limpou US $ 1 trilhão do mercado de ações dos EUA, pois os investidores ficaram assustados com o fato de o hardware não continuar sendo a coisa mais importante no desenvolvimento da IA.
Embora essas preocupações possam ter sido exageradas, o Deepseek não está parando. A empresa planeja lançar uma grande atualização do modelo de raciocínio do DeepSeek R2, e está se apressando em retirá -lo até maio. A China ainda está proibida de acessar os chips mais recentes, portanto, o desenvolvimento do Deepseek R2 confiará em qualquer estoque de GPU que a Deepseek possa ter contrabandeado, além de otimizações de software.
Mas não é apenas software ou hardware que a Deepseek possa se destacar ao competir contra o Openai e outras empresas ocidentais de IA. Um relatório detalhando os planos não confirmados de Deepseek de liberar R2 por pode também revelar o molho secreto que tornou possível os avanços do DeepSeek R1. Aparentemente, as pessoas que trabalham na DeepSeek adoram lá graças a uma cultura da empresa e práticas comerciais que são incomuns entre as grandes empresas de tecnologia chinesas.
Desde que o Deepseek R1 foi lançado, o OpenAI lançou novos modelos de raciocínio, incluindo o O3-mini e o O3-Mini-High. O Openai também planeja lançar o GPT-4.5 nas próximas semanas, com uma atualização maior do GPT-5 a seguir. Isso pode explicar a pressão sobre o DeepSeek para apressar suas próprias atualizações.
Por ReutersR2 está programado para chegar antes de maio, algumas semanas antes do esperado. O novo modelo deve ser ainda melhor na codificação do que o R1 e supostamente introduzirá suporte para raciocínio multilíngue.
O Deepseek R2 deve continuar usando inovações de software que a DeepSeek já empregou para seus modelos existentes. A tecnologia da mistura de especialistas (MOE) permite que a DeepSeek ativa apenas as partes de um modelo de IA necessário para lidar com uma tarefa. Depois, há atenção latente de várioshhead (MLA), que permite que o Deepseek AI processe vários aspectos de um prompt de uma só vez.
Tudo o que acontece sem o acesso ao hardware mais recente, mas o Deepseek ainda está vendo grandes ganhos de eficiência sobre os rivais. O relatório observa as estimativas dos analistas de que o preço do DeepSeek pode ser de 20 a 40 vezes mais barato que as ferramentas de chatgpt. Isso pressiona o OpenAI e o Google a cortar preços para ChatGPT e Gêmeos, respectivamente.
A Deepseek continuará a não conseguir comprar os mesmos chips da NVIDIA aos quais as empresas de IA têm acesso. Os EUA podem ficar ainda mais difíceis com as proibições de chip no futuro, e eu não ficaria surpreso se a atualização do DeepSeek R2 alimentasse ainda mais as futuras decisões de proibição.
Estou especulando aqui, mas é baseado no que Reuters Relatórios sobre a cultura da Deepseek Company. Parece que as pessoas que trabalham lá realmente gostam de estar envolvidas com o projeto, e é tudo por causa de como Liang Wenfeng gerencia a equipe.
Wenfeng é um bilionário de 40 anos que empregou a IA da High-Flyer, um fundo de hedge quantitativo. O high-flyer reinvestou 70% dos lucros na pesquisa de IA antes do CHATGPT ser um produto viral. Alguns anos atrás, a empresa comprou dois clusters de supercomputação de AI. Isso incluiu o Fire-Flyer II, que incluía 10.000 chips NVIDIA A100.
Esses chips foram banidos da compra na China em 2022, e Deepseek as usou para treinar os modelos Deepseek IA. Os rumores dizem que a empresa pode ter contrabandeado dezenas de milhares de chips adicionais desde então, mas isso é algo que provavelmente nunca será confirmado.
De volta a Wenfeng, o fundador da Deepseek criou a empresa como um laboratório de pesquisa em vez de uma empresa de IA com fins lucrativos. Ele instituiu um estilo de gerenciamento diferente, evitando a tradicional cultura de trabalho “996” de outras empresas de tecnologia. Isso se refere a “9h às 21h, seis dias por semana”. Enquanto isso, os pesquisadores do Deepseek trabalham 8 horas de dia.
Será interessante saber se Wenfeng manteve seu estilo de gerenciamento inalterado ao empurrar o desenvolvimento do Deepseek R2, especialmente considerando a alegação do relatório de que a empresa deseja que o modelo R2 seja mais cedo do que o planejado. Não posso deixar de me perguntar se o trabalho de 8 horas é suficiente para isso.
O relatório revela ainda que Wenfeng recrutou jovens engenheiros frescos da escola, trabalhando lado a lado com eles e permitindo que eles assumissem a propriedade de projetos de pesquisa Deepseek. Esses engenheiros também são muito bem pagos. Os cientistas sênior de dados high-flyer podem ganhar cerca de 1,5 milhão de yuans anualmente, ou cerca de US $ 206.000. É sobre o dobro da taxa de concorrentes.
Tudo isso não quer dizer que os engenheiros do ChatGPT não gostem de seu trabalho ou não sejam pagos generosamente. Mas ouvimos falar de dezenas de executivos de alto escalão e ex-co-fundadores que deixaram a empresa para iniciar seus próprios empreendimentos de IA. Por outro lado, não devemos esperar o mesmo nível de transparência das empresas chinesas. O Reuters O relatório pode pintar uma imagem mais rosada do que realmente é.
No entanto, o relatório também observa que o Deepseek rapidamente se tornou uma história de sucesso na China, que Pequim abraça completamente. Não são apenas os engenheiros Deepseek que podem amar a empresa. O governo pode ter investigado as grandes compras de chips de AI da High-Flyer há alguns anos, incluindo esse cluster de 10.000 chips, mas o Deepseek agora é imensamente popular. A IA Deepseek está agora sendo integrada em várias áreas.
Cerca de 13 grandes governos da cidade e 10 empresas de energia estatal agora usam a IA Deepseek. Gigantes da tecnologia como Baidu, Lenovo e Tencent também começaram a adotá -lo.
Enquanto Reuters ‘ A história não pode ser confirmada, com certeza parece que a Deepseek está crescendo em popularidade entre as empresas chinesas e o governo, e esse tipo de apoio pode melhorar ainda mais a capacidade da empresa de competir contra o Openai, Google e outras grandes empresas de IA.
Enquanto isso, o mundo ocidental está pronto para implementar proibições Deepseek. Isso não é surpreendente. Deepseek pode ter se tornado viral, e Reuters mostra uma ótima imagem do funcionamento interno da empresa, mas a IA ainda tem problemas que os mercados ocidentais não podem tolerar.
Países como a Itália e a Coréia do Sul já anunciaram proibições na AI Deepseek. O governo dos EUA também está ponderando uma proibição mais ampla. A proibição está relacionada à privacidade dos dados do usuário. Todos os dados Deepseek vão para a China. O Deepseek também tem outros problemas, incluindo a ampla censura de tópicos relacionados à China e preocupações gerais de segurança da IA.
Com tudo isso em mente, está claro que o lançamento do Deepseek R2 que vem por May não pode chocar os mercados como seu antecessor. Mas certamente será interessante ver como o R2 compete contra ChatGPT, Gêmeos e outros na primavera.