O que é Deepseek, a startup de IA da China enviando ondas de choque através da tecnologia global? | Tecnologia

José Gomes - Da Amazônia para o Mundo! contato@acre.com.br

1 ano atrás

A Deepseek, uma startup chinesa pouco conhecida, enviou ondas de choque através do setor de tecnologia global com o lançamento de um modelo de inteligência artificial (AI) cujas capacidades rivalizam com as criações do Google e do Openai.

O criador da Deepseek-R1 diz que seu modelo foi desenvolvido usando lascas de computador menos avançadas e menos, do que as empregadas por gigantes da tecnologia nos Estados Unidos.

Em um artigo de pesquisa divulgado na semana passada, a equipe de desenvolvimento do modelo disse que gastou menos de US $ 6 milhões em computação para treinar o modelo-uma fração dos orçamentos de IA multibilionários de bilhões de dólares desfrutados por gigantes da tecnologia dos EUA, como Openai, Alphabet e Meta.

Marc Andreessen, um dos capitalistas mais influentes de risco de tecnologia do Vale do Silício, saudou o lançamento do modelo como “o momento do Sputnik da AI”.

O repentino surgimento de uma pequena startup chinesa capaz de rivalizar com os principais jogadores do Vale do Silício contestou suposições sobre o domínio dos EUA na IA e levantou temores de que as avaliações de mercado altíssimas de empresas como Nvidia, alfabeto e meta possam ser destacadas da realidade.

Na segunda-feira, a NVIDIA, que mantém o quase monopólio de produzir os semicondutores que alimentam a IA generativa, Perdeu quase US $ 600 bilhões em capitalização de mercado depois que suas ações despencaram 17 %.

O presidente dos EUA, Donald Trump, que anunciou na semana passada o lançamento de uma iniciativa de AI de US $ 500 bilhões liderada pelo Oracle, com sede no Texas e pelo Japão, disse que a Deepseek deve servir como um “alerta” na necessidade de a indústria dos EUA ser ” Focada a laser em competir para vencer ”.

O que é Deepseek?

A Deepseek, baseada em Hangzhou, foi fundada no final de 2023 por Liang Wenfeng, um empresário em série que também administra o fundo de hedge.

Embora pouco conhecido fora da China, Liang tem uma extensa história de combinar tecnologias em expansão e investir.

Em 2013, ele co-fundou a Hangzhou Jacobi Investment Management, uma empresa de investimentos que empregou IA para implementar estratégias de negociação, juntamente com um co-alumnus da Universidade de Zhejiang, de acordo com o Finance Sina Finance Sina.

A Liang estabeleceu mais duas empresas focadas no investimento dirigido por computador-a Hangzhou Huanfang Technology Co e a Ningbo Huanfang Quantitative Investment Management Partnership-em 2015 e 2016, respectivamente.

Em uma entrevista às ondas chinesas de mídia em 2023, Liang descartou a sugestão de que era tarde demais para as startups se envolverem na IA ou que deveria ser considerada proibitivamente cara.

“Somente a reprodução é relativamente barata-com base em documentos públicos e código de código aberto, tempos mínimos de treinamento ou mesmo ajustes finos, são suficientes. Pesquisas, no entanto, envolvem extensos experimentos, comparações e maiores demandas computacionais e de talentos ”, disse Liang, de acordo com uma tradução de seus comentários publicados pelo Chinatalk Substack.

Liang disse que seu interesse pela IA foi impulsionado principalmente por “curiosidade”.

“De uma perspectiva mais ampla, queremos validar certas hipóteses. Por exemplo, levantamos a hipótese de que a essência da inteligência humana pode ser a linguagem, e o pensamento humano poderia ser essencialmente um processo linguístico ”, disse ele, segundo a transcrição.

“O que você acha como ‘pensar’ pode ser sua linguagem de tecelagem de cérebro. Isso sugere que a AGI do tipo humano poderia emergir de grandes modelos de linguagem ”, acrescentou, referindo-se à inteligência geral artificial (AGI), um tipo de IA que tenta imitar as habilidades cognitivas da mente humana.

Deepseek não respondeu imediatamente a um pedido de comentário.

Na segunda -feira, Gregory Zuckerman, jornalista do Wall Street Journal, disse que havia aprendido que Liang, do qual ele não tinha ouvido anterior .

“Simons deixou um impacto profundo, aparentemente”, escreveu Zuckerman em uma coluna, descrevendo como Liang elogiou seu livro como um tomo que “desvenda muitos mistérios anteriormente não resolvidos e nos traz uma riqueza de experiências para aprender”.

“Até minha mãe não tirou muito do livro”, escreveu Zuckerman.

Por que a Deepseek conquistou o mundo da tecnologia?

Simplificando, o sucesso da empresa levantou questões existenciais sobre a abordagem da IA sendo adotada pelo Vale do Silício e pelo governo dos EUA.

Presume-se que as empresas de tecnologia dos EUA tenham uma vantagem crítica na IA, principalmente por causa de seu tamanho enorme, o que lhes permite atrair os melhores talentos de todo o mundo e investir grandes somas na construção de data centers e na compra de grandes quantidades de alto custo caro- Gradecos finais.

A chegada de Deepseek ao local contestou a suposição de que são necessários bilhões de dólares para estar na vanguarda da IA.

“O OpenAI foi fundado há 10 anos, tem 4.500 funcionários e levantou US $ 6,6 bilhões em capital. A Deepseek foi fundada há menos de 2 anos, tem 200 funcionários e foi desenvolvida por menos de US $ 10 milhões ”, disse Adam Kobeissi, fundador do boletim de análise de análise de mercado, a carta de Kobeissi, na segunda -feira.

“Como estão essas duas empresas agora concorrentes?”

Em seu trabalho de pesquisa, os engenheiros da Deepseek disseram que usaram cerca de 2.000 chips Nvidia H800, que são menos avançados do que os chips de ponta, para treinar seu modelo.

A equipe disse que utilizou vários modelos especializados trabalhando juntos para permitir chips mais lentos para analisar dados com mais eficiência.

Para o governo dos EUA, a chegada de Deepseek em cena levantou questões sobre sua estratégia de tentar conter os avanços da IA da China restringindo as exportações de chips de ponta.

O artigo de pesquisa da Deepseek sugere que os chips mais avançados não são necessários para criar modelos de IA de alto desempenho ou que as empresas chinesas ainda podem obter chips em quantidades suficientes-ou uma combinação de ambos.

Os chips H800 da NVIDIA, com sede na Califórnia, que foram projetados para cumprir os controles de exportação dos EUA, foram exportados livremente para a China até outubro de 2023, quando a administração do então presidente Joe Biden os adicionou à sua lista de itens restritos.

Em sua entrevista de 2023 com o Waves, Lian disse que sua empresa armazenou 10.000 GPUs da NVIDIA A100 antes de serem banidos para exportação. As GPUs, ou unidades de processamento de gráficos, são circuitos eletrônicos usados para acelerar gráficos e processamento de imagens em dispositivos de computação.

Tanishq Abraham, ex -diretor de pesquisa da estabilidade da IA, disse que não ficou surpreso com o nível de progresso da China na IA, dado o lançamento de vários modelos por empresas chinesas, como Alibaba e Baichuan.

“Embora tenha havido restrições à capacidade da China de obter GPUs, a China ainda conseguiu inovar e espremer o desempenho do que eles têm”, disse Abraham à Al Jazeera.

“Eu acho que é uma lição para as empresas nós que ainda há muito desempenho que elas possam esboçar”.

Tara Javidi, co-diretora do Center for Machine Intelligence, Computing and Security da Universidade da Califórnia em San Diego, disse que Deepseek a deixou animada com o “rápido progresso” ocorrendo no desenvolvimento de IA em todo o mundo.

“Minha única esperança é que a atenção dada a este anúncio promova um maior interesse intelectual no tópico, expanda ainda mais o pool de talentos e, por último, mas não menos importante, aumente o investimento privado e público na pesquisa de IA nos EUA”, disse Javidi à Al Jazeera

A Bolsa de Valores de Nova York na abertura em 27 de janeiro de 2025 (Angela Weiss/AFP)

Enquanto isso, a confiança dos investidores no cenário técnico dos EUA foi atingida – pelo menos no curto prazo.

Além do slide dramático da Nvidia, o Google Parent Alphabet e a Microsoft viram na segunda -feira que os preços das ações caíram 4,03 % e 2,14 %, respectivamente, embora a Apple e a Amazon tenham terminado mais alto.

“Se os números de custo da Deepseek são reais, agora praticamente qualquer grande organização em qualquer empresa pode construí -lo e hospedá -lo”, disse Tim Miller, professor especializado em IA na Universidade de Queensland, à Al Jazeera.

“Então, nesse sentido, o jogo mudou completamente porque há uma nova ‘regra’ que qualquer um pode jogar”.

Isso significa que a China está vencendo a corrida de IA?

Não necessariamente.

Embora os analistas de tecnologia concordem amplamente que o DeepSeek-R1 se apresenta em um nível semelhante ao ChatGPT-ou até melhor para determinadas tarefas-o campo está se movendo rapidamente.

O CEO da Openai, Sam Altman, disse no início deste mês que a empresa lançaria seu mais recente modelo de AI de raciocínio, O3 Mini, poucas semanas depois de considerar o feedback do usuário.

Na segunda-feira, Altman reconheceu que o Deepseek-R1 era “impressionante” enquanto defendia o foco de sua empresa em maior poder de computação.

“Obviamente, entregaremos modelos muito melhores e também é legítimo revigorante ter um novo concorrente! Vamos retirar alguns lançamentos ”, disse Altman no X.

“Mas, principalmente, estamos entusiasmados em continuar executando em nosso roteiro de pesquisa e acreditamos que mais computação é mais importante agora do que nunca para ter sucesso em nossa missão”.

Abraham, ex -diretor de pesquisa da estabilidade da IA, disse que as percepções também podem ser distorcidas pelo fato de que, diferentemente da Deepseek, empresas como o OpenAI não disponibilizaram seus modelos mais avançados gratuitamente ao público.

“O Deepseek disponibilizou seu melhor modelo gratuitamente para usar. Por outro lado, o melhor modelo do OpenAI não é gratuito ”, disse ele.

“Portanto, a maioria das pessoas que usa o ChatGPT gratuitamente fica chocada com a Deepseek e acredita que há um grande salto nas capacidades quando o OpenAI já teve um modelo de desempenho semelhante por alguns meses. Essa parede salarial dos modelos de IA da Frontier leva a pessoas que não entendem verdadeiramente o progresso e as capacidades da IA. ”

Miller, professor da Universidade de Queensland, disse que os avanços de Deepseek e outros desenvolvimentos recentes sugerem que a China está pelo menos “lá em cima” com os EUA na IA.

“Eu fiz uma previsão descartável no final do ano passado que o próximo avanço científico da IA poderia vir de um pequeno jogador, como um pesquisador universitário individual que não tem acesso a muito poder de computação – eles precisariam ser mais inteligentes para competir, “Ele disse.

“O aparente progresso de Deepseek é quase um exemplo disso: por não ter poder computacional suficiente para criar modelos tão grandes quanto o chatgpt, eles tiveram que ser inteligentes. A necessidade é a mãe da invenção. ”