Lar Notícias Os custos de desenvolvimento da AI Deepseek revelaram: US $ 1,6 bilhão, desmascarando o mito da acessibilidade

Os custos de desenvolvimento da AI Deepseek revelaram: US $ 1,6 bilhão, desmascarando o mito da acessibilidade

Autor : Lily Apr 18,2025

O novo chatbot de Deepseek fez ondas na indústria de IA, posicionando -se como um concorrente formidável. A empresa apresentou sua IA com o slogan intrigante: "Olá, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê -lo". Esta declaração ousada ressoou com os usuários e, hoje, os avanços da Deepseek contribuíram para uma das maiores quedas de preço das ações da NVIDIA, destacando o impacto de sua tecnologia.

Teste Deepseek Imagem: Ensigame.com

O que diferencia o modelo de Deepseek é seus métodos inovadores de arquitetura e treinamento. Aqui estão as principais tecnologias que alimentam sua IA:

Previsão com vários toques (MTP): Ao contrário dos modelos tradicionais que prevêem uma palavra de cada vez, a abordagem MTP da Deepseek prevê várias palavras simultaneamente analisando diferentes partes de uma frase. Este método aprimora a precisão e a eficiência do modelo.

Mistura de especialistas (MOE): Esta arquitetura emprega várias redes neurais para processar dados de entrada. Acelera o treinamento da IA ​​e melhora o desempenho. Em Deepseek V3, 256 redes neurais são utilizadas, com oito sendo ativados para cada tarefa de processamento de token.

Atenção latente de várias cabeças (MLA): Esse mecanismo se concentra nas partes mais significativas de uma frase. O MLA extrai os principais detalhes dos fragmentos de texto repetidamente, reduzindo a probabilidade de perder informações importantes. Isso garante que a IA capture nuances cruciais nos dados de entrada.

Deepseek v3 Imagem: Ensigame.com

A Deepseek, uma proeminente startup chinesa, afirma ter desenvolvido um modelo competitivo de IA com custos mínimos, afirmando que gastou apenas US $ 6 milhões no treinamento da poderosa rede neural Deepseek V3 e usou apenas 2048 processadores gráficos. No entanto, analistas da semiânica revelaram que a DeepSeek opera uma vasta infraestrutura computacional, compreendendo aproximadamente 50.000 GPUs NVIDIA Hopper, incluindo 10.000 unidades H800, 10.000 H100s mais avançados e GPUs H20 adicionais. Esses recursos são distribuídos em vários data centers e são utilizados para treinamento, pesquisa e modelagem financeira de IA.

O investimento total da empresa em servidores é de cerca de US $ 1,6 bilhão, com despesas operacionais estimadas em US $ 944 milhões. A Deepseek é uma subsidiária do fundo de hedge chinês High-Flyer, que saiu da startup como uma divisão separada focada nas tecnologias de IA em 2023. Ao contrário da maioria das startups que alugam o poder de computação de fornecedores de nuvem, a DeepSeek possui seus próprios data centers, oferecendo controle total sobre o otimização do modelo de IA e a implementação mais rápida de inovações. A empresa permanece auto-financiada, o que afeta positivamente sua flexibilidade e velocidade de tomada de decisão.

DeepseekImagem: Ensigame.com

Além disso, alguns pesquisadores da Deepseek ganham mais de US $ 1,3 milhão anualmente, atraindo os principais talentos das principais universidades chinesas (a empresa não contrata especialistas estrangeiros). Mesmo considerando isso, a recente reivindicação da Deepseek de treinar seu modelo mais recente por apenas US $ 6 milhões parece irrealista. Este número refere-se apenas ao custo do uso da GPU durante o pré-treinamento e não explica despesas de pesquisa, refinamento de modelos, processamento de dados ou custos gerais de infraestrutura.

Desde a sua criação, a Deepseek investiu mais de US $ 500 milhões em desenvolvimento de IA. No entanto, diferentemente das empresas maiores sobrecarregadas pela burocracia, a estrutura compacta da Deepseek permite que ela implemente ativamente e efetivamente as inovações de IA.

DeepseekImagem: Ensigame.com

O exemplo da Deepseek demonstra que uma empresa independente de IA independente pode competir com os líderes do setor. No entanto, os especialistas enfatizam que o sucesso da empresa se deve em grande parte a bilhões de investimentos, avanços técnicos e uma equipe forte, enquanto as reivindicações sobre um "orçamento revolucionário" para o desenvolvimento de modelos de IA são um pouco exageradas. Ainda assim, os custos dos concorrentes permanecem significativamente maiores. Por exemplo, compare o custo do treinamento do modelo: Deepseek gastou US $ 5 milhões em R1, enquanto o ChatGPT4O custou US $ 100 milhões.

Artigos Mais Recentes Mais
  • Expansão de Júpiter: a maior atualização dos mercenários estelares lançada

    O Stellar Mercenaries acaba de lançar sua maior atualização até o momento com a expansão de Júpiter, quase dobrando o conteúdo do jogo com uma variedade de novos mundos, facções, missões, navios e equipamentos. Esta atualização emocionante apresenta o Império Joviano e o Conselho de Piratas, duas facções trancadas em um Fierc

    Apr 21,2025
  • BAFTA nomes 'Video de videogame mais influente' - Escolha surpreendente revelada

    A BAFTA, a instituição de caridade Independent Arts do Reino Unido que homenageia a excelência em cinema, jogos e TV, revelou o que considera o videogame mais influente de todos os tempos. E pode surpreendê -lo - não são os suspeitos de sempre como GTA, Tetris ou Minecraft. De acordo com uma pesquisa pública realizada pelo BAFTA, o jogo T

    Apr 21,2025
  • Firaxis sugere o Nintendo Switch 2 'Mouse' Joy-Con para a civilização 7

    Se você assistiu ao vídeo da Nintendo Switch 2 Reveal, deve ter notado o que parecia ser um modo de 'mouse' para os Joy-Cons. No trailer de revelação, um par de joy-consactes destacados é mostrado sendo abaixado em uma superfície, com o lado do anexo para baixo. Eles se conectam a um par de conectores que parecem ter relat

    Apr 21,2025
  • Samsung OLED TVs: 65 "& 77" Modelos à venda antes do Super Bowl

    Atualmente, as TVs OLED de tela grande mais amigável da Samsung estão à venda, garantindo que elas possam ser entregues a tempo do Super Bowl no domingo em 9 de fevereiro. Você pode pegar um modelo de 2024 polegadas por apenas US $ 998 ou optar pelo amplo modelo de 77 polegadas em US $ 1.599. Esses preços estão entre os melhores que você '

    Apr 21,2025
  • "Guia para concluir o mapa de codificina felina em Avó"

    Ao longo de sua aventura em *declarado *, você tropeçará em vários mapas de tesouro, cada um levando a recompensas emocionantes. O primeiro mapa que você provavelmente encontrará é o mapa intimidador de codificina felina. Aqui está um guia detalhado sobre como concluí -lo e reivindicar seu prêmio em *declarado *. Onde conseguir o Intimi

    Apr 21,2025
  • Sonic Rumble: Battle Royale lança em todo o mundo no próximo mês

    Sonic Rumble, o altamente esperado jogo de Battle Royale, deve ser lançado no próximo mês, marcando uma adição significativa ao cenário de jogos móveis. Programado para lançamento em 8 de maio, este novo e emocionante título estará disponível nas plataformas iOS e Android. Os fãs ansiosos para pular na ação podem

    Apr 21,2025