Casa Notizia DeepSeek AI Development Costi rivelati: 1,6 miliardi di dollari, mito di debunking convenienza

DeepSeek AI Development Costi rivelati: 1,6 miliardi di dollari, mito di debunking convenienza

Autore : Lily Apr 18,2025

Il nuovo chatbot di Deepseek ha fatto ondate nel settore dell'IA, posizionandosi come un formidabile concorrente. La società ha introdotto la sua intelligenza artificiale con l'intrigante slogan: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti." Questa audace dichiarazione ha risuonato con gli utenti e oggi i progressi di Deepseek hanno contribuito a uno dei maggiori calo dei prezzi delle azioni per Nvidia, evidenziando l'impatto della sua tecnologia.

Test di DeepSeek Immagine: Ensigame.com

Ciò che distingue il modello di DeepSeek è la sua architettura innovativa e metodi di formazione. Ecco le tecnologie chiave che alimentano la sua AI:

Multi-Token Prediction (MTP): a differenza dei modelli tradizionali che prevedono una parola alla volta, l'approccio MTP di Deepseek prevede più parole contemporaneamente analizzando diverse parti di una frase. Questo metodo migliora sia l'accuratezza che l'efficienza del modello.

Miscela di esperti (MOE): questa architettura impiega varie reti neurali per elaborare i dati di input. Accelera la formazione dell'intelligenza artificiale e migliora le prestazioni. In DeepSeek V3, vengono utilizzate 256 reti neurali, con otto attivate per ciascuna attività di elaborazione dei token.

Attenzione latente multi-testa (MLA): questo meccanismo si concentra sulle parti più significative di una frase. MLA estrae ripetutamente i dettagli chiave dai frammenti di testo, riducendo la probabilità di perdere informazioni importanti. Ciò garantisce che l'IA cattura sfumature cruciali nei dati di input.

DeepSeek V3 Immagine: Ensigame.com

DeepSeek, un'importante startup cinese, afferma di aver sviluppato un modello di intelligenza artificiale competitivo con costi minimi, affermando di aver speso solo $ 6 milioni per formare la potente rete neurale Deepseek V3 e di aver utilizzato solo 2048 processori grafici. Tuttavia, gli analisti della seminalisi hanno rivelato che DeepSeek gestisce una vasta infrastruttura computazionale che comprende circa 50.000 GPU di Nvidia Hopper, tra cui 10.000 unità H800, 10.000 H100 più avanzati e GPU H20 aggiuntive. Queste risorse sono distribuite su diversi data center e sono utilizzate per la formazione, la ricerca e la modellazione finanziaria dell'IA.

L'investimento totale della società nei server ammonta a circa $ 1,6 miliardi, con spese operative stimate in $ 944 milioni. DeepSeek è una consociata dell'Hedge Fund cinese High-Flyer, che ha lasciato la startup come una divisione separata focalizzata sulle tecnologie di intelligenza artificiale nel 2023. A differenza della maggior parte delle startup che affittano il potere di calcolo dai fornitori di cloud, Deepseek possiede i propri data center, dando il pieno controllo sull'ottimizzazione dei modelli di intelligenza artificiale e che emettono l'implementazione più secca delle innovazioni. L'azienda rimane autofinanziata, il che influisce positivamente sulla sua flessibilità e velocità decisionale.

Deep -Week Immagine: Ensigame.com

Inoltre, alcuni ricercatori di DeepSeek guadagnano oltre $ 1,3 milioni all'anno, attirando i migliori talenti dalle principali università cinesi (la società non assume specialisti stranieri). Anche considerando questo, la recente affermazione di Deepseek di addestrare il suo ultimo modello per soli $ 6 milioni sembra irrealistica. Questa cifra si riferisce solo al costo dell'utilizzo della GPU durante il pre-allenamento e non tiene conto delle spese di ricerca, del perfezionamento del modello, dell'elaborazione dei dati o dei costi complessivi di infrastruttura.

Fin dalla sua istituzione, DeepSeek ha investito oltre $ 500 milioni nello sviluppo dell'IA. Tuttavia, a differenza delle più grandi aziende gravate dalla burocrazia, la struttura compatta di Deepseek gli consente di implementare attivamente ed efficacemente le innovazioni di intelligenza artificiale.

Deep -Week Immagine: Ensigame.com

L'esempio di DeepSeek dimostra che una società di intelligenza artificiale indipendente ben finanziata può competere con i leader del settore. Tuttavia, gli esperti sottolineano che il successo dell'azienda è in gran parte dovuto a miliardi di investimenti, scoperte tecniche e un team forte, mentre le affermazioni su un "budget rivoluzionario" per lo sviluppo di modelli di intelligenza artificiale sono in qualche modo esagerate. Tuttavia, i costi dei concorrenti rimangono significativamente più alti. Ad esempio, confronta il costo della formazione del modello: DeepSeek ha speso $ 5 milioni su R1, mentre CHATGPT4O costa $ 100 milioni.

Ultimi articoli Di più

Espansione di Giove: il più grande aggiornamento dei mercenari stellari rilasciati

Fino ad oggi i mercenari stellari hanno appena scatenato il più grande aggiornamento con l'espansione di Giove, quasi raddoppiando il contenuto del gioco con una serie di nuovi mondi, fazioni, missioni, navi e attrezzature. Questo emozionante aggiornamento introduce l'impero gioviano e il consiglio dei pirati, due fazioni bloccato in un fermo
Apr 21,2025
BAFTA Nomi "videogiochi più influenti" - Scelta sorprendente rivelata

BAFTA, l'ente benefico artistico indipendente del Regno Unito che onora l'eccellenza nei film, nei giochi e nella TV, ha svelato quello che considera il videogioco più influente di sempre. E potrebbe sorprenderti: non sono i soliti sospetti come GTA, Tetris o Minecraft. Secondo un sondaggio pubblico condotto da BAFTA, il gioco t
Apr 21,2025
Firaxis Suggerimenti a Nintendo Switch 2 'Mouse' Joy-Con per la civiltà 7

Se hai visto Nintendo Switch 2 rivelare il video, potresti aver notato quella che sembrava essere una modalità "mouse" per i Joy-Cons. Nel trailer di rivelazione, una coppia di Joy-contro distaccati viene mostrata abbassata su una superficie, il lato attaccante verso il basso. Si collegano a una coppia di connettori che sembrano avere relative
Apr 21,2025
Samsung OLED TVS: modelli da 65 "e 77" in vendita prima del Super Bowl

Le TV OLED più economiche più economiche di Samsung sono attualmente in vendita, assicurando che possano essere consegnate in tempo per il Super Bowl domenica il 9 febbraio. Puoi prendere un modello da 65 pollici 2024 per soli $ 998 o optare per il modello esteso da 77 pollici con un notevole $ 1.599. Questi prezzi sono tra i migliori
Apr 21,2025
"Guida al completamento della mappa del bodpiece felino in dichiarato"

Durante la tua avventura in *dichiarato *, inciampererai su varie mappe del tesoro, ognuna portando a emozionanti ricompense. La prima mappa che probabilmente incontrerai è la mappa intimidatoria del lacci Feline. Ecco una guida dettagliata su come completarlo e rivendicare il tuo premio in *dichiarato *. Dove ottenere l'intimi
Apr 21,2025
Sonic Rumble: Battle Royale lancia in tutto il mondo il mese prossimo

Sonic Rumble, il tanto atteso gioco di Battle Royale, verrà lanciato il mese prossimo, segnando un'aggiunta significativa alla scena di gioco mobile. Previsto per il rilascio l'8 maggio, questo nuovo entusiasmante titolo sarà disponibile su piattaforme iOS e Android. I fan desiderosi di saltare in azione possono
Apr 21,2025