Bahay Balita Ang mga gastos sa pag -unlad ng Deepseek AI ay isiniwalat: $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

Ang mga gastos sa pag -unlad ng Deepseek AI ay isiniwalat: $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

May-akda : Lily Apr 18,2025

Ang bagong chatbot ng Deepseek ay gumawa ng mga alon sa industriya ng AI, na nagpoposisyon sa sarili bilang isang kakila -kilabot na katunggali. Ipinakilala ng kumpanya ang AI nito sa nakakaintriga na tagline: "Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka." Ang matapang na pahayag na ito ay sumasalamin sa mga gumagamit, at ngayon, ang mga pagsulong ng Deepseek ay nag -ambag sa isa sa pinakamalaking pagbagsak ng presyo ng stock para sa NVIDIA, na itinampok ang epekto ng teknolohiya nito.

Pagsubok sa Deepseek Larawan: ensigame.com

Ang nagtatakda ng modelo ng Deepseek ay ang makabagong mga pamamaraan ng arkitektura at pagsasanay. Narito ang mga pangunahing teknolohiya na nagbibigay kapangyarihan sa AI nito:

Multi-Token Prediction (MTP): Hindi tulad ng tradisyonal na mga modelo na hinuhulaan ang isang salita nang sabay-sabay, ang diskarte sa MTP ng Deepseek ay hinuhulaan ang maraming mga salita nang sabay-sabay sa pamamagitan ng pagsusuri ng iba't ibang mga bahagi ng isang pangungusap. Ang pamamaraang ito ay nagpapabuti sa parehong kawastuhan at kahusayan ng modelo.

Paghahalo ng mga eksperto (MOE): Ang arkitektura na ito ay gumagamit ng iba't ibang mga neural network upang maproseso ang data ng pag -input. Pinapabilis nito ang pagsasanay sa AI at nagpapabuti sa pagganap. Sa Deepseek V3, 256 Neural Networks ay ginagamit, na may walong naaktibo para sa bawat gawain sa pagproseso ng token.

Multi-head latent pansin (MLA): Ang mekanismong ito ay nakatuon sa pinakamahalagang bahagi ng isang pangungusap. Ang mga MLA ay kumukuha ng mga pangunahing detalye mula sa mga fragment ng teksto nang paulit -ulit, binabawasan ang posibilidad ng nawawalang mahalagang impormasyon. Tinitiyak nito na kinukuha ng AI ang mga mahahalagang nuances sa data ng pag -input.

Deepseek v3 Larawan: ensigame.com

Ang Deepseek, isang kilalang pagsisimula ng Tsino, ay nagsasabing nakabuo ng isang mapagkumpitensyang modelo ng AI na may kaunting gastos, na nagsasabi na ginugol lamang nila ang $ 6 milyon sa pagsasanay sa malakas na neural network na Deepseek V3 at ginamit lamang ang 2048 na mga graphic processors. Gayunpaman, ang mga analyst mula sa semianalysis ay nagsiwalat na ang Deepseek ay nagpapatakbo ng isang malawak na imprastraktura ng computational na binubuo ng humigit -kumulang na 50,000 NVIDIA HOPPER GPU, kabilang ang 10,000 H800 unit, 10,000 mas advanced na H100s, at karagdagang mga H20 GPU. Ang mga mapagkukunang ito ay ipinamamahagi sa maraming mga sentro ng data at ginagamit para sa pagsasanay sa AI, pananaliksik, at pagmomolde sa pananalapi.

Ang kabuuang pamumuhunan ng kumpanya sa mga server ay nagkakahalaga ng halos $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na tinatayang $ 944 milyon. Ang Deepseek ay isang subsidiary ng Chinese Hedge Fund High-flyer, na nag-iwas sa pagsisimula bilang isang hiwalay na dibisyon na nakatuon sa mga teknolohiya ng AI noong 2023. Hindi tulad ng karamihan sa mga startup na nagrenta ng kapangyarihan ng computing mula sa mga tagapagbigay ng ulap, ang Deepseek ay nagmamay-ari ng sariling mga sentro ng data, na binibigyan ito ng ganap na kontrol sa pag-optimize ng modelo ng AI at pagpapagana ng mas malaking pagpapatupad ng mga makabagong ideya. Ang kumpanya ay nananatiling pondo sa sarili, na positibong nakakaapekto sa kakayahang umangkop at bilis ng paggawa ng desisyon.

DeepseekLarawan: ensigame.com

Bukod dito, ang ilang mga mananaliksik sa Deepseek ay kumita ng higit sa $ 1.3 milyon taun -taon, na umaakit sa nangungunang talento mula sa nangungunang unibersidad ng Tsino (ang kumpanya ay hindi umarkila ng mga dayuhang espesyalista). Kahit na isinasaalang -alang ito, ang kamakailang pag -angkin ng Deepseek sa pagsasanay sa pinakabagong modelo nito para sa $ 6 milyon lamang ay tila hindi makatotohanang. Ang figure na ito ay tumutukoy lamang sa gastos ng paggamit ng GPU sa panahon ng pre-pagsasanay at hindi account para sa mga gastos sa pananaliksik, pagpipino ng modelo, pagproseso ng data, o pangkalahatang mga gastos sa imprastraktura.

Mula nang ito ay umpisahan, ang Deepeek ay namuhunan ng higit sa $ 500 milyon sa pag -unlad ng AI. Gayunpaman, hindi tulad ng mga mas malalaking kumpanya na pasanin ng burukrasya, ang compact na istraktura ng Deepseek ay nagbibigay -daan sa aktibo at epektibong ipatupad ang mga makabagong AI.

DeepseekLarawan: ensigame.com

Ang halimbawa ng Deepseek ay nagpapakita na ang isang mahusay na pinondohan na independiyenteng kumpanya ng AI ay maaaring makipagkumpetensya sa mga pinuno ng industriya. Gayunpaman, binibigyang diin ng mga eksperto na ang tagumpay ng kumpanya ay higit sa lahat dahil sa bilyun -bilyong pamumuhunan, mga teknikal na tagumpay, at isang malakas na koponan, habang ang pag -angkin tungkol sa isang "rebolusyonaryong badyet" para sa pagbuo ng mga modelo ng AI ay medyo pinalaki. Gayunpaman, ang mga gastos sa mga kakumpitensya ay mananatiling mas mataas. Halimbawa, ihambing ang gastos ng pagsasanay sa modelo: Ang Deepseek ay gumugol ng $ 5 milyon sa R1, habang ang Chatgpt4O ay nagkakahalaga ng $ 100 milyon.

Mga pinakabagong artikulo Higit pa
  • Ang mga bata ng Morta ay nagdaragdag ng online co-op sa bagong pag-update

    Ang mga anak ni Mortaa, ang minamahal na top-down hack 'n Slash RPG na kilala para sa natatanging pamilya-sentrik na salaysay at mga elemento ng roguelike, ay naging mas nakakaengganyo sa pagdaragdag ng online co-op. Ang pinakabagong pag -update na ito ay nagdudulot ng isang sariwang sukat sa laro, na nagpapahintulot sa mga manlalaro na makipagtulungan sa mga kaibigan at

    Jun 26,2025
  • Inihayag ng DK Rap Composer ang kakulangan ng kredito sa pelikulang Super Mario Bros.

    Si Grant Kirkhope, ang na-acclaim na kompositor sa likod ng mga iconic na video game soundtracks tulad ng Donkey Kong 64, kamakailan ay nagbahagi ng mga pananaw sa kung bakit hindi siya na-kredito sa pelikulang Super Mario Bros para sa kanyang trabaho sa ngayon na walang kabuluhan na DK rap.in isang nagbubunyag na pakikipanayam sa Eurogamer, Kirkhope na ipinaliwanag na pagkatapos ng pagkatapos ng

    Jun 26,2025
  • DC Dark Legion ™: Ang mga nangungunang character na ipinakita

    DC: Nag -aalok ang Dark Legion ng isang malawak na roster ng mga maalamat na bayani at villain mula sa uniberso ng DC, na naghahatid ng isang malalim na madiskarteng karanasan kung saan ang komposisyon ng koponan at karakter na synergy ay naglalaro ng mga mahahalagang papel sa pagtukoy ng tagumpay. Kung nagtitipon ka ng isang malakas na superhero squad o gumawa ng isang makasalanan

    Jun 26,2025
  • Ang Pandoland at Hatsune Miku ay sumali sa mga puwersa para sa limitadong oras na blocky pakikipagsapalaran

    Sa isang kasiya-siyang pagsasanib ng virtual pop culture at mobile gaming, Pandoland, ang 3D open-world RPG na binuo ng Wonder Planet sa pakikipagtulungan sa Game Freak, ay nakatakdang tanggapin ang ilan sa mga pinaka-iconic na digital na bituin-Hatsune Miku, Kagamine Rin, at Kagamine Len. Ang mga minamahal na vocaloid artist ay hakbang

    Jun 26,2025
  • Danmachi Battle Chronicle EOS: Offline na bersyon upang manatili

    Ang tanyag na 3D Action RPG *Danmachi Battle Chronicle *, na opisyal na kilala bilang *Mali bang subukang kunin ang mga batang babae sa isang piitan? Ang Battle Chronicle*, ay inihayag ang pagtatapos ng serbisyo (EO). Ang layunin, ang developer ng laro at publisher, ay nakumpirma na ang pamagat ay permanenteng isasara.

    Jun 26,2025
  • Bumalik si Eevee para sa Pokémon Go Hulyo Community Day Classic

    Matapos ang Jangmo-O ay nagniningning sa araw ng pamayanan ng Pokémon Go sa ika-21, ang kaguluhan ay nagpapatuloy sa Hulyo. Ang spotlight ay lumilipat sa isang minamahal na paborito ng tagahanga para sa susunod na Community Day Classic. Si Eevee, ang Ebolusyon na Pokémon, ay magsasagawa sa gitna ng entablado sa katapusan ng linggo ng Hulyo 5 at ika -6, mula 2:00

    Jun 25,2025