Rumah Berita Kos Pembangunan AI DeepSeek Terungkap: $ 1.6 bilion, Membebaskan Mitos Kemampuan

Kos Pembangunan AI DeepSeek Terungkap: $ 1.6 bilion, Membebaskan Mitos Kemampuan

Pengarang : Lily Apr 18,2025

Chatbot baru Deepseek telah membuat gelombang dalam industri AI, meletakkan dirinya sebagai pesaing yang hebat. Syarikat itu memperkenalkan AI dengan tagline yang menarik: "Hai, saya telah dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." Kenyataan berani ini telah bergema dengan pengguna, dan hari ini, kemajuan DeepSeek telah menyumbang kepada salah satu penurunan harga saham terbesar untuk Nvidia, yang menonjolkan kesan teknologinya.

Ujian DeepSeek Imej: ensigame.com

Apa yang membezakan model DeepSeek adalah kaedah seni bina dan latihan yang inovatif. Berikut adalah teknologi utama yang menguasai ai:

Ramalan Multi-Token (MTP): Tidak seperti model tradisional yang meramalkan satu perkataan pada satu masa, pendekatan MTP DeepSeek meramalkan pelbagai perkataan secara serentak dengan menganalisis bahagian-bahagian yang berlainan dari satu ayat. Kaedah ini meningkatkan ketepatan dan kecekapan model.

Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf untuk memproses data input. Ia mempercepatkan latihan AI dan meningkatkan prestasi. Di Deepseek V3, 256 rangkaian saraf digunakan, dengan lapan diaktifkan untuk setiap tugas pemprosesan token.

Perhatian Laten Multi-Head (MLA): Mekanisme ini memberi tumpuan kepada bahagian-bahagian yang paling penting dalam satu kalimat. MLA mengekstrak butiran utama dari serpihan teks berulang kali, mengurangkan kemungkinan maklumat penting yang hilang. Ini memastikan AI menangkap nuansa penting dalam data input.

DeepSeek V3 Imej: ensigame.com

DeepSeek, permulaan Cina yang terkenal, mendakwa telah membangunkan model AI yang kompetitif dengan kos yang minimum, menyatakan bahawa mereka hanya menghabiskan $ 6 juta untuk melatih rangkaian saraf yang kuat DeepSeek V3 dan hanya menggunakan pemproses grafik 2048. Walau bagaimanapun, penganalisis dari semianalisis telah mendedahkan bahawa DeepSeek mengendalikan infrastruktur pengkomputeran yang luas yang terdiri daripada kira -kira 50,000 GPU NVIDIA Hopper, termasuk 10,000 H800 unit, 10,000 lebih maju H100S, dan GPU tambahan H20. Sumber -sumber ini diedarkan di beberapa pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.

Jumlah pelaburan syarikat dalam pelayan berjumlah sekitar $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta. DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang memancarkan permulaan sebagai bahagian yang berasingan yang memberi tumpuan kepada teknologi AI pada tahun 2023. Syarikat itu tetap dibiayai sendiri, yang memberi kesan positif kepada kelonggaran dan kelajuan membuat keputusan.

DeepseekImej: ensigame.com

Lebih -lebih lagi, beberapa penyelidik di DeepSeek memperoleh lebih dari $ 1.3 juta setiap tahun, menarik bakat teratas dari universiti -universiti China yang terkemuka (syarikat itu tidak mengupah pakar asing). Walaupun memandangkan ini, tuntutan DeepSeek baru -baru ini melatih model terkini untuk hanya $ 6 juta nampaknya tidak realistik. Angka ini hanya merujuk kepada kos penggunaan GPU semasa latihan pra-latihan dan tidak mengambil kira perbelanjaan penyelidikan, penghalusan model, pemprosesan data, atau kos infrastruktur keseluruhan.

Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Walau bagaimanapun, tidak seperti syarikat yang lebih besar yang dibebani oleh birokrasi, struktur padat DeepSeek membolehkannya secara aktif dan berkesan melaksanakan inovasi AI.

DeepseekImej: ensigame.com

Contoh DeepSeek menunjukkan bahawa syarikat AI bebas yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar menekankan bahawa kejayaan syarikat itu sebahagian besarnya disebabkan oleh berbilion -bilion dalam pelaburan, penemuan teknikal, dan pasukan yang kuat, sementara tuntutan tentang "anggaran revolusioner" untuk membangunkan model AI agak dibesar -besarkan. Namun, kos pesaing kekal lebih tinggi. Sebagai contoh, bandingkan kos latihan model: DeepSeek membelanjakan $ 5 juta pada R1, manakala CHATGPT4O berharga $ 100 juta.

Artikel terkini Lagi
  • Pengembangan Jupiter: Kemas kini terbesar Urascenaries Stellar yang dikeluarkan

    Mercenaries bintang baru saja melepaskan kemas kini terbesarnya sehingga kini dengan pengembangan Jupiter, hampir menggandakan kandungan permainan dengan pelbagai dunia, puak, misi, kapal, dan gear baru. Kemas kini mendebarkan ini memperkenalkan Empayar Jovian dan Majlis Pirate, dua puak terkunci di Fierc

    Apr 21,2025
  • Nama BAFTA 'Permainan Video Paling Berpengaruh' - Pilihan Mengejutkan Terungkap

    BAFTA, amal seni bebas UK yang menghormati kecemerlangan dalam filem, permainan, dan TV, telah melancarkan apa yang dianggapnya permainan video yang paling berpengaruh. Dan ia mungkin mengejutkan anda -bukan suspek biasa seperti GTA, Tetris, atau Minecraft. Menurut tinjauan awam yang dijalankan oleh BAFTA, permainan t

    Apr 21,2025
  • Petunjuk Firaxis di Nintendo Switch 2 'Mouse' Joy-Con untuk Tamadun 7

    Jika anda menonton video Nintendo Switch 2 mendedahkan, anda mungkin melihat apa yang kelihatan sebagai mod 'tetikus' untuk kegembiraan. Dalam treler yang mendedahkan, sepasang kegembiraan yang terpisah ditunjukkan diturunkan ke permukaan, sisi lampiran ke bawah. Mereka menyambung ke sepasang penyambung yang nampaknya mempunyai relat

    Apr 21,2025
  • Samsung OLED TVS: 65 "& 77" Model Dijual Sebelum Super Bowl

    TV OLED skrin besar yang paling mesra bajet Samsung sedang dijual, memastikan mereka dapat disampaikan tepat pada masanya untuk Super Bowl Ahad pada 9 Februari. Anda boleh merebut model 65-inci untuk hanya $ 998, atau memilih model 77 inci yang luar biasa pada $ 1,599 yang luar biasa. Harga ini adalah antara yang terbaik anda '

    Apr 21,2025
  • "Panduan untuk Melengkapkan Peta Codpiece Feline di Avowed"

    Sepanjang pengembaraan anda di *Avowed *, anda akan tersandung pada pelbagai peta harta, masing -masing membawa kepada ganjaran yang menarik. Peta pertama yang mungkin anda hadapi adalah peta codpiece kucing yang menakutkan. Berikut adalah panduan terperinci mengenai cara menyelesaikannya dan menuntut hadiah anda di *avowed *. Di mana untuk mendapatkan intimi

    Apr 21,2025
  • Sonic Rumble: Battle Royale dilancarkan di seluruh dunia bulan depan

    Sonic Rumble, permainan pertempuran Royale-esque yang sangat dinanti-nantikan, ditetapkan untuk dilancarkan bulan depan, menandakan tambahan penting kepada adegan permainan mudah alih. Dijadualkan untuk dibebaskan pada 8 Mei, tajuk baru yang menarik ini akan tersedia di kedua -dua platform iOS dan Android. Peminat tidak sabar -sabar untuk melompat ke dalam tindakan boleh

    Apr 21,2025