ডিপসেকের নতুন চ্যাটবট এআই শিল্পে তরঙ্গ তৈরি করেছে, নিজেকে একটি শক্তিশালী প্রতিযোগী হিসাবে অবস্থান করে। সংস্থাটি তার এআইকে আকর্ষণীয় ট্যাগলাইন দিয়ে প্রবর্তন করেছিল: "হাই, আমি তৈরি হয়েছিল যাতে আপনি কিছু জিজ্ঞাসা করতে পারেন এবং এমন একটি উত্তর পেতে পারেন যা আপনাকে অবাক করে দিতে পারে।" এই সাহসী বিবৃতিটি ব্যবহারকারীদের সাথে অনুরণিত হয়েছে এবং আজ, ডিপসিকের অগ্রগতি এনভিআইডিআইএর জন্য বৃহত্তম স্টক মূল্য হ্রাসের একটিতে অবদান রেখেছে, যা এর প্রযুক্তির প্রভাবকে তুলে ধরে।
চিত্র: ensigame.com
ডিপসিকের মডেলকে কী আলাদা করে দেয় তা হ'ল এর উদ্ভাবনী স্থাপত্য এবং প্রশিক্ষণের পদ্ধতি। এখানে মূল প্রযুক্তিগুলি রয়েছে যা এর এআইকে শক্তি দেয়:
মাল্টি-টোকেন পূর্বাভাস (এমটিপি): traditional তিহ্যবাহী মডেলগুলির বিপরীতে যা একবারে একটি শব্দের পূর্বাভাস দেয়, ডিপসিকের এমটিপি পদ্ধতির এক সাথে একাধিক শব্দের পূর্বাভাস দেয় যা একটি বাক্যটির বিভিন্ন অংশ বিশ্লেষণ করে একসাথে একাধিক শব্দের পূর্বাভাস দেয়। এই পদ্ধতিটি মডেলের যথার্থতা এবং দক্ষতা উভয়ই বাড়িয়ে তোলে।
বিশেষজ্ঞদের মিশ্রণ (এমওই): এই আর্কিটেকচারটি ইনপুট ডেটা প্রক্রিয়া করতে বিভিন্ন নিউরাল নেটওয়ার্ক নিয়োগ করে। এটি এআই প্রশিক্ষণকে ত্বরান্বিত করে এবং কর্মক্ষমতা উন্নত করে। ডিপসেক ভি 3 -তে, 256 নিউরাল নেটওয়ার্কগুলি ব্যবহার করা হয়, প্রতিটি টোকেন প্রসেসিং টাস্কের জন্য আটটি সক্রিয় করা হয়।
মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ): এই প্রক্রিয়াটি একটি বাক্যটির সর্বাধিক উল্লেখযোগ্য অংশগুলিতে মনোনিবেশ করে। বিধায়ক গুরুত্বপূর্ণ তথ্য অনুপস্থিতির সম্ভাবনা হ্রাস করে বারবার পাঠ্য খণ্ডগুলি থেকে মূল বিবরণগুলি বের করে। এটি এআই ইনপুট ডেটাতে গুরুত্বপূর্ণ সংক্ষিপ্তসারগুলি ক্যাপচার করে তা নিশ্চিত করে।
চিত্র: ensigame.com
বিশিষ্ট চীনা স্টার্টআপ ডিপসেক দাবি করেছেন যে তারা ন্যূনতম ব্যয় সহ একটি প্রতিযোগিতামূলক এআই মডেল তৈরি করেছে, তারা উল্লেখ করে যে তারা শক্তিশালী নিউরাল নেটওয়ার্ক ডিপসেক ভি 3 প্রশিক্ষণের জন্য মাত্র million মিলিয়ন ডলার ব্যয় করেছে এবং কেবল 2048 গ্রাফিক্স প্রসেসর ব্যবহার করেছে। তবে, সেমিয়ানালাইসিসের বিশ্লেষকরা প্রকাশ করেছেন যে ডিপসেক প্রায় ৫০,০০০ এনভিডিয়া হপার জিপিইউ সমন্বিত একটি বিশাল গণ্য অবকাঠামো পরিচালনা করে, যার মধ্যে 10,000 এইচ 800 ইউনিট, 10,000 আরও উন্নত এইচ 100 এবং অতিরিক্ত এইচ 20 জিপিইউ রয়েছে। এই সংস্থানগুলি বেশ কয়েকটি ডেটা সেন্টারে বিতরণ করা হয় এবং এআই প্রশিক্ষণ, গবেষণা এবং আর্থিক মডেলিংয়ের জন্য ব্যবহৃত হয়।
সার্ভারগুলিতে কোম্পানির মোট বিনিয়োগ প্রায় 1.6 বিলিয়ন ডলার, অপারেশনাল ব্যয়ের সাথে আনুমানিক $ 944 মিলিয়ন ডলার। ডিপসেক হ'ল চীনা হেজ ফান্ড হাই-ফ্লাইারের একটি সহায়ক সংস্থা, যা ২০২৩ সালে এআই টেকনোলজিসের উপর দৃষ্টি নিবদ্ধ করে একটি পৃথক বিভাগ হিসাবে শুরু করে। সংস্থাটি স্ব-অর্থায়িত রয়েছে, যা এর নমনীয়তা এবং সিদ্ধান্ত গ্রহণের গতিতে ইতিবাচকভাবে প্রভাবিত করে।
চিত্র: ensigame.com
তদুপরি, ডিপসেকের কিছু গবেষক বার্ষিক $ 1.3 মিলিয়ন ডলারের বেশি আয় করেন, শীর্ষস্থানীয় চীনা বিশ্ববিদ্যালয়গুলি থেকে শীর্ষ প্রতিভা আকৃষ্ট করে (সংস্থাটি বিদেশী বিশেষজ্ঞদের নিয়োগ দেয় না)। এমনকি এটি বিবেচনা করেও, ডিপসেকের সাম্প্রতিক দাবিটির সর্বশেষ মডেলটিকে মাত্র million মিলিয়ন ডলারে প্রশিক্ষণ দেওয়ার দাবি অবাস্তব বলে মনে হচ্ছে। এই চিত্রটি কেবল প্রাক-প্রশিক্ষণের সময় জিপিইউ ব্যবহারের ব্যয়কে বোঝায় এবং গবেষণা ব্যয়, মডেল পরিশোধন, ডেটা প্রসেসিং বা সামগ্রিক অবকাঠামোগত ব্যয়ের জন্য অ্যাকাউন্ট করে না।
প্রতিষ্ঠার পর থেকে ডিপসেক এআই বিকাশে $ 500 মিলিয়ন ডলারের বেশি বিনিয়োগ করেছে। তবে আমলাতন্ত্র দ্বারা ভারাক্রান্ত বৃহত্তর সংস্থাগুলির বিপরীতে, ডিপসিকের কমপ্যাক্ট কাঠামো এটিকে সক্রিয়ভাবে এবং কার্যকরভাবে এআই উদ্ভাবনগুলি বাস্তবায়নের অনুমতি দেয়।
চিত্র: ensigame.com
ডিপসেকের উদাহরণটি প্রমাণ করে যে একটি ভাল অর্থায়িত স্বতন্ত্র এআই সংস্থা শিল্প নেতাদের সাথে প্রতিযোগিতা করতে পারে। তবুও, বিশেষজ্ঞরা জোর দিয়েছিলেন যে সংস্থাটির সাফল্য মূলত বিলিয়ন বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দলের কারণে, যখন এআই মডেলগুলি বিকাশের জন্য "বিপ্লবী বাজেট" সম্পর্কে দাবি কিছুটা অতিরঞ্জিত। তবুও, প্রতিযোগীদের ব্যয় উল্লেখযোগ্যভাবে বেশি রয়েছে। উদাহরণস্বরূপ, মডেল প্রশিক্ষণের ব্যয়ের তুলনা করুন: ডিপসেক আর 1 এর জন্য 5 মিলিয়ন ডলার ব্যয় করেছে, যখন চ্যাটজিপিটি 4o এর দাম $ 100 মিলিয়ন।