لماذا يعد Deepseek افضل تطبيق ذكاء اصطناعي.
DeepSeek
2/ ثم جاءت DeepSeek وقالت: "ماذا لو فعلنا ذلك مقابل 5 ملايين دولار فقط؟" ولم يقتصر الأمر على الكلام فحسب – بل نفذوا ذلك فعلياً. نماذجهم تقدم أداءً يضاهي أو يتفوق على GPT-4 وClaude في العديد من المهام. عالم الذكاء الاصطناعي في حالة صدمة (كما يقول أطفالي المراهقون).
دعوني أوضح لكم لماذا تُحدث ابتكارات الذكاء الاصطناعي لشركة DeepSeek ضجة كبيرة (وربما تُهدد القيمة السوقية لشركة Nvidia التي تبلغ 2 تريليون دولار)، بأسلوب بسيط…
1/ أولاً، لنضع الأمور في سياقها: حالياً، تدريب نماذج الذكاء الاصطناعي المتقدمة مُكلف للغاية بشكل جنوني. شركات مثل OpenAI وAnthropic تنفق أكثر من 100 مليون دولار فقط على عمليات الحوسبة. يتطلب الأمر مراكز بيانات ضخمة تحتوي على آلاف وحدات معالجة الرسومات (GPUs) التي يبلغ سعر الواحدة منها 40 ألف دولار. يشبه الأمر الحاجة إلى محطة طاقة كاملة لتشغيل مصنع.
1/ أولاً، لنضع الأمور في سياقها: حالياً، تدريب نماذج الذكاء الاصطناعي المتقدمة مُكلف للغاية بشكل جنوني. شركات مثل OpenAI وAnthropic تنفق أكثر من 100 مليون دولار فقط على عمليات الحوسبة. يتطلب الأمر مراكز بيانات ضخمة تحتوي على آلاف وحدات معالجة الرسومات (GPUs) التي يبلغ سعر الواحدة منها 40 ألف دولار. يشبه الأمر الحاجة إلى محطة طاقة كاملة لتشغيل مصنع.
2/ ثم جاءت DeepSeek وقالت: "ماذا لو فعلنا ذلك مقابل 5 ملايين دولار فقط؟" ولم يقتصر الأمر على الكلام فحسب – بل نفذوا ذلك فعلياً. نماذجهم تقدم أداءً يضاهي أو يتفوق على GPT-4 وClaude في العديد من المهام. عالم الذكاء الاصطناعي في حالة صدمة (كما يقول أطفالي المراهقون).
3/ كيف؟ أعادوا التفكير في كل شيء من البداية. الذكاء الاصطناعي التقليدي يشبه كتابة كل رقم باستخدام 32 خانة عشرية. DeepSeek قالت: "ماذا لو استخدمنا 8 فقط؟ لا يزال ذلك دقيقاً بما يكفي!" النتيجة؟ تقليل الحاجة إلى الذاكرة بنسبة 75%.
4/ ثم هناك نظامهم المبتكر "متعدد الرموز" (multi-token). الذكاء الاصطناعي التقليدي يقرأ مثل طفل في الصف الأول: "القطة… جلست…" أما DeepSeek فتقرأ عبارات كاملة دفعة واحدة. النتيجة؟ سرعة مضاعفة، ودقة تصل إلى 90%. عندما تكون تعالج مليارات الكلمات، فهذا يُحدث فرقاً كبيراً.
5/ لكن الجزء الأذكى حقًا هو أنهم أنشأوا نظام "الخبراء المتخصصين". بدلاً من وجود ذكاء اصطناعي ضخم يحاول معرفة كل شيء (مثل محاولة شخص واحد أن يكون طبيبًا، ومحاميًا، ومهندسًا في الوقت نفسه)، لديهم خبراء متخصصون يتم تفعيلهم فقط عند الحاجة.
6/ النماذج التقليدية؟ يتم تشغيل جميع المعاملات البالغ عددها 1.8 تريليون طوال الوقت. أما DeepSeek؟ لديها إجمالي 671 مليار معاملة، ولكن يتم تشغيل 37 مليارًا فقط في الوقت نفسه. يشبه الأمر وجود فريق ضخم، ولكنك تستدعي الخبراء الذين تحتاج إليهم فقط لكل مهمة.
7/ النتائج مذهلة:
•تكلفة التدريب: من 100 مليون دولار إلى 5 ملايين دولار
•عدد وحدات معالجة الرسومات (GPUs) المطلوبة: من 100,000 إلى 2,000 فقط
•تكلفة واجهات برمجة التطبيقات (APIs): أرخص بنسبة 95%
•يمكن تشغيلها على وحدات معالجة الرسومات المخصصة للألعاب بدلاً من أجهزة مراكز البيانات.
8/ "ولكن مهلاً"، قد تقول، "لابد أن هناك عيبًا أو جانبًا مخفيًا!" وهنا تكمن المفاجأة – كل شيء مفتوح المصدر. يمكن لأي شخص التحقق من عملهم. الكود متاح للجميع، والأوراق التقنية تشرح كل التفاصيل. إنه ليس سحرًا، بل مجرد هندسة ذكية للغاية.
9/ لماذا هذا مهم؟ لأنه يكسر نموذج "أن الشركات التكنولوجية الكبرى فقط هي من يمكنها التواجد في مجال الذكاء الاصطناعي." لم تعد بحاجة إلى مركز بيانات بمليار دولار. ربما تحتاج فقط إلى بعض وحدات معالجة الرسومات الجيدة.
10/ بالنسبة لشركة Nvidia، هذا أمر مقلق. نموذج أعمالها بالكامل مبني على بيع وحدات معالجة رسومات (GPUs) باهظة الثمن بهوامش ربح تصل إلى 90%. إذا أصبح بإمكان الجميع فجأة استخدام الذكاء الاصطناعي باستخدام وحدات معالجة رسومات مخصصة للألعاب… حسنًا، يمكنك أن ترى المشكلة.
11/ وإليك النقطة المفصلية: قامت DeepSeek بذلك بفريق مكون من أقل من 200 شخص. في الوقت نفسه، لدى Meta فرق حيث تتجاوز تعويضات الموظفين ميزانية تدريب DeepSeek بالكامل… ومع ذلك، نماذجهم ليست بنفس الجودة.
12/ هذه قصة تقليدية للتغيير الجذري: الشركات القائمة تحسن العمليات الحالية، بينما المغيرون يعيدون التفكير في النهج الأساسي. قامت DeepSeek بطرح السؤال: "ماذا لو فعلنا ذلك بشكل أكثر ذكاءً بدلاً من إضافة المزيد من الأجهزة؟"
13/ الآثار المترتبة ضخمة:
•يصبح تطوير الذكاء الاصطناعي أكثر سهولة ويسرًا
•تتزايد المنافسة بشكل كبير
•"الخنادق" التي تحيط بشركات التكنولوجيا الكبرى تبدو أكثر مثل البرك
•متطلبات الأجهزة (والتكاليف) تنهار بشكل كبير
14/ بالطبع، عمالقة مثل OpenAI وAnthropic لن يقفوا مكتوفي الأيدي. من المحتمل أنهم بالفعل بدأوا في تنفيذ هذه الابتكارات. ولكن جني الكفاءة قد خرج من القمقم – لا عودة إلى نهج "فقط أضف المزيد من وحدات المعالجة الرسومية" بعد الآن.
15/ الفكرة الأخيرة: يبدو أن هذه لحظة سننظر إليها في المستقبل كنقطة تحول. مثلما جعلت أجهزة الكمبيوتر الشخصية الحواسيب المركزية أقل أهمية، أو كما غيّر الحوسبة السحابية كل شيء.
الذكاء الاصطناعي على وشك أن يصبح أكثر وصولًا وأقل تكلفة بكثير. السؤال ليس ما إذا كان هذا سيعطل اللاعبين الحاليين، بل كم ستكون السرعة.