أعلنت شركة DeepSeek الصينية يوم الإثنين عن إطلاق نموذجها الجديد DeepSeek-R1، الذي يُعد نموذجًا متقدمًا للذكاء الصناعي يعتمد على التفكير المنطقي.
هذا النموذج هو النسخة الكاملة من النموذج مفتوح المصدر الذي تم إطلاقه في البداية في نسخة تجريبية قبل شهرين، يمكن الآن تنزيل النموذج واستخدامه عبر واجهة برمجة التطبيقات (API) التي تتيح تكاملًا سلسًا مع التطبيقات الأخرى.
ويأتي DeepSeek-R1 ليُنافس بشدة نموذج o1 من OpenAI في العديد من المجالات التي تتطلب التفكير المنطقي والمعالجة المعقدة، وادَّعت الشركة أن النموذج الجديد قد تفوق على o1 في بعض المؤشرات البارزة مثل الرياضيات والبرمجة والمهام المعتمدة على التفكير الاستنتاجي، كما أشارت DeepSeek إلى أن تكلفة استخدام نموذج DeepSeek-R1 أقل بنسبة 90-95% مقارنة بتكلفة نموذج o1 من OpenAI.
النماذج الجديدة وتكنولوجيا التكلفة المنخفضة
تتضمن السلسلة الجديدة من النماذج، DeepSeek-R1 وDeepSeek-R1-Zero، حيث تم تطويرهما استنادًا إلى نموذج لغوي واسع النطاق (LLM) من الشركة نفسها يُدعى DeepSeek V3، وتم بناء هذه النماذج باستخدام بنية “المزيج بين الخبراء” (MoE)، والتي تعمل على دمج عدة نماذج صغيرة لتحسين كفاءة الأداء وقدرة النموذج الأكبر على معالجة المهام المتقدمة، وتتيح هذه البنية الجديدة تحسين الكفاءة وتقليل التكاليف في آن واحد.
يُذكر أن DeepSeek-R1 متاح للتنزيل عبر منصة Hugging Face، مع ترخيص MIT الذي يتيح استخدامه في الأغراض الأكاديمية والتجارية، ولمن لا يرغب في تشغيل النموذج محليًا، يمكنهم أيضًا استخدام واجهة برمجة التطبيقات (API) للنموذج.
تكلفة استخدام DeepSeek-R1 مقارنة بـ OpenAI
من أبرز النقاط التي تميز DeepSeek-R1 هي تكلفته المنخفضة بشكل ملحوظ. حيث يُسجل مدخل النموذج 0.14 دولار لكل مليون رمز، بينما المخرجات تُكلف 2.19 دولار لكل مليون رمز، بالمقارنة، تكلف API الخاصة بـ OpenAI o1 حوالي 7.5 دولار لكل مليون رمز مدخلات و60 دولارًا لكل مليون رمز مخرجات، مما يجعل DeepSeek-R1 خيارًا أكثر تكلفة للمستخدمين والمطورين.
الأداء والتفوق على *OpenAI *o1
على الرغم من أن الفروق في الأداء بين DeepSeek-R1 وo1 قد تكون طفيفة، إلا أن الشركة أكدت أن نتائج اختباراتها الداخلية أظهرت تفوق النموذج الجديد على o1 في اختبارات هامة مثل “اختبار الرياضيات الأمريكي” (AIME)، “Math-500”، ومعيار “SWE-bench”. تُعتبر هذه الاختبارات من بين الأكثر تحديًا في العالم الأكاديمي والمهني، ويُظهر التفوق في هذه المجالات قدرة DeepSeek-R1 على تقديم أداء متقدم.
من جهة أخرى، أوضح الفريق الفني في DeepSeek أنه استخدم أسلوب التعلم التعزيزي (Reinforcement Learning – RL) في تحسين النموذج دون الحاجة إلى تعديل إشرافي أو “التعلم الإشرافي” (SFT). يُعتبر استخدام التعلم التعزيزي النقي في هذا السياق سابقة في مشاريع الذكاء الصناعي مفتوحة المصدر، حيث يعزز قدرة النموذج على حل المشكلات المعقدة باستخدام آلية “سلسلة التفكير” (Chain-of-Thought – CoT).
التوجهات المستقبلية في الذكاء الصناعي
تتجه DeepSeek إلى الاستمرار في تطوير نماذج ذكاء صناعي جديدة تعتمد على تقنيات متقدمة مثل التعلم التعزيزي، بما في ذلك تحسين القدرات الحسابية والتفكير المنطقي. هذا التوجه يضع الشركة في منافسة قوية مع كبار اللاعبين في صناعة الذكاء الصناعي مثل OpenAI وGoogle DeepMind.
تعمل الشركة على تعزيز حضورها في سوق الذكاء الصناعي من خلال تقديم نماذج عالية الأداء بتكلفة منخفضة، ما يفتح المجال أمام العديد من التطبيقات التجارية والأكاديمية التي يمكن أن تستفيد من هذه التقنيات.
قد لا يُنظر إلى DeepSeek-R1 كنموذج ذائع الصيت مثل o1 من OpenAI، ولكن أداؤه المتميز وتكلفته المنخفضة قد يجعلاه الخيار المفضل للكثير من المطورين والباحثين في الذكاء الصناعي. ومع استمرار تطور هذه التكنولوجيا، فإن المنافسة بين الشركات الكبرى في هذا المجال ستستمر في دفع الابتكار وتحقيق تقدم كبير في العديد من المجالات الحيوية مثل الرياضيات والبرمجة والأمن السيبراني.
تعليقات