
جيم فان، مدير الأبحاث الأول في NVIDIA، يثني على Deepseek R1: يجسد حقًا مهمة الذكاء الاصطناعي مفتوح المصدر
@يثني جيم فان، مدير الأبحاث الأول في NVIDIA، على مساهمات Deepseek R1 مفتوحة المصدر وإبداعاته التقنية على وسائل التواصل الاجتماعي، مؤكدًا على أهميته في الحفاظ على الانفتاح وتطوير أبحاث الحدود المعرفية
جيم فان، مدير الأبحاث الأول في NVIDIA، يثني على Deepseek R1: يجسد حقًا مهمة الذكاء الاصطناعي مفتوح المصدر
اعتراف الخبراء
شارك جيم فان، مدير الأبحاث الأول في NVIDIA، مؤخرًا تقييمه المتعمق لـ Deepseek R1 على وسائل التواصل الاجتماعي. بصفته المؤسس المشارك لـ GEAR Lab، وقائد مشروع GR00T، وحامل دكتوراه من ستانفورد، والمتدرب الأول في OpenAI، تحمل وجهات نظر فان وزنًا كبيرًا في الصناعة. وقد أكد بشكل خاص على المساهمات البارزة لـ DeepSeek في تطوير الذكاء الاصطناعي مفتوح المصدر كشركة غير أمريكية.
وريث روح المصادر المفتوحة
في تعليقه، لاحظ فان: "نحن نعيش في زمن تحافظ فيه شركة غير أمريكية على المهمة الأصلية لـ OpenAI - أبحاث حدودية حقًا مفتوحة، تمكّن الجميع. هذا لا معنى له. النتيجة الأكثر ترفيهًا هي الأكثر احتمالًا." وقد أعجب بشكل خاص بأن DeepSeek لا تفتح المصدر لسلسلة من النماذج فحسب، بل تكشف أيضًا عن جميع أسرار التدريب.
تحليل عميق للإبداعات التقنية
بعد قراءة وثيقة Deepseek R1 التقنية بعناية، أبرز فان عدة إنجازات تقنية رئيسية:
-
نهج التعلم المعزز الخالص:
- يستخدم طريقة "بداية باردة"، مدفوعة بالكامل بالتعلم المعزز، دون أي تعليم دقيق مسبق (SFT)
- يذكرنا بإنجاز AlphaZero في إتقان Go وShogi والشطرنج من الصفر
- يعتبر أهم استفادة من الورقة البحثية
-
آلية مكافأة مبتكرة:
- يستخدم مكافآت حقيقية محسوبة بقواعد ثابتة
- يتجنب نماذج المكافآت المتعلمة التي يمكن للتعلم المعزز اختراقها بسهولة
-
تطور وقت التفكير:
- وقت تفكير النموذج يزداد بثبات مع تقدم التدريب
- هذه خاصية ناشئة، وليست سلوكًا مبرمجًا مسبقًا
-
إبداع خوارزمية GRPO:
- يزيل شبكة الناقد من PPO
- يستخدم متوسط مكافأة عينات متعددة بدلاً من ذلك
- طريقة بسيطة لتقليل استخدام الذاكرة
- من الجدير بالذكر أن GRPO تم اختراعه من قبل DeepSeek في فبراير 2024
نموذج جديد للتأثير التقني
أشار فان على وجه التحديد إلى أن التأثير في الذكاء الاصطناعي يمكن تحقيقه بطرق مختلفة: "يمكن تحقيق التأثير بـ 'تحقيق ASI داخليًا' أو بأسماء أسطورية مثل 'مشروع Strawberry'. يمكن أيضًا تحقيق التأثير بمجرد إطلاق الخوارزميات الخام ومنحنيات التعلم matplotlib." تؤكد هذه الرؤية على أهمية الانفتاح والشفافية.
مثال على الابتكار المستمر
من وجهة نظر فان، يعد DeepSeek ربما أول مشروع مفتوح المصدر يُظهر نموًا كبيرًا ومستمرًا لعجلة التعلم المعزز. هذا التقدم التقني المستمر والانفتاح يضع معيارًا مهمًا لمجتمع الذكاء الاصطناعي بأكمله.
خاتمة
لا يؤكد تقييم جيم فان على الإنجازات التقنية لـ Deepseek R1 فحسب، بل يؤكد أيضًا على مساهماته الكبيرة في دمقرطة الذكاء الاصطناعي وروح المصادر المفتوحة. كسلطة في الصناعة، يؤكد اعترافه على مكانة DeepSeek المهمة في مشهد الذكاء الاصطناعي العالمي.
لاستكشاف إبداعات Deepseek R1 مباشرة، تفضل بزيارة Deepseek R1 Chat.
المزيد من المشاركات

Deepseek R1 و V3 على LM Studio: الدليل الشامل
دليل شامل لتركيب واستخدام نماذج Deepseek R1 و V3 في LM Studio لتطبيقات الذكاء الاصطناعي المحلية

بدء استخدام DeepSeek API: دليل سريع
دليل شامل حول كيفية البدء في استخدام DeepSeek API، بما في ذلك التهيئة، المصادقة، وأمثلة الاستخدام الأساسية

Deepseek R1 مقابل OpenAI O1 و Claude 3.5 Sonnet - جولة الترميز الصعبة 1
مقارنة متعمقة لقدرات الترميز بين Deepseek R1 وOpenAI O1 وClaude 3.5 Sonnet من خلال تحديات برمجية واقعية