
2025/01/10
اکتشاف Deepseek V3: مدل هوش مصنوعی منبع باز که از Claude پیشی میگیرد
@تحلیل عمیق عملکرد، معماری و ویژگیهای فنی Deepseek V3 که نشان میدهد چگونه در چندین معیار عملکرد از Claude بهتر عمل میکند
اکتشاف Deepseek V3: مدل هوش مصنوعی منبع باز که از Claude پیشی میگیرد
2024-01-15
تماشای تحلیل کامل: Deepseek V3: مدل برتر هوش مصنوعی منبع باز که CLAUDE را شکست میدهد!
مقدمه و ویژگیها
- نسخه: Deepseek V3
- عملکرد: 3 برابر سریعتر از V2
- سازگاری APA: کامل
- مدل منبع باز: همتراز با Claude 3.5 Sonnet، پیشیگیرنده از Claude 30 Sonnet
- مقیاس مدل: مدل 67.1B Mixture of Experts، 37B پارامتر فعال
- دادههای آموزشی: 14 تریلیون توکن با کیفیت بالا
- مقرونبهصرفهگی: یکی از کمترین هزینهها، بهویژه قبل از 8 فوریه
مقایسه عملکرد
- معیار ریاضی: DeepSeek امتیاز 90، پیشیگیرنده از GPT-40 با امتیاز 74.6
- درک زبان: DeepSeek در چندین آزمون معیار عملکرد عالی دارد
معماری و فناوری
- معماری پایه: بلوکهای Transformer، مخلوطی از متخصصان (MoE)
- مکانیسم توجه: توجه نهفته چندسر، پشتیبانی از 128,000 توکن
- قابلیت حافظه: توانایی به خاطر سپردن هر بخش اطلاعات در توالیهای طولانی
آزمونهای برنامهنویسی
- آزمونهای پایتون: مسائل چالشبرانگیز شامل تولید ماتریس واحد، LCM، توالی Faray و توالی ECG
- آزمونهای جاوااسکریپت: چالشهای پیشرفته مانند مسئله Josephus
- نتایج: DeepSeek در آزمونهای سطح متخصص عملکرد عالی دارد، خطاها را حل کرده و بیشتر چالشها را پشت سر میگذارد
آزمونهای منطق و استدلال
- مسائل منطقی: مانند شمارش تعداد "O" در "strawberry"
- توانایی استدلال: با موفقیت یک سری مسائل منطقی را حل میکند
آزمونهای رفتار خودمختار
- رفتار عامل: آزمایش شده با استفاده از بسته Praise AI
- مثال وظیفه: ایجاد یک فیلمنامه درباره یک گربه گمشده
- نتایج: عوامل به صورت مشارکتی کار میکنند، از ابزارهای جستجو استفاده کرده و وظایف را تکمیل میکنند
آزمونهای انحراف
- آزمون سناریو: مسئله trolley در باند فرودگاه
- نتایج: DeepSeek محدودیتهایی در مدیریت قضاوتهای اخلاقی نشان میدهد
خلاصه
- Deepseek V3 با Claude 3.5 Sonnet همتراز است، در برخی معیارها عملکرد بهتری دارد
- منبع باز، مقرونبهصرفه و در آزمونهای برنامهنویسی سطح متخصص و استدلال منطقی عالی عمل میکند
- قابلیتهای رفتار خودمختار خوب اما با چالشهایی در آزمونهای انحراف مواجه است
فراخوان به اقدام
- اشتراک در کانال یوتیوب: اطلاعات بیشتر درباره تحولات هوش مصنوعی
- تماشای ویدیوهای دیگر: درباره انتشار مدل Reason L شرکت OpenAI
پستهای بیشتر

Deepseek R1: پیشتازی در عصر جدید مدلهای زبانی متنباز
تحلیل عمیق نوآوریهای فنی و دستاوردهای عملکردی Deepseek R1

Deepseek V3 روی Ollama: اجرای هوش مصنوعی پیشرفته به صورت محلی
یک راهنمای جامع برای اجرای Deepseek V3، یک مدل MoE قدرتمند با 671B پارامتر، به صورت محلی با استفاده از Ollama

MiniMax-Text-01: انقلابی در هوش مصنوعی با زمینه طولانی با پشتیبانی 4M توکن
تحلیل عمیق طول زمینه انقلابی 4M توکنی MiniMax-Text-01 و چگونگی تغییر چشمانداز هوش مصنوعی در کنار Deepseek V3