
Старший исследовательский менеджер NVIDIA Джим Фан высоко оценивает Deepseek R1: Подлинное воплощение миссии открытого ИИ
@Старший исследовательский менеджер NVIDIA Джим Фан высоко оценивает вклад Deepseek R1 в открытое ПО и технические инновации в соцсетях, подчеркивая его важность для поддержания открытости и развития передовых исследований
Старший исследовательский менеджер NVIDIA Джим Фан высоко оценивает Deepseek R1: Подлинное воплощение миссии открытого ИИ
Признание эксперта
Старший исследовательский менеджер NVIDIA Джим Фан недавно поделился своим глубоким анализом Deepseek R1 в социальных сетях. Как сооснователь GEAR Lab, руководитель Project GR00T, доктор философии Стэнфорда и первый стажер OpenAI, мнение Фана имеет значительный вес в индустрии. Он особенно подчеркнул выдающийся вклад DeepSeek в развитие открытого ИИ как компании не из США.
Преемник духа открытого ПО
В своем комментарии Фан отметил: «Мы живем в реальности, где компания не из США сохраняет первоначальную миссию OpenAI — подлинная открытость, передовые исследования, которые расширяют возможности всех. Это непостижимо. Наиболее вероятен самый занимательный исход». Он особенно оценил то, что DeepSeek не только открывает исходный код множества моделей, но и раскрывает все секреты обучения.
Глубокий анализ технических инноваций
Внимательно изучив техническую документацию Deepseek R1, Фан выделил несколько ключевых технических прорывов:
-
Чистый подход обучения с подкреплением:
- Используется метод «холодного старта», полностью управляемый RL, без какого-либо SFT
- Напоминает прорыв AlphaZero в освоении го, сёги и шахмат с нуля
- Считается самым значимым выводом из документа
-
Инновационный механизм вознаграждения:
- Используются точные вознаграждения, вычисленные по жестко заданным правилам
- Избегаются изученные модели вознаграждения, которые RL может легко обойти
-
Эволюция времени размышления:
- Время размышления модели steadily увеличивается по мере обучения
- Это emergent свойство, а не запрограммированное поведение
-
Инновация алгоритма GRPO:
- Удаляет critic-сеть из PPO
- Вместо этого используется среднее вознаграждение множества samples
- Простой метод для снижения использования памяти
- Примечательно, что GRPO был изобретен DeepSeek в феврале 2024 года
Новая парадигма технического влияния
Фан особо отметил, что влияние в ИИ может достигаться разными способами: «Влияние может достигаться через „достигнутый внутри ASI“ или мифические названия вроде „Project Strawberry“. Влияние также может достигаться простым выкладыванием сырых алгоритмов и matplotlib-графиков обучения». Эта перспектива подчеркивает важность открытости и прозрачности.
Пример устойчивых инноваций
По мнению Фана, DeepSeek, возможно, является первым проектом с открытым исходным кодом, который демонстрирует значительный, устойчивый рост маховика RL. Этот непрерывный технический прогресс и открытая позиция задают важный ориентир для всего сообщества ИИ.
Заключение
Оценка Джима Фана не только подтверждает технические достижения Deepseek R1, но и подчеркивает его значительный вклад в демократизацию ИИ и дух открытого ПО. Как авторитет в индустрии, его признание дополнительно подтверждает важное место DeepSeek в глобальном ландшафте ИИ.
Чтобы изучить инновации Deepseek R1 из первых рук, посетите Deepseek R1 Chat.
Больше записей

Deepseek V3 vs ChatGPT: Новое поколение моделей искусственного интеллекта
Глубокое сравнение Deepseek V3 и ChatGPT, исследующее новые направления в разработке моделей ИИ

Начало работы с DeepSeek API: Краткое руководство
Полное руководство по началу работы с DeepSeek API, включая настройку, аутентификацию и примеры базового использования

Как добавить модели DeepSeek в Cursor: Полное руководство
Узнайте, как интегрировать мощные AI-модели DeepSeek с IDE Cursor для улучшенного опыта разработки