DeepSeek, по сути взломал один из святых Граалей ИИ

Эксперимент DeepSeek-R1-Zero показал нечто замечательное: используя чистое обучение с подкреплением с тщательно продуманными функциями вознаграждения, им удалось заставить модели развивать сложные способности рассуждения полностью автономно. Речь шла не только о решении проблем — модель органически научилась генерировать длинные цепочки мыслей, самостоятельно проверять свою работу и выделять больше вычислительного времени для более сложных задач.

Техническим прорывом здесь стал их новый подход к моделированию вознаграждения. Вместо того чтобы использовать сложные нейронные модели вознаграждения, которые могут привести к «взлому вознаграждения» (когда модель находит фиктивные способы увеличить свои вознаграждения, которые на самом деле не приводят к лучшей производительности модели в реальном мире), они разработали умную систему на основе правил, которая сочетает вознаграждения за точность (проверку окончательных ответов) с вознаграждениями за формат (поощрение структурированного мышления). Этот более простой подход оказался более надежным и масштабируемым, чем модели вознаграждения на основе процесса, которые пробовали другие.
Я начинаю по-настоящему верить в SaaS / AI-агентов. Это будет мегатренд, о котором сейчас никто и не подозревает. Я уверен, что на этом пути будет много взлетов и падений.

Deepseek теперь №1 в AppStore, обогнав ChatGPT — не нужны суперкомпьютеры NVIDIA или 100 млн долларов. Настоящее сокровище ИИ — это не пользовательский интерфейс или модель — они стали товарами. Истинная ценность заключается в данных и метаданных, кислороде, питающем потенциал ИИ. Будущие богатства — в наших данных.

Не нужно платить 200$ за использование Operator. Вы можете создать агента, использующего веб-браузер, не написав ни строчки кода. Объедините DeepSeek R1 и Browser Use (бесплатный и с открытым исходным кодом), и все готово. А приложение RAG поможет с обменом данными с вашими PDF-файлами с использованием модели DeepSeek R1, работающей локально на вашем компьютере.

Я установил локальную версию DeepSeek R1 на свой старенький мак всего за 3-4 минуты и меня удивила производительность. Теперь у меня есть свой мощный и шустрый ИИ-помощник, который всегда со мной, даже если у меня нет интернета.

Если кто-то хочет попробовать работу этого помощника, ставьте плюс в комментариях, выложу 6 скриншотов как быстро установить DeepSeek R1. Попробуйте с простой версии, но если у вас шустрая и мощная машина, можете выбрать из списка версию помощнее.

искусственный интеллект DeepSeek

Navigating Bear Market Rally

Moris

Москва

251

с 24 марта 2019

48 Комментариев

Валерий Осипенко
27 января 2025, 19:58
грааль это запекшаяся кровь распятого еврея
это фу
0
Василий Петров
27 января 2025, 20:17
Не очень понял, в чем разница между ChatGpt помимо того, что без инета? Ему можно какие-то свои данные скормить?
0
- Evvibris
  27 января 2025, 21:22
  Василий Петров, ну если функционал тот же, то это тоже самое, что проводной телефон vs мобильник.
  
  А что касается функционала, то один из самых распространённых функционалов ИИ это генерация картинок и текста, видимо теперь это возможно делать автономно.
  0
  - Максим
    28 января 2025, 10:18
    Evvibris, Самая распространённая функция — это анализ кода и его написание. Практически все модели отдельно натачивают под программирование. Использование ИИ программиста в среднем увеличивает производительность программистов на 25–60%.
    ----
    снизу текст переписанный ЯндексГПТ из контекстного меню Яндекс Браузера
    ----
    Наиболее распространённой функцией является анализ и написание кода. Практически все модели специально обучаются для этой задачи. В среднем, использование ИИ-программиста повышает производительность программистов на 25–60%.
    0
- GOLD
  28 января 2025, 16:58
  Василий Петров, люди наклепали таких движков — как говна за баней
  
  хайп с DeepSeek оплатил тот, кто захотел зайти в NVidia
  
  разводняк))
  0
- Василий Петров
  28 января 2025, 17:41
  Василий Петров, короч основная фишка в том, что просто меньше ресурсов жрет и всё, отсюда и весь хайп. Потестил немного, так тяжелее сказать, кто лучше код пишет или что-то делает там. По-моему ChatGpt пока получше.
  0
Himmel
27 января 2025, 20:49
А что значит «вознаграждение»? Кого вознаграждают? ИИ? А что ему нужно? Чтоб кожаный мешок сказал — «спасибо»? Или «да, повелитель»?
-2
- Максим
  28 января 2025, 10:21
  Himmel, «Вознаграждение» — чисто математический термин, ИИ-модели ставят метрики и по мере их достижения (миллионы и миллиарды итераций) начисляют бонусы, которые модель пытается увеличить.
  +1
  - Himmel
    28 января 2025, 11:07
    Максим, в общем бесполезная инфа для обычного юзера, понятно
    0
Григорий Брусанов
27 января 2025, 21:17
ставлю +
+3
averbin
27 января 2025, 21:22
Весь интернет засрали этим DeepSeek. Однако, первый же мой вопрос поставил его в тупик. Даже не так — он просто выдумал ответ. Я его спросил — как получить дату создания AWS IoT Thing. Правильный ответ — никак. Ответ DeepSeek — используйте поле version, считайте его количеством миллисекунд с 1970 года. ChatGPT не лучше, тоже выдумывает ответ.
+2
- Плантатор Мигель
  27 января 2025, 21:56
  averbin, его же бывшие студенты делали. На экзамене нельзя говорить «не знаю». Намного безопаснее нести выдуманную херню, издали хоть чуть-чуть похожую на правду. Авось трояк и поставят.
  +18
  - il_dottore
    28 января 2025, 04:55
    Плантатор Мигель, вообще-то на некоторые вопросы только так и можно ответить: «не знаю». Такой ответ дорогого стоит. Даже на экзамене. Это начало научного исследования или личностного роста, вообще-то, а не его конец, если соврать в этой точке самому себе.
    +2
Beach Bunny
27 января 2025, 22:01
Не пидиди, на стареньком мак вы ничего нормального не запустите
+4
- PALINDROM
  03 февраля 2025, 17:37
  Beach Bunny, Вы правы.
  
  Вот так работает модель 8B.
  0
  - Beach Bunny
    03 февраля 2025, 21:05
    PALINDROM, зачем в консоли работать
    Поставь расширение для браузера
    Firefox addons.mozilla.org/ru/firefox/addon/page-assist/
    Chrome chrome.google.com/webstore/detail/page-assist/jfgfiigpkhlkbnfnbobbkinehhfdhndo
    
    будет как в почти как в ChatGPT
    0
    - PALINDROM
      03 февраля 2025, 21:20
      Beach Bunny, да я поставил Chatbox. НО у меня железо даже 8B не тянет. Я просто попробовал…
      0
Iskanderravilov
27 января 2025, 22:09
Опять «новая парадигма» что ли?
0
Доктор
27 января 2025, 22:37
А пельмешки умеет варить хоть?
+1
Makstrade
27 января 2025, 23:07
На первый взгляд просто и красиво, но время покажет, что из себя на самом деле представляет этот бесплатный китайский сыр и стоит ли ему доверять
+2
Maximu$
27 января 2025, 23:18
++
0
Makstrade
27 января 2025, 23:30
DeepSeek заявили, что работа сервиса ухудшилась из-за крупномасштабной вредоносной атаки.)
+1
Ссерджио
28 января 2025, 00:16
+

0
Константин Дубровин
28 января 2025, 00:47
как приготовить свиные крылышки — она что твечает?
+3
Moris
28 января 2025, 00:49
Кто-то поставил даже два ++. Держите скриншоты. Я установил самую простенькую версию из списка, чтобы потестить. Если у вас новый мощный комп, то можете выбрать и помощнее из предложенного списка. Удачи всем. Кто установит и получит удовольствие от своего персонального помощника — ставьте лайки.

0
- Moris
  28 января 2025, 00:51
  Нельзя выкладывать в одном комменте все скрины. Тот был последним, четвертым. Далее будут остальные.
  Это — первый.
  
  0
- IT_LONG
  28 января 2025, 00:56
  Moris, так это обрубки от той модель что используется на сайте, чтобы запустить полновесный r1 на стационарном компьютере нужно несколько промышленных видеокарт на борту
  +1
Moris
28 января 2025, 00:52
Это второй скрин.

0
Moris
28 января 2025, 00:52
Это третий скрин.

0
Moris
28 января 2025, 00:57
Тем кто сомневается, вот официальное заявление NVDA.
Nvidia $NVDA just released a statement regarding DeepSeek:
«DeepSeek is an excellent AI advancement and a perfect example of Test Time Scaling. DeepSeek’s work illustrates how new models can be created using that technique, leveraging widely-available models and compute that is fully export control compliant. Inference requires significant numbers of NVIDIA GPUs and high-performance networking. We now have three scaling laws: pre-training and post-training, which continue, and new test-time scaling.»
0
- Максим
  28 января 2025, 10:24
  Moris, Тем кто сомневается, вот официальное заявление NVDA.
  Nvidia $ NVDA только что опубликовала заявление относительно DeepSeek:
  «DeepSeek — отличное решение для искусственного интеллекта и прекрасный пример масштабирования времени тестирования. Работа DeepSeek иллюстрирует, как с помощью этой технологии можно создавать новые модели, используя широко доступные модели и вычисления, полностью соответствующие требованиям экспортного контроля. Для вывода требуется значительное количество графических процессоров NVIDIA и высокопроизводительные сети. Теперь у нас есть три закона масштабирования: предтренировочное и посттренировочное, которые продолжаются, и новое масштабирование во время тестирования ».
  0
Strelok1985
28 января 2025, 08:32
А из него можно шашлык сделать?.. неповеришь. баранина надоела.
0
Андрей Новиков
28 января 2025, 13:18
Зачем макбук? Давай обзор на винде
0
John Snow
28 января 2025, 14:08
Ссылка на инструкцию по локальной установке LLM DeepSeek R1
www.reddit.com/r/selfhosted/comments/1i6ggyh/got_deepseek_r1_running_locally_full_setup_guide/
+1
РоманР
28 января 2025, 14:12
++
0
Евграфович
28 января 2025, 15:24
На Хабре уже написали, что толку от модели с малым количеством параметров никакого, а для более-менее моделей, генерирующих вменяемые ответы домашнее железо не подойдёт. Ну и люди сомневаются, что ее обучение действительно обошлось дёшево, а не является скамом ради сбора инвестиций
0
Владислав К
03 февраля 2025, 13:39
Будем честны, дипсик бесплатный но самый крутой, но сервера виснут от запросов, и работать просто невыносимо с ним, стоит внутренний ограничитель запросов в день это ощущается
0
PALINDROM
03 февраля 2025, 17:17
Старенький mac это какой?
0
- Moris
  03 февраля 2025, 20:01
  PALINDROM,
  
  +1
  - PALINDROM
    03 февраля 2025, 20:08
    Moris, Спасибо за информацию. Вы 8B установили? Насколько шустро работает?
    0
    - Moris
      03 февраля 2025, 21:21
      PALINDROM, Нет. Я установил самую простую, чтобы потестить. Довольно быстро работает.
      0
      - PALINDROM
        03 февраля 2025, 21:38
        Moris, самую простую это 1,5?
        0
        Moris
        03 февраля 2025, 22:30
        PALINDROM, Ну конечно
        0