Блог им. Moris

DeepSeek, по сути взломал один из святых Граалей ИИ

    • 27 января 2025, 19:31
    • |
    • Moris
  • Еще

Эксперимент DeepSeek-R1-Zero показал нечто замечательное: используя чистое обучение с подкреплением с тщательно продуманными функциями вознаграждения, им удалось заставить модели развивать сложные способности рассуждения полностью автономно. Речь шла не только о решении проблем — модель органически научилась генерировать длинные цепочки мыслей, самостоятельно проверять свою работу и выделять больше вычислительного времени для более сложных задач.

Техническим прорывом здесь стал их новый подход к моделированию вознаграждения. Вместо того чтобы использовать сложные нейронные модели вознаграждения, которые могут привести к «взлому вознаграждения» (когда модель находит фиктивные способы увеличить свои вознаграждения, которые на самом деле не приводят к лучшей производительности модели в реальном мире), они разработали умную систему на основе правил, которая сочетает вознаграждения за точность (проверку окончательных ответов) с вознаграждениями за формат (поощрение структурированного мышления). Этот более простой подход оказался более надежным и масштабируемым, чем модели вознаграждения на основе процесса, которые пробовали другие.
Я начинаю по-настоящему верить в SaaS / AI-агентов. Это будет мегатренд, о котором сейчас никто и не подозревает. Я уверен, что на этом пути будет много взлетов и падений.

Deepseek теперь №1 в AppStore, обогнав ChatGPT — не нужны суперкомпьютеры NVIDIA или 100 млн долларов. Настоящее сокровище ИИ — это не пользовательский интерфейс или модель — они стали товарами. Истинная ценность заключается в данных и метаданных, кислороде, питающем потенциал ИИ. Будущие богатства — в наших данных. 

Не нужно платить 200$ за использование Operator. Вы можете создать агента, использующего веб-браузер, не написав ни строчки кода. Объедините DeepSeek R1 и Browser Use (бесплатный и с открытым исходным кодом), и все готово. А приложение RAG поможет с обменом данными с вашими PDF-файлами с использованием модели DeepSeek R1, работающей локально на вашем компьютере.

Я установил локальную версию DeepSeek R1 на свой старенький мак всего за 3-4 минуты и меня удивила производительность. Теперь у меня есть свой мощный и шустрый ИИ-помощник, который всегда со мной, даже если у меня нет интернета. 

Если кто-то хочет попробовать работу этого помощника, ставьте плюс в комментариях, выложу 6 скриншотов как быстро установить DeepSeek R1. Попробуйте с простой версии, но если у вас шустрая и мощная машина, можете выбрать из списка версию помощнее.

   
★30
48 комментариев
грааль это запекшаяся кровь распятого еврея 
это фу
Не очень понял, в чем разница между ChatGpt помимо того, что без инета? Ему можно какие-то свои данные скормить?
Василий Петров, ну если функционал тот же, то это тоже самое, что проводной телефон vs мобильник. 

А что касается функционала, то один из самых распространённых функционалов ИИ это генерация картинок и текста, видимо теперь это возможно делать автономно. 
avatar
Evvibris, Самая распространённая функция — это анализ кода и его написание. Практически все модели отдельно натачивают под программирование. Использование ИИ программиста в среднем увеличивает производительность программистов на 25–60%.
----
снизу текст переписанный ЯндексГПТ из контекстного меню Яндекс Браузера
----
Наиболее распространённой функцией является анализ и написание кода. Практически все модели специально обучаются для этой задачи. В среднем, использование ИИ-программиста повышает производительность программистов на 25–60%.
avatar
Василий Петров, люди наклепали таких движков — как говна за баней

хайп с DeepSeek оплатил тот, кто захотел зайти в NVidia

разводняк))
avatar
Василий Петров, короч основная фишка в том, что просто меньше ресурсов жрет и всё, отсюда и весь хайп. Потестил немного, так тяжелее сказать, кто лучше код пишет или что-то делает там. По-моему ChatGpt пока получше.
А что значит «вознаграждение»? Кого вознаграждают? ИИ? А что ему нужно? Чтоб кожаный мешок сказал — «спасибо»? Или «да, повелитель»?
avatar
Himmel, «Вознаграждение» — чисто математический термин, ИИ-модели ставят метрики и по мере их достижения (миллионы и миллиарды итераций) начисляют бонусы, которые модель пытается увеличить.
avatar
Максим, в общем бесполезная инфа для обычного юзера, понятно
avatar
ставлю +
Весь интернет засрали этим DeepSeek. Однако, первый же мой вопрос поставил его в тупик. Даже не так — он просто выдумал ответ. Я его спросил — как получить дату создания AWS IoT Thing. Правильный ответ — никак. Ответ DeepSeek — используйте поле version, считайте его количеством миллисекунд с 1970 года. ChatGPT не лучше, тоже выдумывает ответ.
avatar
averbin, его же бывшие студенты делали. На экзамене нельзя говорить «не знаю». Намного безопаснее нести выдуманную херню, издали хоть чуть-чуть похожую на правду. Авось трояк и поставят.
Плантатор Мигель, вообще-то на некоторые вопросы только так и можно ответить: «не знаю». Такой ответ дорогого стоит. Даже на экзамене. Это начало научного исследования или личностного роста, вообще-то, а не его конец, если соврать в этой точке самому себе.
avatar
Не пидиди, на стареньком мак вы ничего нормального не запустите
avatar
Beach Bunny, Вы правы.

Вот так работает модель 8B.
avatar
PALINDROM, зачем в консоли работать
Поставь расширение для браузера
Firefox addons.mozilla.org/ru/firefox/addon/page-assist/
Chrome chrome.google.com/webstore/detail/page-assist/jfgfiigpkhlkbnfnbobbkinehhfdhndo

будет как в почти как в ChatGPT
avatar
Beach Bunny, да я поставил Chatbox. НО у меня железо даже 8B не тянет. Я просто попробовал…
avatar
Опять «новая парадигма» что ли?
avatar
А пельмешки умеет варить хоть?
avatar
На первый взгляд просто и красиво, но время покажет, что из себя на самом деле представляет этот бесплатный китайский сыр и стоит ли ему доверять
avatar
++
avatar
DeepSeek заявили, что работа сервиса ухудшилась из-за крупномасштабной вредоносной атаки.)
avatar
+

avatar
как приготовить свиные крылышки — она что твечает?
Кто-то поставил даже два ++. Держите скриншоты. Я установил самую простенькую версию из списка, чтобы потестить. Если у вас новый мощный комп, то можете выбрать и помощнее из предложенного списка. Удачи всем. Кто установит и получит удовольствие от своего персонального помощника — ставьте лайки.
Скриншоты для установки DeepSeek на локальный комп


avatar
Нельзя выкладывать в одном комменте все скрины. Тот был последним, четвертым. Далее будут остальные.
Это — первый.

 
avatar
Moris, так это обрубки от той модель что используется на сайте, чтобы запустить полновесный r1 на стационарном компьютере нужно несколько промышленных видеокарт на борту
avatar
 Это второй скрин.

avatar
 Это третий скрин.

avatar
 Тем кто сомневается, вот официальное заявление NVDA.

Nvidia $NVDA just released a statement regarding DeepSeek:
«DeepSeek is an excellent AI advancement and a perfect example of Test Time Scaling. DeepSeek’s work illustrates how new models can be created using that technique, leveraging widely-available models and compute that is fully export control compliant. Inference requires significant numbers of NVIDIA GPUs and high-performance networking. We now have three scaling laws: pre-training and post-training, which continue, and new test-time scaling.»

avatar
Moris,  Тем кто сомневается, вот официальное заявление NVDA.

Nvidia $ NVDA только что опубликовала заявление относительно DeepSeek:
«DeepSeek — отличное решение для искусственного интеллекта и прекрасный пример масштабирования времени тестирования. Работа DeepSeek иллюстрирует, как с помощью этой технологии можно создавать новые модели, используя широко доступные модели и вычисления, полностью соответствующие требованиям экспортного контроля. Для вывода требуется значительное количество графических процессоров NVIDIA и высокопроизводительные сети. Теперь у нас есть три закона масштабирования: предтренировочное и посттренировочное, которые продолжаются, и новое масштабирование во время тестирования ».

avatar
А из него можно шашлык сделать?.. неповеришь. баранина надоела.
avatar
Зачем макбук? Давай обзор на винде
Ссылка на инструкцию по локальной установке LLM DeepSeek R1
www.reddit.com/r/selfhosted/comments/1i6ggyh/got_deepseek_r1_running_locally_full_setup_guide/
avatar
++
avatar
На Хабре уже написали, что толку от модели с малым количеством параметров никакого, а для более-менее моделей, генерирующих вменяемые ответы домашнее железо не подойдёт. Ну и люди сомневаются, что ее обучение действительно обошлось дёшево, а не является скамом ради сбора инвестиций
avatar
Будем честны, дипсик бесплатный но самый крутой, но сервера виснут от запросов, и работать просто невыносимо с ним, стоит внутренний ограничитель запросов в день это ощущается
avatar
Старенький mac это какой?
avatar
PALINDROM, 

avatar
Moris, Спасибо за информацию. Вы 8B установили? Насколько шустро работает?
avatar
PALINDROM, Нет. Я установил самую простую, чтобы потестить. Довольно быстро работает. 
avatar
Moris, самую простую это 1,5?
avatar
PALINDROM, Ну конечно
avatar

теги блога Moris

....все тэги



UPDONW
Новый дизайн