DeepSeek, по сути взломал один из святых Граалей ИИ

27 января 2025, 19:31
|
Moris

Эксперимент DeepSeek-R1-Zero показал нечто замечательное: используя чистое обучение с подкреплением с тщательно продуманными функциями вознаграждения, им удалось заставить модели развивать сложные способности рассуждения полностью автономно. Речь шла не только о решении проблем — модель органически научилась генерировать длинные цепочки мыслей, самостоятельно проверять свою работу и выделять больше вычислительного времени для более сложных задач.

Техническим прорывом здесь стал их новый подход к моделированию вознаграждения. Вместо того чтобы использовать сложные нейронные модели вознаграждения, которые могут привести к «взлому вознаграждения» (когда модель находит фиктивные способы увеличить свои вознаграждения, которые на самом деле не приводят к лучшей производительности модели в реальном мире), они разработали умную систему на основе правил, которая сочетает вознаграждения за точность (проверку окончательных ответов) с вознаграждениями за формат (поощрение структурированного мышления). Этот более простой подход оказался более надежным и масштабируемым, чем модели вознаграждения на основе процесса, которые пробовали другие.
Я начинаю по-настоящему верить в SaaS / AI-агентов. Это будет мегатренд, о котором сейчас никто и не подозревает. Я уверен, что на этом пути будет много взлетов и падений.

Deepseek теперь №1 в AppStore, обогнав ChatGPT — не нужны суперкомпьютеры NVIDIA или 100 млн долларов. Настоящее сокровище ИИ — это не пользовательский интерфейс или модель — они стали товарами. Истинная ценность заключается в данных и метаданных, кислороде, питающем потенциал ИИ. Будущие богатства — в наших данных.

Не нужно платить 200$ за использование Operator. Вы можете создать агента, использующего веб-браузер, не написав ни строчки кода. Объедините DeepSeek R1 и Browser Use (бесплатный и с открытым исходным кодом), и все готово. А приложение RAG поможет с обменом данными с вашими PDF-файлами с использованием модели DeepSeek R1, работающей локально на вашем компьютере.

Я установил локальную версию DeepSeek R1 на свой старенький мак всего за 3-4 минуты и меня удивила производительность. Теперь у меня есть свой мощный и шустрый ИИ-помощник, который всегда со мной, даже если у меня нет интернета.

Если кто-то хочет попробовать работу этого помощника, ставьте плюс в комментариях, выложу 6 скриншотов как быстро установить DeepSeek R1. Попробуйте с простой версии, но если у вас шустрая и мощная машина, можете выбрать из списка версию помощнее.

★30

48 комментариев

грааль это запекшаяся кровь распятого еврея
это фу

Валерий Осипенко

27 января 2025, 19:58
Ответить

Не очень понял, в чем разница между ChatGpt помимо того, что без инета? Ему можно какие-то свои данные скормить?

Василий Петров

27 января 2025, 20:17
Ответить

Василий Петров, ну если функционал тот же, то это тоже самое, что проводной телефон vs мобильник.

А что касается функционала, то один из самых распространённых функционалов ИИ это генерация картинок и текста, видимо теперь это возможно делать автономно.

Evvibris

27 января 2025, 21:22
Ответить

Evvibris, Самая распространённая функция — это анализ кода и его написание. Практически все модели отдельно натачивают под программирование. Использование ИИ программиста в среднем увеличивает производительность программистов на 25–60%.
----
снизу текст переписанный ЯндексГПТ из контекстного меню Яндекс Браузера
----
Наиболее распространённой функцией является анализ и написание кода. Практически все модели специально обучаются для этой задачи. В среднем, использование ИИ-программиста повышает производительность программистов на 25–60%.

Максим

28 января 2025, 10:18
Ответить

Василий Петров, люди наклепали таких движков — как говна за баней

хайп с DeepSeek оплатил тот, кто захотел зайти в NVidia

разводняк))

GOLD

28 января 2025, 16:58
Ответить

Василий Петров, короч основная фишка в том, что просто меньше ресурсов жрет и всё, отсюда и весь хайп. Потестил немного, так тяжелее сказать, кто лучше код пишет или что-то делает там. По-моему ChatGpt пока получше.

Василий Петров

28 января 2025, 17:41
Ответить

-2

А что значит «вознаграждение»? Кого вознаграждают? ИИ? А что ему нужно? Чтоб кожаный мешок сказал — «спасибо»? Или «да, повелитель»?

Himmel

27 января 2025, 20:49
Ответить

Himmel, «Вознаграждение» — чисто математический термин, ИИ-модели ставят метрики и по мере их достижения (миллионы и миллиарды итераций) начисляют бонусы, которые модель пытается увеличить.

Максим

28 января 2025, 10:21
Ответить

Максим, в общем бесполезная инфа для обычного юзера, понятно

Himmel

28 января 2025, 11:07
Ответить

ставлю +

Григорий Брусанов

27 января 2025, 21:17
Ответить

Весь интернет засрали этим DeepSeek. Однако, первый же мой вопрос поставил его в тупик. Даже не так — он просто выдумал ответ. Я его спросил — как получить дату создания AWS IoT Thing. Правильный ответ — никак. Ответ DeepSeek — используйте поле version, считайте его количеством миллисекунд с 1970 года. ChatGPT не лучше, тоже выдумывает ответ.

averbin

27 января 2025, 21:22
Ответить

+19

averbin, его же бывшие студенты делали. На экзамене нельзя говорить «не знаю». Намного безопаснее нести выдуманную херню, издали хоть чуть-чуть похожую на правду. Авось трояк и поставят.

Плантатор Мигель

27 января 2025, 21:56
Ответить

Плантатор Мигель, вообще-то на некоторые вопросы только так и можно ответить: «не знаю». Такой ответ дорогого стоит. Даже на экзамене. Это начало научного исследования или личностного роста, вообще-то, а не его конец, если соврать в этой точке самому себе.

il_dottore

28 января 2025, 04:55
Ответить

Не пидиди, на стареньком мак вы ничего нормального не запустите

Beach Bunny

27 января 2025, 22:01
Ответить

Beach Bunny, Вы правы.

Вот так работает модель 8B.

PALINDROM

03 февраля 2025, 17:37
Ответить

PALINDROM, зачем в консоли работать
Поставь расширение для браузера
Firefox addons.mozilla.org/ru/firefox/addon/page-assist/
Chrome chrome.google.com/webstore/detail/page-assist/jfgfiigpkhlkbnfnbobbkinehhfdhndo

будет как в почти как в ChatGPT

Beach Bunny

03 февраля 2025, 21:05
Ответить

Beach Bunny, да я поставил Chatbox. НО у меня железо даже 8B не тянет. Я просто попробовал…

PALINDROM

03 февраля 2025, 21:20
Ответить

Опять «новая парадигма» что ли?

Iskanderravilov

27 января 2025, 22:09
Ответить

А пельмешки умеет варить хоть?

Доктор

27 января 2025, 22:37
Ответить

На первый взгляд просто и красиво, но время покажет, что из себя на самом деле представляет этот бесплатный китайский сыр и стоит ли ему доверять

Makstrade

27 января 2025, 23:07
Ответить

Maximu$

27 января 2025, 23:18
Ответить

DeepSeek заявили, что работа сервиса ухудшилась из-за крупномасштабной вредоносной атаки.)

Makstrade

27 января 2025, 23:30
Ответить

Ссерджио

28 января 2025, 00:16
Ответить

как приготовить свиные крылышки — она что твечает?

Константин Дубровин

28 января 2025, 00:47
Ответить

Кто-то поставил даже два ++. Держите скриншоты. Я установил самую простенькую версию из списка, чтобы потестить. Если у вас новый мощный комп, то можете выбрать и помощнее из предложенного списка. Удачи всем. Кто установит и получит удовольствие от своего персонального помощника — ставьте лайки.

Скриншоты для установки DeepSeek на локальный комп

Moris

28 января 2025, 00:49
Ответить

Нельзя выкладывать в одном комменте все скрины. Тот был последним, четвертым. Далее будут остальные.
Это — первый.

Moris

28 января 2025, 00:51
Ответить

Moris, так это обрубки от той модель что используется на сайте, чтобы запустить полновесный r1 на стационарном компьютере нужно несколько промышленных видеокарт на борту

IT_LONG

28 января 2025, 00:56
Ответить

Это второй скрин.

Moris

28 января 2025, 00:52
Ответить

Это третий скрин.

Moris

28 января 2025, 00:52
Ответить

Тем кто сомневается, вот официальное заявление NVDA.

Nvidia $NVDA just released a statement regarding DeepSeek:
«DeepSeek is an excellent AI advancement and a perfect example of Test Time Scaling. DeepSeek’s work illustrates how new models can be created using that technique, leveraging widely-available models and compute that is fully export control compliant. Inference requires significant numbers of NVIDIA GPUs and high-performance networking. We now have three scaling laws: pre-training and post-training, which continue, and new test-time scaling.»

Moris

28 января 2025, 00:57
Ответить

Moris, Тем кто сомневается, вот официальное заявление NVDA.

Nvidia $ NVDA только что опубликовала заявление относительно DeepSeek:
«DeepSeek — отличное решение для искусственного интеллекта и прекрасный пример масштабирования времени тестирования. Работа DeepSeek иллюстрирует, как с помощью этой технологии можно создавать новые модели, используя широко доступные модели и вычисления, полностью соответствующие требованиям экспортного контроля. Для вывода требуется значительное количество графических процессоров NVIDIA и высокопроизводительные сети. Теперь у нас есть три закона масштабирования: предтренировочное и посттренировочное, которые продолжаются, и новое масштабирование во время тестирования ».

Максим

28 января 2025, 10:24
Ответить

А из него можно шашлык сделать?.. неповеришь. баранина надоела.

Strelok1985

28 января 2025, 08:32
Ответить

Зачем макбук? Давай обзор на винде

Андрей Новиков

28 января 2025, 13:18
Ответить

Ссылка на инструкцию по локальной установке LLM DeepSeek R1
www.reddit.com/r/selfhosted/comments/1i6ggyh/got_deepseek_r1_running_locally_full_setup_guide/

John Snow

28 января 2025, 14:08
Ответить

РоманР

28 января 2025, 14:12
Ответить

На Хабре уже написали, что толку от модели с малым количеством параметров никакого, а для более-менее моделей, генерирующих вменяемые ответы домашнее железо не подойдёт. Ну и люди сомневаются, что ее обучение действительно обошлось дёшево, а не является скамом ради сбора инвестиций

Евграфович

28 января 2025, 15:24
Ответить

Будем честны, дипсик бесплатный но самый крутой, но сервера виснут от запросов, и работать просто невыносимо с ним, стоит внутренний ограничитель запросов в день это ощущается

Владислав К

03 февраля 2025, 13:39
Ответить

Старенький mac это какой?

PALINDROM

03 февраля 2025, 17:17
Ответить

PALINDROM,

Moris

03 февраля 2025, 20:01
Ответить

Moris, Спасибо за информацию. Вы 8B установили? Насколько шустро работает?

PALINDROM

03 февраля 2025, 20:08
Ответить

PALINDROM, Нет. Я установил самую простую, чтобы потестить. Довольно быстро работает.

Moris

03 февраля 2025, 21:21
Ответить

Moris, самую простую это 1,5?

PALINDROM

03 февраля 2025, 21:38
Ответить

PALINDROM, Ну конечно

Moris

03 февраля 2025, 22:30
Ответить

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

DeepSeek, по сути взломал один из святых Граалей ИИ

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога Moris

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

DeepSeek, по сути взломал один из святых Граалей ИИ

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога Moris