Moris
Moris личный блог
27 января 2025, 19:31

DeepSeek, по сути взломал один из святых Граалей ИИ

Эксперимент DeepSeek-R1-Zero показал нечто замечательное: используя чистое обучение с подкреплением с тщательно продуманными функциями вознаграждения, им удалось заставить модели развивать сложные способности рассуждения полностью автономно. Речь шла не только о решении проблем — модель органически научилась генерировать длинные цепочки мыслей, самостоятельно проверять свою работу и выделять больше вычислительного времени для более сложных задач.

Техническим прорывом здесь стал их новый подход к моделированию вознаграждения. Вместо того чтобы использовать сложные нейронные модели вознаграждения, которые могут привести к «взлому вознаграждения» (когда модель находит фиктивные способы увеличить свои вознаграждения, которые на самом деле не приводят к лучшей производительности модели в реальном мире), они разработали умную систему на основе правил, которая сочетает вознаграждения за точность (проверку окончательных ответов) с вознаграждениями за формат (поощрение структурированного мышления). Этот более простой подход оказался более надежным и масштабируемым, чем модели вознаграждения на основе процесса, которые пробовали другие.
Я начинаю по-настоящему верить в SaaS / AI-агентов. Это будет мегатренд, о котором сейчас никто и не подозревает. Я уверен, что на этом пути будет много взлетов и падений.

Deepseek теперь №1 в AppStore, обогнав ChatGPT — не нужны суперкомпьютеры NVIDIA или 100 млн долларов. Настоящее сокровище ИИ — это не пользовательский интерфейс или модель — они стали товарами. Истинная ценность заключается в данных и метаданных, кислороде, питающем потенциал ИИ. Будущие богатства — в наших данных. 

Не нужно платить 200$ за использование Operator. Вы можете создать агента, использующего веб-браузер, не написав ни строчки кода. Объедините DeepSeek R1 и Browser Use (бесплатный и с открытым исходным кодом), и все готово. А приложение RAG поможет с обменом данными с вашими PDF-файлами с использованием модели DeepSeek R1, работающей локально на вашем компьютере.

Я установил локальную версию DeepSeek R1 на свой старенький мак всего за 3-4 минуты и меня удивила производительность. Теперь у меня есть свой мощный и шустрый ИИ-помощник, который всегда со мной, даже если у меня нет интернета. 

Если кто-то хочет попробовать работу этого помощника, ставьте плюс в комментариях, выложу 6 скриншотов как быстро установить DeepSeek R1. Попробуйте с простой версии, но если у вас шустрая и мощная машина, можете выбрать из списка версию помощнее.

   
48 Комментариев
  • Валерий Осипенко
    27 января 2025, 19:58
    грааль это запекшаяся кровь распятого еврея 
    это фу
  • Василий Петров
    27 января 2025, 20:17
    Не очень понял, в чем разница между ChatGpt помимо того, что без инета? Ему можно какие-то свои данные скормить?
    • Evvibris
      27 января 2025, 21:22
      Василий Петров, ну если функционал тот же, то это тоже самое, что проводной телефон vs мобильник. 

      А что касается функционала, то один из самых распространённых функционалов ИИ это генерация картинок и текста, видимо теперь это возможно делать автономно. 
      • Максим
        28 января 2025, 10:18
        Evvibris, Самая распространённая функция — это анализ кода и его написание. Практически все модели отдельно натачивают под программирование. Использование ИИ программиста в среднем увеличивает производительность программистов на 25–60%.
        ----
        снизу текст переписанный ЯндексГПТ из контекстного меню Яндекс Браузера
        ----
        Наиболее распространённой функцией является анализ и написание кода. Практически все модели специально обучаются для этой задачи. В среднем, использование ИИ-программиста повышает производительность программистов на 25–60%.
    • GOLD
      28 января 2025, 16:58
      Василий Петров, люди наклепали таких движков — как говна за баней

      хайп с DeepSeek оплатил тот, кто захотел зайти в NVidia

      разводняк))
    • Василий Петров
      28 января 2025, 17:41
      Василий Петров, короч основная фишка в том, что просто меньше ресурсов жрет и всё, отсюда и весь хайп. Потестил немного, так тяжелее сказать, кто лучше код пишет или что-то делает там. По-моему ChatGpt пока получше.
  • Himmel
    27 января 2025, 20:49
    А что значит «вознаграждение»? Кого вознаграждают? ИИ? А что ему нужно? Чтоб кожаный мешок сказал — «спасибо»? Или «да, повелитель»?
    • Максим
      28 января 2025, 10:21
      Himmel, «Вознаграждение» — чисто математический термин, ИИ-модели ставят метрики и по мере их достижения (миллионы и миллиарды итераций) начисляют бонусы, которые модель пытается увеличить.
      • Himmel
        28 января 2025, 11:07
        Максим, в общем бесполезная инфа для обычного юзера, понятно
  • Григорий Брусанов
    27 января 2025, 21:17
    ставлю +
  • averbin
    27 января 2025, 21:22
    Весь интернет засрали этим DeepSeek. Однако, первый же мой вопрос поставил его в тупик. Даже не так — он просто выдумал ответ. Я его спросил — как получить дату создания AWS IoT Thing. Правильный ответ — никак. Ответ DeepSeek — используйте поле version, считайте его количеством миллисекунд с 1970 года. ChatGPT не лучше, тоже выдумывает ответ.
    • Плантатор Мигель
      27 января 2025, 21:56
      averbin, его же бывшие студенты делали. На экзамене нельзя говорить «не знаю». Намного безопаснее нести выдуманную херню, издали хоть чуть-чуть похожую на правду. Авось трояк и поставят.
      • il_dottore
        28 января 2025, 04:55
        Плантатор Мигель, вообще-то на некоторые вопросы только так и можно ответить: «не знаю». Такой ответ дорогого стоит. Даже на экзамене. Это начало научного исследования или личностного роста, вообще-то, а не его конец, если соврать в этой точке самому себе.
  • Beach Bunny
    27 января 2025, 22:01
    Не пидиди, на стареньком мак вы ничего нормального не запустите
  • Iskanderravilov
    27 января 2025, 22:09
    Опять «новая парадигма» что ли?
  • Доктор
    27 января 2025, 22:37
    А пельмешки умеет варить хоть?
  • Makstrade
    27 января 2025, 23:07
    На первый взгляд просто и красиво, но время покажет, что из себя на самом деле представляет этот бесплатный китайский сыр и стоит ли ему доверять
  • Maximu$
    27 января 2025, 23:18
    ++
  • Makstrade
    27 января 2025, 23:30
    DeepSeek заявили, что работа сервиса ухудшилась из-за крупномасштабной вредоносной атаки.)
  • Ссерджио
    28 января 2025, 00:16
    +

  • Константин Дубровин
    28 января 2025, 00:47
    как приготовить свиные крылышки — она что твечает?
    • IT_LONG
      28 января 2025, 00:56
      Moris, так это обрубки от той модель что используется на сайте, чтобы запустить полновесный r1 на стационарном компьютере нужно несколько промышленных видеокарт на борту
    • Максим
      28 января 2025, 10:24
      Moris,  Тем кто сомневается, вот официальное заявление NVDA.

      Nvidia $ NVDA только что опубликовала заявление относительно DeepSeek:
      «DeepSeek — отличное решение для искусственного интеллекта и прекрасный пример масштабирования времени тестирования. Работа DeepSeek иллюстрирует, как с помощью этой технологии можно создавать новые модели, используя широко доступные модели и вычисления, полностью соответствующие требованиям экспортного контроля. Для вывода требуется значительное количество графических процессоров NVIDIA и высокопроизводительные сети. Теперь у нас есть три закона масштабирования: предтренировочное и посттренировочное, которые продолжаются, и новое масштабирование во время тестирования ».

  • Strelok1985
    28 января 2025, 08:32
    А из него можно шашлык сделать?.. неповеришь. баранина надоела.
  • Андрей Новиков
    28 января 2025, 13:18
    Зачем макбук? Давай обзор на винде
  • John Snow
    28 января 2025, 14:08
    Ссылка на инструкцию по локальной установке LLM DeepSeek R1
    www.reddit.com/r/selfhosted/comments/1i6ggyh/got_deepseek_r1_running_locally_full_setup_guide/
  • РоманР
    28 января 2025, 14:12
    ++
  • Евграфович
    28 января 2025, 15:24
    На Хабре уже написали, что толку от модели с малым количеством параметров никакого, а для более-менее моделей, генерирующих вменяемые ответы домашнее железо не подойдёт. Ну и люди сомневаются, что ее обучение действительно обошлось дёшево, а не является скамом ради сбора инвестиций
  • Владислав К
    03 февраля 2025, 13:39
    Будем честны, дипсик бесплатный но самый крутой, но сервера виснут от запросов, и работать просто невыносимо с ним, стоит внутренний ограничитель запросов в день это ощущается
  • PALINDROM
    03 февраля 2025, 17:17
    Старенький mac это какой?
      • PALINDROM
        03 февраля 2025, 20:08
        Moris, Спасибо за информацию. Вы 8B установили? Насколько шустро работает?
          • PALINDROM
            03 февраля 2025, 21:38
            Moris, самую простую это 1,5?

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн