Эксперимент DeepSeek-R1-Zero показал нечто замечательное: используя чистое обучение с подкреплением с тщательно продуманными функциями вознаграждения, им удалось заставить модели развивать сложные способности рассуждения полностью автономно. Речь шла не только о решении проблем — модель органически научилась генерировать длинные цепочки мыслей, самостоятельно проверять свою работу и выделять больше вычислительного времени для более сложных задач.
Техническим прорывом здесь стал их новый подход к моделированию вознаграждения. Вместо того чтобы использовать сложные нейронные модели вознаграждения, которые могут привести к «взлому вознаграждения» (когда модель находит фиктивные способы увеличить свои вознаграждения, которые на самом деле не приводят к лучшей производительности модели в реальном мире), они разработали умную систему на основе правил, которая сочетает вознаграждения за точность (проверку окончательных ответов) с вознаграждениями за формат (поощрение структурированного мышления). Этот более простой подход оказался более надежным и масштабируемым, чем модели вознаграждения на основе процесса, которые пробовали другие.
Я начинаю по-настоящему верить в SaaS / AI-агентов. Это будет мегатренд, о котором сейчас никто и не подозревает. Я уверен, что на этом пути будет много взлетов и падений.
Deepseek теперь №1 в AppStore, обогнав ChatGPT — не нужны суперкомпьютеры NVIDIA или 100 млн долларов. Настоящее сокровище ИИ — это не пользовательский интерфейс или модель — они стали товарами. Истинная ценность заключается в данных и метаданных, кислороде, питающем потенциал ИИ. Будущие богатства — в наших данных.
Не нужно платить 200$ за использование Operator. Вы можете создать агента, использующего веб-браузер, не написав ни строчки кода. Объедините DeepSeek R1 и Browser Use (бесплатный и с открытым исходным кодом), и все готово. А приложение RAG поможет с обменом данными с вашими PDF-файлами с использованием модели DeepSeek R1, работающей локально на вашем компьютере.
Я установил локальную версию DeepSeek R1 на свой старенький мак всего за 3-4 минуты и меня удивила производительность. Теперь у меня есть свой мощный и шустрый ИИ-помощник, который всегда со мной, даже если у меня нет интернета.
Если кто-то хочет попробовать работу этого помощника, ставьте плюс в комментариях, выложу 6 скриншотов как быстро установить DeepSeek R1. Попробуйте с простой версии, но если у вас шустрая и мощная машина, можете выбрать из списка версию помощнее.
это фу
А что касается функционала, то один из самых распространённых функционалов ИИ это генерация картинок и текста, видимо теперь это возможно делать автономно.
----
снизу текст переписанный ЯндексГПТ из контекстного меню Яндекс Браузера
----
Наиболее распространённой функцией является анализ и написание кода. Практически все модели специально обучаются для этой задачи. В среднем, использование ИИ-программиста повышает производительность программистов на 25–60%.
хайп с DeepSeek оплатил тот, кто захотел зайти в NVidia
разводняк))
Вот так работает модель 8B.
Поставь расширение для браузера
Firefox addons.mozilla.org/ru/firefox/addon/page-assist/
Chrome chrome.google.com/webstore/detail/page-assist/jfgfiigpkhlkbnfnbobbkinehhfdhndo
будет как в почти как в ChatGPT
Это — первый.
Nvidia $NVDA just released a statement regarding DeepSeek:
«DeepSeek is an excellent AI advancement and a perfect example of Test Time Scaling. DeepSeek’s work illustrates how new models can be created using that technique, leveraging widely-available models and compute that is fully export control compliant. Inference requires significant numbers of NVIDIA GPUs and high-performance networking. We now have three scaling laws: pre-training and post-training, which continue, and new test-time scaling.»
Nvidia $ NVDA только что опубликовала заявление относительно DeepSeek:
«DeepSeek — отличное решение для искусственного интеллекта и прекрасный пример масштабирования времени тестирования. Работа DeepSeek иллюстрирует, как с помощью этой технологии можно создавать новые модели, используя широко доступные модели и вычисления, полностью соответствующие требованиям экспортного контроля. Для вывода требуется значительное количество графических процессоров NVIDIA и высокопроизводительные сети. Теперь у нас есть три закона масштабирования: предтренировочное и посттренировочное, которые продолжаются, и новое масштабирование во время тестирования ».
www.reddit.com/r/selfhosted/comments/1i6ggyh/got_deepseek_r1_running_locally_full_setup_guide/