Народ, ловите момент - это будет покруче появления ChatGPT

27 января 2025, 15:46
|
Гуру Хренов

Все рынки валятся сегодня в Штатах, и боюсь, что эта коррекция надолго.
Причина всего этого — не Трамп и не ключевая ставка в Японии
Причина называется Deepseek. Не путать с Dickpic !
Короткое объяснение:
Китайцы выкатили OpenSource — модель, которая работает лучше OpenAI 4o, запускается на дешевой видеокарте и была (по их словам) натренирована за копейки по сравнению с тем, что потратили OpenAI. А запустить ее можно буквально на своем компе, скачав из сети — там есть несколько вариантов на выбор, с разными размерами!!! Стоимость токена упала до нуля, и не надо больше платить кровопийцам из OpenAI за их API или 20 / 200 долл в месяц за ChatGpt!!
Эти новости поступили буквально в последние несколько дней, и ставят под сомнение, что миллиарды, потраченные в Штатах на создание моделей — когда нибудь окупятся
Равно как и лидерство США в области AI. Считалось, что Китай отстает на 2-3 года, а получилось, что он как минимум идет ноздря в ноздрю, а может и опережает.
Посыпятся сегодня все производители чипов и все Hyperscalers ( microsoft, amazon, google, fb)
Я постараюсь к концу дня протестировать эту шнягу и отдельный пост напиcать, если не лень будет.
В любом случае — следите за происходящим, это как остросюжетный сериал, только в реальном времени и с реальными действующими лицами.

спецраздел:
Акции

обсудить на форуме:
S&P500 фьючерс | SPX,
NVIDIA

★15

116 комментариев

ПОКА лишь легкая плановая коррекция

ВВШ

27 января 2025, 19:06
Ответить

ВВШ, пока лишь никто еще не осознал, что у OpenAI, Antropic — больше нет бизнес-модели, а у Hyperscalers надо прогнозы прибыли пересматривать

Гуру Хренов

27 января 2025, 15:52
Ответить

Гуру Хренов, это всего лишь детские полуигрушки

ВВШ

27 января 2025, 15:53
Ответить

Гуру Хренов,

пока лишь никто еще не осознал, что у OpenAI, Antropic — больше нет бизнес-модели, а у Hyperscalers надо прогнозы прибыли пересматривать

Получается, что это только вы осознали, но — это всего лишь только ваше мнение и вы точно не владеете информацией )

Причина называется Deepseek

Причина в том, что деревья не растут до небес и надо же… иногда бывают коррекции )

А Deepseek это просто китайский вариант цап царапа )

Makstrade

28 января 2025, 13:24
Ответить

ВВШ, пока лишь и коррекции даже нет. Это пре-маркет всего лишь. Всепропальщики, как обычно, забежали вперед.

Вася Пражкин

27 января 2025, 17:06
Ответить

Вася Пражкин, --- корррекция есть и будет еще. и на то есть настоязие причины. тем кому положено в курсе. остальным не зачем.все равно серьезно не спекулируют.

ВВШ

27 января 2025, 17:12
Ответить

Эх, не торгуй по новостям говорили они… Ладно, шортану немного сп500, кину фишку на стол…

Vlad Kol

27 января 2025, 15:51
Ответить

у китайцев вся письменность на интуитиве
сомнительны их успехи в формализованном слове
скорей это понт
китай поэтому не способен создать ничего нового
только копир, но и то хорошо

Валерий Осипенко

27 января 2025, 15:52
Ответить

Валерий Осипенко, они смогли то ли скопипиздить, то ли как то реверсэнжинирить OpenAI так, что DeepSeek, если его спросить что это за модель — говорит что он OpenAI. Короче, может это просто очень удачный промышленный шпионаж

Гуру Хренов

27 января 2025, 15:56
Ответить

Гуру Хренов, скорей всего именно так

Валерий Осипенко

27 января 2025, 15:59
Ответить

Гуру Хренов, а может пробросили порты через себя на OpenAI?

Ийон Тихий

27 января 2025, 20:02
Ответить

Гуру Хренов, зачем придумывать небылицы ?

Максим Петров

28 января 2025, 01:37
Ответить

Гуру Хренов, Ещё Ульянов Ленин (Запрещен в РФ, как иноагент) говорил, что во время соревнования создаётся лучший продукт. Поэтому кураторы Ленина и сегодня это практикуют. ИИ забуксовал в штатах и поэтому дали возможность китайцам работать в этом направлении, чтобы работа шла плодотворней. Ведь чипирование масс в мире и цифровые деньги нужно вводить как можно скорее.

Диванный аналитик-практик

28 января 2025, 09:33
Ответить

Валерий Осипенко, конечно эти бездарные китайцы не что не смогут, они нули полные. и дипсик этот ихний никакая не модель — там просто сидит сто мильонов студентов и обрабатывают ваши запросы, строчат вам ответы, а вы думаете что это чат бот в облаке.

Drew Wert

27 января 2025, 16:45
Ответить

Drew Wert, ви правы

Валерий Осипенко

27 января 2025, 16:56
Ответить

Шарик, ты балбес ©

Зачем ты пишешь про LLM-ки, если по тексту видно, что ты никакого отношения к нейросеткам не имеешь?

BobbyKotick

27 января 2025, 15:53
Ответить

BobbyKotick, Барбос, ты хам

Гуру Хренов

27 января 2025, 15:56
Ответить

Киты же вроде ток вчера смогли 1о догнать, чё уже 4о нагнули??? Если инфа реальная, то США уже сами отстают на пару лет, а через пару лет будут отставать на пол века.

Енох

27 января 2025, 15:55
Ответить

Этот Deepseek требует 670 гигов VRAM, и доступен только серьёзным конторам. Обычному человеку просто некуда засунуть столько видеокарт.

Netro

27 января 2025, 15:56
Ответить

Netro, там есть несколько вариантов моделей для скачивания, с разными требованиями к памяти. Но я конечно не имел в виду, что это можно запустить на игровом компе. Сам факт того, что модель открыта для скачивания и работает так же хорошо, как и передовые закрытые модели — позволяет очень дешево разворачивать свои собственные API и не платить OpenAI например

Гуру Хренов

27 января 2025, 16:09
Ответить

Гуру Хренов, ну в той или иной задаче открытые модели начали обгонять OpenAI ещё со второй половины прошлого года, что там в Deepseek хорошего — не знаю, но QwenCoder сильно сделал шаг вперёд в области кодинга. Сейчас всё внимание на 32B и 72b модели, кои можно запустить на домашнем компе. Я думаю, когда они поставят на колени ChatGPT — вопрос нескольких месяцев.

Netro

27 января 2025, 18:13
Ответить

Netro, вот именно! на разработку моделей OpenAI Anthropic и собственных моделей от Амазона Фейсбука и т д — были потрачены миллиарды денег, и уже тогда не было видно, как они окупятся. А сейчас — тем более. Повторяется ситуация с прокладкой оптоволокна по всему миру в начале века. Вот до чего довел планету этот фигляр ПэЖэ. То есть — я хотел сказать, вот к чему приводит свободный обмен информацией. Инвестируют во все это гуглы, а пользуются результатами — китайцы

Гуру Хренов

27 января 2025, 18:19
Ответить

Гуру Хренов, ваш Эпелл инвестировал в рабов Фохкон которые скрюченными от дихлорэтана пальцами приклеивали экраны Айфонов за 5 центов. А ещё Ваша Омерика нахаляву получила кучу спецов которых растили и обучали в других странах. Всего то надо было через своих Чубайсов/Зеленских/Штольцев создать невыносимые условия на их родине. В вашем CNN этого наверное не пишут ?

«Главное при расследовании коррупционной схемы не выйти на самого себя» © прокурор

Максим

28 января 2025, 10:39
Ответить

Netro, 32B и 72B модели, насколько я понимаю, всё-таки для компаний для запуска на сервере с A100/H100 с 80 Гб видеопамяти. На домашнем ПК с 8-12 GB VRAM можно запустить 7/13B модели, а они всё же туповаты для практического использования.

Максим

28 января 2025, 10:34
Ответить

Netro,Llama 3.1 на 400B требовала примерно столько же, есть дистиллированные и квантованные версии любых открытых моделей, которые можно запустить на ПК, начиная с 7B / 13B.

Максим

28 января 2025, 10:31
Ответить

А ссыли-то какие-то будут на матчасть?

MadQuant

27 января 2025, 15:56
Ответить

MadQuant, сегодня буду все тестировать, мне как раз надо код странички подшаманить

Гуру Хренов

27 января 2025, 15:57
Ответить

MadQuant, Вот их статья github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

Иван-дурак

27 января 2025, 16:07
Ответить

MadQuant, deepseek-ai.ru/
сами протестируйте.
Меня не впечатлило .

Сергей Кузнецов

27 января 2025, 16:38
Ответить

Ed Wilde,

События на площади Тяньаньмэнь в 1989 году представляют собой серию антиправительственных протестов, которые проходили в Китае с апреля по июнь. Протесты были жестоко подавлены военными, что привело к значительным жертвам и международному осуждению. Общие сведения о протестах

Протесты начались 15 апреля 1989 года и продолжались до 4 июня того же года.
Участниками протестов были студенты, рабочие и другие граждане, требующие политических реформ, борьбы с коррупцией и большей свободы слова.
Протестующие заняли площадь Тяньаньмэнь в Пекине, где организовали лагерь и проводили митинги.

Причины протестов

Смерть бывшего генерального секретаря КПК Ху Яобана в апреле 1989 года стала катализатором для массовых демонстраций.
Протестующие выступали против медленных темпов экономических реформ и коррупции в правительстве.
Основные требования включали демократизацию, свободу прессы и улучшение условий жизни.

Подавление протестов

В ночь с 3 на 4 июня 1989 года Народно-освободительная армия Китая (НОАК) начала операцию по разгрому протестующих.
Военные использовали танки и огнестрельное оружие против безоружных демонстрантов, что привело к многочисленным жертвам.
Официальные данные о погибших варьируются от 200 до 300 человек, однако независимые оценки говорят о тысячах погибших.

Последствия

Подавление протестов вызвало международное осуждение и привело к санкциям против Китая.
Внутри страны власти усилили контроль над информацией и запретили обсуждение событий на площади Тяньаньмэнь.
Протесты стали символом борьбы за демократию в Китае и остаются важной темой для правозащитников и активистов по всему миру.

Сергей Хорошавин

27 января 2025, 17:00
Ответить

Не путать с Dickpic !

И с big dick!

SOL

27 января 2025, 15:59
Ответить

пенисам нато надо как-то оправдать провал их ЫЫ.
Кусты'2023 уже не помогают.
И тут как раз Deepseek вовремя подвернулся.

Safe2021

27 января 2025, 16:01
Ответить

+15

Мысль интересная, но слабо аргументированная (IMHO)
(если что, на постоянке юзаю и o1, теперь и R1, R1, кстати, значительно сильнее o1 подвержена галлюцинированию и придумкам)

Предлагаю более логичное объяснение в духе теории заговоров:

1. У США все хорошо с данными (в плане Big Data), у Китая — нет. Ну т.е., наверное, не стоит учить модели с претензией на универсальность на данных, запертых внутри Великого Китайского Стена Файерволла.
Соответственно, для доступа к широким мировым данным китайцам надо выкатывать свои модели бесплатно или по копеечной цене.
2. У США есть задел в разработке LLM, и они не любят выкатывать свежие модели. Надеюсь, до конца января заценим o3, а больше ничего крутого с конкретными сроками нам пока не обещают.
У китайцев есть необходимость в публикации свежих моделей (см. п.1 про данные для обучения).
3. Вот никто никогда не предъявит пруфов, что 10 китайских студентов обучили новейшую модель на коленке и 100 компьютерах с примитивными видяхами. Скорее (вспоминая историю с Huawei) это чисто легенда, а в реале было огромное спонсирование со стороны Правительства КНР, да и обучение происходило на гигантском количестве ввезенных в обход санкций свежих актуальных нейропроцессоров.

Так что я бы не стал раньше времени хоронить AI в США и ставить на Китай.
PR получился хорошим, это да.
Но PR, собссно, именно для этого и нужен )))

С уважением

Мальчик buybuy

27 января 2025, 16:08
Ответить

Мальчик buybuy, Huawei начинал с того, что просто сп… л технологии у Nortel, а потом уже на этом поднялся

Гуру Хренов

27 января 2025, 16:16
Ответить

Гуру Хренов, а что 100 других компаний мешало взять технологии Нортел? а получилось только у Хуавей. Сколько у США не воруй, своего не вернёшь.

Нынешние США поднялись на том что разграбили СССР и страны Восточной Европы (Болгария, Румыния до сих пор в заднице и членство в ЕС не помогло), Ирака, Азии и ЕС… чего собственно в США никто и не скрывает, просто пишут это не в газетах СМИ, а в книгах которые 95% пожирателей гамбургеров не читают.

Максим

28 января 2025, 10:47
Ответить

Как же его протестировать если входа нет
chat.deepseek.com/sign_in
Только поверить на слово что круче всех.

Федор Подпольный

27 января 2025, 16:12
Ответить

Федор Подпольный, https://chat.deepseek.com/sign_up

Гуру Хренов

27 января 2025, 16:14
Ответить

Гуру Хренов, Тут тоже засада. Проверочный код не высылает.

Sorry! We're having trouble sending you an email right now. Please try again later.

Федор Подпольный

27 января 2025, 16:18
Ответить

Федор Подпольный, у меня та же самая проблема

Гуру Хренов

27 января 2025, 18:20
Ответить

Федор Подпольный, deepseek-ai.ru/
так попробуй

Сергей Кузнецов

27 января 2025, 16:39
Ответить

Может я ошибаюсь но ИМХО основная сложность не в самом движке нейросетки а в наборе данных для обучения

Движки много у кого есть, считай у любой крупной корпорации из ИТ

Вот китайцы смогли собрать большой набор данных для обучения, ну молодцы
Выкатили свою LLM

Viacheslav Ivanenkov

27 января 2025, 16:21
Ответить

И кстати… если кто считает что это китайская профанация, то значит через пару-тройку дней американский рынок вернется на вчерашние уровни,
а значит это можно использовать в торговле

Я покупаю Микс

Viacheslav Ivanenkov

27 января 2025, 16:24
Ответить

не, в совок не инвестирую

Мир в экономике

27 января 2025, 16:22
Ответить

В плане технологий Китай нагнет всех. Америка и Европа сколько лет шли к своим ??? А Китай за сколько прошел этот путь??? У него мультипликатор по технологии х5 минимум.

Андрей Борноволоков

27 января 2025, 16:22
Ответить

Андрей Борноволоков,

А Китай за сколько прошел этот путь?

Ну так на сворованном-то фигле не пробежать )) Пусть попробуют вперёд продвинуть

Суши из хрюши, икота и блевота

27 января 2025, 19:11
Ответить

Бабушкин ковер, посмотрите на китайские города… там уже 21 век, а в США бомжи, гопники и наркоманы на улицах.

Максим

28 января 2025, 10:49
Ответить

Максим,

посмотрите на китайские города…

Смотрел. Тотальные заброшки, пустые, словно после апокалипсиса. А бомжи и наркоманы в Китае тоже есть.

Суши из хрюши, икота и блевота

29 января 2025, 14:21
Ответить

Не дают зарегистрироваться, ошибка вылезает, наверное слишком много народу туда полезло.

dmitry71

27 января 2025, 16:22
Ответить

dmitry71, туда полезла сейчас вся калифорния я так думаю

Гуру Хренов

27 января 2025, 16:23
Ответить

Гуру Хренов, погорельцы?

Viacheslav Ivanenkov

27 января 2025, 16:25
Ответить

Viacheslav Ivanenkov, пытаются понять, когда закроют их стартап и выгонят всех на мороз

Гуру Хренов

27 января 2025, 16:35
Ответить

+10

Нормально он работает! Я с утра тестирую)

https://smart-lab.ru/blog/1108763.php вот написал сам про своё влияние на рынок сегодня.

Там сегодня такой наплыв новых юзеров, что он подтормаживает. Не удивительно, новость то как разнесли. В апсторе бьет рекорды. Думаю не только там. Поэтому наверное вам зарегиться не получается. Позже попробуйте.

Для бесплатной версии вообще

Напишите ему собери новости и сделай обзор почему падает российский рынок или можно закинуть скрин графика из трейдингвью и он напишет теханализ. Я пробовал, работает, и на удивление качественно и без воды. но корректировать конечно иногда его надо. Но всё же! За 10 секунд! На реальных текущих данных собирает ответ и четко его формулирует.

Короче, большая часть смарт-лаба и других околрыночных обзорщиков со в пролете))
Самое интересное, когда ему формулируешь запрос, он сначала прописывает свои рассуждения над ним и источники указывает. Короче, это Zeekr или Li в области ИИ… потому так и очканули на Западе резко.

Вот что он про критику самого себя же пишет, откровенно и интересно:

DeepSeek V3, несмотря на свои инновации и конкурентные преимущества, подвергается критике по нескольким ключевым аспектам в сравнении с ChatGPT-4 и другими генеративными ИИ-моделями. Вот основные причины критики:

---

### 1. **Использование данных конкурентов и нарушение этических норм**
— **Самоидентификация как ChatGPT**: DeepSeek V3 часто ошибочно идентифицирует себя как ChatGPT версии GPT-4, предоставляет инструкции для API OpenAI и даже повторяет шутки, характерные для GPT-4. Это связано с тем, что его обучали на данных, содержащих выходы ChatGPT, что привело к «загрязнению» тренировочного набора и копированию поведения конкурента .
— **Риск нарушения лицензий**: OpenAI запрещает использование своих выходных данных для обучения конкурирующих моделей. Эксперты, такие как Майк Кук из King’s College London, указывают, что такая практика может нарушать условия использования и ухудшать качество модели, подобно «ксерокопии ксерокопии» .

---

### 2. **Технические ограничения и нестабильность**
— **Производительность и баги**: В тестах DeepSeek V3 демонстрирует нестабильность. Например, при решении задачи LeetCode его код не прошел проверку из-за неоптимальных циклов, что привело к превышению лимита времени. Пользователи также жалуются на медленные ответы, частые сбои и неполные решения, особенно в сравнении с более отлаженным ChatGPT-4 Plus .
— **Ограниченная функциональность**: В отличие от мультимодального GPT-4o, DeepSeek V3 работает только с текстом. Хотя его веб-версия поддерживает обработку изображений через отдельные функции, базовая модель не интегрирует аудио или видео .

---

### 3. **Проблемы с оригинальностью и усиление предубеждений**
— **Копирование недостатков GPT-4**: Поскольку DeepSeek V3 частично обучался на данных ChatGPT, он может воспроизводить те же ошибки, предубеждения и «галлюцинации», характерные для исходной модели. Это снижает его надежность в профессиональных сценариях .
— **Отсутствие инноваций**: Некоторые эксперты, включая CEO OpenAI Сэма Альтмана, критикуют подход DeepSeek как «копирование известных решений» вместо создания принципиально новых технологий .

---

### 4. **Этические и юридические риски**
— **Сложность фильтрации AI-контента**: Рост доли сгенерированных ИИ данных в интернете (к 2026 году прогнозируется 90%) усложняет очистку тренировочных наборов. Это повышает риск случайного включения материалов конкурентов, что ставит под сомнение уникальность моделей, подобных DeepSeek V3 .
— **Потенциальные конфликты**: Использование данных GPT-4 может привести к юридическим спорам с OpenAI, особенно если будет доказано прямое копирование .

---

### 5. **Ограничения в специализированных задачах**
— **Узкая направленность**: В отличие от универсального ChatGPT, DeepSeek позиционируется как инструмент для «глубинного поиска» в профессиональных областях (например, медицина, юриспруденция). Однако в тестах его ответы иногда уступают в гибкости и креативности, особенно в творческих заданиях, где ChatGPT демонстрирует более разнообразные решения .
— **Сложности интеграции**: Несмотря на заявленную поддержку API, пользователи отмечают, что для масштабирования DeepSeek V3 в корпоративных решениях требуется дополнительная настройка, тогда как ChatGPT-4o предлагает более готовые решения .

---

### Заключение
DeepSeek V3, безусловно, представляет собой значительный шаг в развитии открытых ИИ-моделей, особенно учитывая его низкую стоимость обучения (557.6 млн долларов против 1 млрд у GPT-4o) и доступность в Китае без VPN. Однако критика фокусируется на этических вопросах, технических недостатках и зависимости от данных конкурентов. Для долгосрочного успеха DeepSeek необходимо усилить оригинальность, стабильность и расширить функциональность, чтобы конкурировать с лидерами рынка.

Андрей Бежин (s_point)

27 января 2025, 16:31
Ответить

Андрей Бежин (s_point), следующий шаг — Трамп вводит эмбарго на китайские модели. Как только ему все объяснят. AI — отрасли штатов без этого не выжить, как не выжить автомобильной отрасли без заградительных пошлин на китайские электромобили

Гуру Хренов

27 января 2025, 16:39
Ответить

Гуру Хренов,
пойдут по пути РКН

Viacheslav Ivanenkov

27 января 2025, 16:42
Ответить

Гуру Хренов, ну тут посложнее чем с авто будет изолироваться, тем более что пол мира теперь очевидно будет использовать более дешевый продукт.

И если одни смогли скопипастить OpenAI то значит и другие смогут. Короче, как бы это не стало поводом для начала большой распродажи техов а-ля 2000. Сейчас ещё Фед подвезёт ястребиных ноток и поехали дальше на Юг

Андрей Бежин (s_point)

27 января 2025, 16:55
Ответить

Андрей Бежин (s_point), на каком почтовом сервисе у Вас был имейл для верификации? На мой yahoo ничего не шлет, ругается

Гуру Хренов

27 января 2025, 18:21
Ответить

Гуру Хренов, gmail

Андрей Бежин (s_point)

28 января 2025, 10:33
Ответить

Андрей Бежин (s_point),

собери новости и сделай обзор почему падает российский рынок

Постфактум вам это любой аналитик за пять секунд сделает..)

можно закинуть скрин графика из трейдингвью и он напишет теханализ.

Получилось стать долларовым миллионером? )

Makstrade

28 января 2025, 13:30
Ответить

причем здесь это? много знаете случаев когда стали долларовыми миллионерами за счёт аналитиков или теханализа?

речь о том, что он действительно работает и легко делает то, что делает 90% авторов смарт-лаба.

Андрей Бежин (s_point)

29 января 2025, 17:02
Ответить

Андрей Бежин (s_point), Так я вам именно это и сказал про аналитиков и про то, что зачем тогда кидать график, чтобы вам выдали то что не приносит миллионы, но вы не поняли)
Тогда совсем не понятно, зачем вам это, если уровень качества материала не особо лучше, чем то что делают 90% смартлаба))

Makstrade

29 января 2025, 19:51
Ответить

ничего он там не рассуждает, тупо все что и так известно сети. Я его много раз спрашивал про фонду с галочкой диптинк, отвечает поверхностной инфой то что есть во всех нейронках

Top Trader

27 января 2025, 16:38
Ответить

Не ну если видео карта за 800тыр рублей для вас дешовая, то эт конечно круто.
Но эт все равно хватит только для модели которая на 32b или 70b параметров, но лучше конечно ДВЕ таких карточки.
Ну а для квантованной урезанной модельки надо что-то RTX 4070Ti и лучше
это от 100тыр
Ну или Mac c M процом и оперативкой от 24Gb.

А для запуска полной версии DeepSeek — надо будет штук 8-10 видеокарт каждая их который стоит от 800тыр
Или сервер арендовать — но стоимость аренды сервака с такми количеством карт вас тоже очень сильно огорчит

Beach Bunny

27 января 2025, 16:50
Ответить

Beach Bunny,

Ну или Mac c M процом и оперативкой от 24Gb.

Вы это серьезно?

Viacheslav Ivanenkov

27 января 2025, 17:03
Ответить

Viacheslav Ivanenkov, абсолютно, если надо запустить на своем компе малую модель DeepSeek

Beach Bunny

27 января 2025, 17:32
Ответить

Viacheslav Ivanenkov, вот что рекомендуется для запуска

Beach Bunny

27 января 2025, 19:04
Ответить

Beach Bunny, в списке нет Эппл с М процем

Viacheslav Ivanenkov

28 января 2025, 08:11
Ответить

Viacheslav Ivanenkov, и что, на них тоже работает, для локальных небольших моделей это дешевле выходит учитывая стоимость NVidia карт

Beach Bunny

28 января 2025, 17:44
Ответить

Beach Bunny, а на компе без Нвидиа локальная небольшая модель не запуститься ?

Например при запуске Ламы можно указать ключ использовать GPU или нет

Viacheslav Ivanenkov

28 января 2025, 19:14
Ответить

Viacheslav Ivanenkov,
Без GPU медленно работать, и малые модели они не для решения задач, а в основном для суммаризации/обобщения информации и простых задач.
И потом простых моделей на 70b параметров с удаленным доступом и бесплатных полно в интернете.
И мощных бесплатных — тоже много.
В том же твиттере есть Grok, у google есть Gemini, у французов есть Mistral — который если для программирования, не хуже ChatGPT и DeepSeek, а иногда даже корректнее работает с меньшим количеством ошибок.
Mistral без впн работает

Beach Bunny

28 января 2025, 19:34
Ответить

Качаем, клиент тут: github.com/LostRuins/koboldcpp/releases/tag/v1.82.4
модели здесь: huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-32B-GGUF
или здесь huggingface.co/unsloth/DeepSeek-R1-Distill-Llama-70B-GGUF
Объем модели (соотв.и качество ответов) подбираем по мощности железа.
У меня на 64Gb памяти модель DeepSeek-R1-Distill-Qwen-32B-Q8_0.gguf запускается, сравнительно медленно работает но терпимо, видеокарта 8Gb AMD.
Хорошо код пишет, только нудный — всё так обстоятельно рассказывает, DeepSeek этот. ))

Andrevs

27 января 2025, 16:47
Ответить

Andrevs, 64Gb памяти — это оперативная? а на видеокарте 8 ГБ ?

Максим

28 января 2025, 10:52
Ответить

Максим, да

Andrevs

28 января 2025, 20:12
Ответить

мой опыт написания кода — любая модель рано или поздно упирается в стену его сложности и размера и начинает косячить. Помогает чистка окна контекста, но это рано или поздно происходит все равно. o1 держится раза в 2-4 дольше (по размеру кода), чем 4o. Посмотрим, что сможет китаец

Гуру Хренов

27 января 2025, 16:50
Ответить

Спасибо, интересно!
Уверен, у истории с названием AI большое продолжение. А невероятных поворотов на пути будет много.

Вместе с тем, американский рынок просится в коррекцию и достаточно взмаха крыла бабочки, чтобы её запустить.

Dangerous Assumption

27 января 2025, 16:53
Ответить

Посмотрим.
Так или иначе, продавать ничего не буду. Напротив, как придут дивы — докуплю индексы

Маркиз Лафайет

27 января 2025, 16:57
Ответить

У них наверняка есть свой «цифровой Путин»

Как сообщает американская пресса, ЦРУ втайне создала цифровые клоны «мировых лидеров» — издания не называют ни одной фамилии. Дипломаты и эксперты, прорабатывающие ту или иную страну, ведут «переговоры» с клоном, как с живым человеком, чтобы узнать, как он будет реагировать. По итогам отбрасываются одни предложения, принимаются другие

Viacheslav Ivanenkov

27 января 2025, 17:00
Ответить

Китаезы сперли чат жпт и выкатили как дикпик даром всем желающим. Смешно. В духе китайцев.
Амеры еще не отошли после того как они электрокары развивали, развивали. А китайцы выкатили свои в 3 раза дешевле… А тут еще интереснее повороты. В целом Китайцы показывают что кроме маркетинга за США мало чего стоит. Но и маркетинг чего-то стоит… А амерский рынок и так пузырь перегретый. Может полететь. Будет весело.

Laukar

27 января 2025, 21:51
Ответить

Прикол! Deepseek что-то знает про Глобальный цивилизационный кризис,:

Глобальный цивилизационный кризис, вызванный нехваткой ресурсов, проявляется в сочетании экономических и экологических проблем, усугубленных изменениями климата. Это приводит к переосмыслению моделей роста и устойчивого развития в современном обществе. Внутренние причины кризиса

Нехватка ресурсов, включая природные и человеческие, создает давление на экономические системы.

Снижение эффективности государственного управления и отсутствие самоорганизации населения усугубляют ситуацию.

Кризис традиционных управляющих систем, вызванный самопрограммированием и искажением восприятия реальности.

Внешние факторы

Глобальный кризис перепроизводства, вызванный высокими технологиями, приводит к культурным барьерам и ограничивает доступ к новым рынкам.

Конкуренция за ресурсы между цивилизациями, особенно в контексте России, которая контролирует уникальные природные ресурсы.

Влияние транснациональных корпораций, которые блокируют передачу технологий и способствуют углублению технологического разрыва.

Социальные и культурные аспекты

Увеличение цифрового неравенства, которое ограничивает доступ к информационным технологиям как для развивающихся, так и для развитых стран.

Вырождение демократии и отрыв элиты от общества, что приводит к потере доверия и снижению ответственности.

Проблемы, связанные с восприятием и пониманием реальности, что создает дополнительные сложности в управлении и принятии решений.

Сергей Хорошавин

27 января 2025, 17:06
Ответить

Хорошо что я zx спектрум не выкинул. На нем буду запускать ИИ

Каторга

27 января 2025, 17:22
Ответить

Если бы OpenAI не выкатили свою модель в открытый доступ, смогли бы китайцы сделать DeepSeek? Ответ: нет, потому что она обучалась на ответах от GPT. Опять же, чтобы обучить можель, нужно минимум в 10 раз меньше ГПУ, чем для инференса. Это знает любой, кто в теме. Так что беспокойство беспричинно.

Make_hard

27 января 2025, 18:42
Ответить

Make_hard, ну да, вместо того, чтобы использовать supervised fine-tuning, когда сажают кучу кенийцев, чтобы они следили, чтобы ChatGPT не сп… л чего то лишнего про меньшинства, просто натренировали на входах / выходах, использовав ChatGPT (и наверное кучу других моделей). Что в принципе тоже неплохое изобретение. И открывает дорогу для санкций в отношении китая за воровство технологий, потому что условия использования от OpenAI наверняка запрещают такие вещи. Надо только дождаться, когда кто то объяснит это Трампу.

Но рядовому пользователю это все пофиг! Если мне надо автоматизировать чатбота для поддержки пользователей, то я поставлю эту штуку на свой сервер и смогу не платить Open AI за их API. Хотя основные деньги в сценарии RAG уходят даже не на inference, а на генерацию Embeddings. Я кстати не знаю — DeepSeek модель для embeddings тоже выкатили ?

Гуру Хренов

27 января 2025, 18:53
Ответить

Гуру Хренов, да ваш ник вам хорошо подходит!)
Процесс, который я описал, называется дистилляция знаний. Коротко, это когда ты более легкую и быструю модель учишь на основе ответов тяжелой и долгой. В итоге получаешь модель, которая быстрее работает и меньше требует железа. На сколько я помню, это Facebook придумали для трансформеров как раз еще года так 4 назад))

Make_hard

27 января 2025, 19:07
Ответить

Make_hard, непонятно, как знание Вами слова «дистилляция» отменяет то, что я написал. Я тоже знаю много слов разных

Гуру Хренов

27 января 2025, 19:10
Ответить

Гуру Хренов, никак, вы абсолютно правы. Я, кстати, статью нашел. Гугл придумал в 21м году) arxiv.org/pdf/2002.03532

То что Китайцев скорее попытаются за это нагнуть абсолютно верно. Я же хочу продолжить свою идею, что падение акций Nvidia и прочих явление весьма временное. До тех пор пока то, что я написал, не скажет какой-нибудь Сэм Альтман или Илон Маск

Make_hard

27 января 2025, 19:13
Ответить

Make_hard,

Коротко, это когда ты более легкую и быструю модель учишь на основе ответов тяжелой и долгой.

А с людьми так можно?

Суши из хрюши, икота и блевота

27 января 2025, 19:10
Ответить

Бабушкин ковер, можно, если предварительно в башку затолкать видеокарту с большим объемом памяти

Beach Bunny

27 января 2025, 19:17
Ответить

Бабушкин ковер, нууу у людей в целом мозг одинаковый +-. Так что вряд-ли. Хотя, наверное, можно найти аналогии

Make_hard

27 января 2025, 19:17
Ответить

Make_hard, сомнительно

Валерий Осипенко

27 января 2025, 20:38
Ответить

Бабушкин ковер, репетиторство называется.

svgr

28 января 2025, 13:13
Ответить

svgr, не гарантия, увы!

Суши из хрюши, икота и блевота

29 января 2025, 14:39
Ответить

Как же вас развести легко!

Суши из хрюши, икота и блевота

27 января 2025, 19:09
Ответить

DeepSeek будет ПЛАТНЫМ после 8 февраля 2025 !
Это у них написано.
Оплата в $$$ так российские банковские карты в пролете.

Beach Bunny

27 января 2025, 19:14
Ответить

Никита Шляпников, чтобы всех нелегальных мигрантов вывезти теми темпами, которыми сейчас это делается — понадобятся десятилетия, которых у Трампа нет. Весь этот кипеж с нелегальными мигрантами — это хайп, чтобы голосов на выборах получить побольше. Что Трампу в общем-то удалось

Пока что они из тюрем и из баз данных полиции отбирают тех, кто засветился с какими нибудь преступлениями. Собрать всех остальных нелегалов, которые честно работают на каких то грязных и тяжелых работах — это задача в 10 раз сложней

Гуру Хренов

27 января 2025, 20:08
Ответить

Глубокая сика? Deepseek?

Мультитрендовый

27 января 2025, 20:13
Ответить

Проверил браузерную версию. Этот паразит таки знает сколько букв «с» в слове «искусство».

Обитатель матрицы

27 января 2025, 20:17
Ответить

Какой-то колхозный вариант. Голосового ввода нет, как и вывода само собой. приложения нормального для планшета нет

arona tur

28 января 2025, 00:29
Ответить

Александр Исаев

28 января 2025, 08:35
Ответить

А проститутки станут дешевле?.. на95%? нет? жаль.не ненужен этот китайский вариант.и американский тоже.🤣🤣🤣🤣🤣🤣🤣

Strelok1985

28 января 2025, 08:37
Ответить

Strelok1985, проститутки станут как нефть в 2020 м, отрицательной стоимостью, все это трамп замутил для этого

Александр Исаев

28 января 2025, 08:51
Ответить

Пока те кто потупее воюют, те кто поумнее во всяком случае пытаются что-то полезное изобресть…

baron_samedi

28 января 2025, 08:40
Ответить

и боюсь, что эта коррекция надолго

Правильно, дрожи инвестор.
Времена идут суровые.
Дивы по 10% покажутся мечтой.

DrManhattan

28 января 2025, 11:31
Ответить

А я то думал: кто это мне ночью помог 2 рубля заработать? А оно вон оно что Михалыч. Китайцы за одну рабочую смену, на коленке выстрогали «Буратино».

NOT A HAMSTER

28 января 2025, 12:49
Ответить

Цитирую сам себя от вчера

И кстати… если кто считает что это китайская профанация, то значит через пару-тройку дней американский рынок вернется на вчерашние уровни,
а значит это можно использовать в торговле

Я покупаю Микс

Вчера покупал Микс
Сегодня продаю

Viacheslav Ivanenkov

28 января 2025, 14:31
Ответить

Значит надо покупать!
паника налицо!.. всё в покупку!

Александра

28 января 2025, 15:33
Ответить

в крипте с текущих последний рост! я даже не читаю что там пишут про крипту — все это развод, раз Трамп впрягается! раз он впрягается — значит толкнуть тяжело быдлу свои лонги без обрушения!
последний рост в крипте, а дальше — в ноль! 0!..

Александра

28 января 2025, 15:36
Ответить

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Оглавление блога

Народ, ловите момент - это будет покруче появления ChatGPT

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога Гуру Хренов

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Оглавление блога

Народ, ловите момент - это будет покруче появления ChatGPT

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога Гуру Хренов