Блог им. Division_by_zero

Народ, ловите момент - это будет покруче появления  ChatGPT

Все рынки валятся сегодня в Штатах, и боюсь, что эта коррекция надолго.
Причина всего этого — не Трамп и не ключевая ставка в Японии
Причина называется Deepseek. Не путать с Dickpic !
Короткое объяснение:
Китайцы выкатили OpenSource — модель, которая работает лучше OpenAI 4o, запускается на дешевой видеокарте и была (по их словам) натренирована за копейки по сравнению с тем, что потратили OpenAI. А запустить ее можно буквально на своем компе, скачав из сети — там есть несколько вариантов на выбор, с разными размерами!!! Стоимость токена упала до нуля, и не надо больше платить кровопийцам из OpenAI за их API или 20 / 200 долл в месяц за ChatGpt!!
Эти новости поступили буквально в последние несколько дней, и ставят под сомнение, что миллиарды, потраченные в Штатах на создание моделей — когда нибудь окупятся
Равно как и лидерство США в области AI.  Считалось, что Китай отстает на 2-3 года, а получилось, что он как минимум идет ноздря в ноздрю, а может и опережает.
Посыпятся сегодня все производители чипов и все Hyperscalers ( microsoft, amazon, google, fb)
Я постараюсь к концу дня протестировать эту шнягу и отдельный пост напиcать, если не лень будет.
В любом случае — следите за происходящим, это как остросюжетный сериал, только в реальном времени и с реальными действующими лицами.
★15
112 комментариев
ПОКА лишь  легкая плановая коррекция
avatar
ВВШ, пока лишь никто еще не осознал, что у OpenAI, Antropic — больше нет бизнес-модели, а у Hyperscalers надо прогнозы прибыли пересматривать
avatar
Гуру Хренов,   это всего  лишь  детские полуигрушки
avatar
Гуру Хренов, 
пока лишь никто еще не осознал, что у OpenAI, Antropic — больше нет бизнес-модели, а у Hyperscalers надо прогнозы прибыли пересматривать

Получается, что это только вы осознали, но — это всего лишь только ваше мнение и вы точно не владеете информацией )

Причина называется Deepseek

Причина в том, что деревья не растут до небес и надо же… иногда бывают коррекции )

А Deepseek это просто китайский вариант цап царапа )
avatar
ВВШ, пока лишь и коррекции даже нет. Это пре-маркет всего лишь. Всепропальщики, как обычно, забежали вперед.
avatar
Вася Пражкин,    ---  корррекция есть и будет еще. и на то есть настоязие причины. тем кому положено в курсе.  остальным не зачем.все равно серьезно  не спекулируют.
avatar
Эх, не торгуй по новостям говорили они… Ладно, шортану немного сп500, кину фишку на стол…
avatar
у китайцев вся письменность на интуитиве
сомнительны их успехи в формализованном слове 
скорей это понт 
китай поэтому не способен создать ничего нового
только копир, но и то хорошо
Валерий Осипенко, они смогли то ли скопипиздить, то ли как то реверсэнжинирить OpenAI так, что DeepSeek, если его спросить что это за модель — говорит что он OpenAI. Короче, может это просто очень удачный промышленный шпионаж
avatar
Гуру Хренов, скорей всего именно так 
Гуру Хренов, а может пробросили порты через себя на OpenAI?
avatar
Гуру Хренов, зачем придумывать небылицы ?
Гуру Хренов, Ещё Ульянов Ленин (Запрещен в РФ, как иноагент) говорил, что во время соревнования создаётся лучший продукт.  Поэтому кураторы Ленина и сегодня это практикуют. ИИ забуксовал в штатах и поэтому дали возможность китайцам работать в этом направлении, чтобы работа шла плодотворней. Ведь чипирование масс в мире и цифровые деньги нужно вводить как можно скорее.
Валерий Осипенко, конечно эти бездарные китайцы не что не смогут, они нули полные. и дипсик этот ихний никакая не модель — там просто сидит сто мильонов студентов и обрабатывают ваши запросы, строчат вам ответы, а вы думаете что это чат бот в облаке. 
avatar
Drew Wert, ви правы 
Шарик, ты балбес ©

Зачем ты пишешь про LLM-ки, если по тексту видно, что ты никакого отношения к нейросеткам не имеешь?
avatar
BobbyKotick, Барбос, ты хам
avatar
Киты же вроде ток вчера смогли 1о догнать, чё уже 4о нагнули??? Если инфа реальная, то США уже сами отстают на пару лет, а через пару лет будут отставать на пол века.
Этот Deepseek требует 670 гигов VRAM, и доступен только серьёзным конторам. Обычному человеку просто некуда засунуть столько видеокарт.
avatar
Netro, там есть несколько вариантов моделей для скачивания, с разными требованиями к памяти. Но я конечно не имел в виду, что это можно запустить на игровом компе. Сам факт того, что модель открыта для скачивания и работает так же хорошо, как и передовые закрытые модели — позволяет очень дешево разворачивать свои собственные API и не платить OpenAI например
avatar
Гуру Хренов, ну в той или иной задаче открытые модели начали обгонять OpenAI ещё со второй половины прошлого года, что там в Deepseek хорошего — не знаю, но QwenCoder сильно сделал шаг вперёд в области кодинга. Сейчас всё внимание на 32B и  72b модели, кои можно запустить на домашнем компе. Я думаю, когда они поставят на колени ChatGPT — вопрос нескольких месяцев.
avatar

Netro, вот именно! на разработку моделей OpenAI Anthropic и собственных моделей от Амазона Фейсбука и т д — были потрачены миллиарды денег, и уже тогда не было видно, как они окупятся. А сейчас — тем более. Повторяется ситуация с прокладкой оптоволокна по всему миру в начале века. Вот до чего довел планету этот фигляр ПэЖэ. То есть — я хотел сказать, вот к чему приводит свободный обмен информацией. Инвестируют во все это гуглы, а пользуются результатами — китайцы

avatar
Гуру Хренов, ваш Эпелл инвестировал в рабов Фохкон которые скрюченными от дихлорэтана пальцами приклеивали экраны Айфонов за 5 центов. А ещё Ваша Омерика нахаляву получила кучу спецов которых растили и обучали в других странах. Всего то надо было через своих Чубайсов/Зеленских/Штольцев создать невыносимые условия на их родине. В вашем CNN этого наверное не пишут ?

«Главное при расследовании коррупционной схемы не выйти на самого себя» © прокурор
avatar
Netro, 32B и 72B модели, насколько я понимаю, всё-таки для компаний для запуска на сервере с A100/H100 с 80 Гб видеопамяти. На домашнем ПК с 8-12 GB VRAM можно запустить 7/13B модели, а они всё же туповаты для практического использования.
avatar
Netro,Llama 3.1 на 400B требовала примерно столько же, есть дистиллированные и квантованные версии любых открытых моделей, которые можно запустить на ПК, начиная с 7B / 13B.
avatar
А ссыли-то какие-то будут на матчасть?
avatar
MadQuant, сегодня буду все тестировать, мне как раз надо код странички подшаманить
avatar
avatar
MadQuant, deepseek-ai.ru/
сами протестируйте. 
Меня не впечатлило . 
Ed Wilde

События на площади Тяньаньмэнь в 1989 году представляют собой серию антиправительственных протестов, которые проходили в Китае с апреля по июнь. Протесты были жестоко подавлены военными, что привело к значительным жертвам и международному осуждению. Общие сведения о протестах

  • Протесты начались 15 апреля 1989 года и продолжались до 4 июня того же года.
  • Участниками протестов были студенты, рабочие и другие граждане, требующие политических реформ, борьбы с коррупцией и большей свободы слова.
  • Протестующие заняли площадь Тяньаньмэнь в Пекине, где организовали лагерь и проводили митинги.

Причины протестов

  • Смерть бывшего генерального секретаря КПК Ху Яобана в апреле 1989 года стала катализатором для массовых демонстраций.
  • Протестующие выступали против медленных темпов экономических реформ и коррупции в правительстве.
  • Основные требования включали демократизацию, свободу прессы и улучшение условий жизни.

Подавление протестов

  • В ночь с 3 на 4 июня 1989 года Народно-освободительная армия Китая (НОАК) начала операцию по разгрому протестующих.
  • Военные использовали танки и огнестрельное оружие против безоружных демонстрантов, что привело к многочисленным жертвам.
  • Официальные данные о погибших варьируются от 200 до 300 человек, однако независимые оценки говорят о тысячах погибших.

Последствия

  • Подавление протестов вызвало международное осуждение и привело к санкциям против Китая.
  • Внутри страны власти усилили контроль над информацией и запретили обсуждение событий на площади Тяньаньмэнь.
  • Протесты стали символом борьбы за демократию в Китае и остаются важной темой для правозащитников и активистов по всему миру.
Не путать с Dickpic !
И с big dick!  
avatar
пенисам нато надо как-то оправдать провал их ЫЫ.
Кусты'2023 уже не помогают.
И тут как раз Deepseek вовремя подвернулся.
avatar
Мысль интересная, но слабо аргументированная (IMHO)
(если что, на постоянке юзаю и o1, теперь и R1, R1, кстати, значительно сильнее o1 подвержена галлюцинированию и придумкам)

Предлагаю более логичное объяснение в духе теории заговоров:

1. У США все хорошо с данными (в плане Big Data), у Китая — нет. Ну т.е., наверное, не стоит учить модели с претензией на универсальность на данных, запертых внутри Великого Китайского Стена Файерволла.
Соответственно, для доступа к широким мировым данным китайцам надо выкатывать свои модели бесплатно или по копеечной цене.
2. У США есть задел в разработке LLM, и они не любят выкатывать свежие модели. Надеюсь, до конца января заценим o3, а больше ничего крутого с конкретными сроками нам пока не обещают.
У китайцев есть необходимость в публикации свежих моделей (см. п.1 про данные для обучения).
3. Вот никто никогда не предъявит пруфов, что 10 китайских студентов обучили новейшую модель на коленке и 100 компьютерах с примитивными видяхами. Скорее (вспоминая историю с Huawei) это чисто легенда, а в реале было огромное спонсирование со стороны Правительства КНР, да и обучение происходило на гигантском количестве ввезенных в обход санкций свежих актуальных нейропроцессоров.

Так что я бы не стал раньше времени хоронить AI в США и ставить на Китай.
PR получился хорошим, это да.
Но PR, собссно, именно для этого и нужен )))

С уважением
avatar
Мальчик buybuy, Huawei начинал с того, что просто сп… л технологии у Nortel, а потом уже на этом поднялся
avatar
Гуру Хренов, а что 100 других компаний мешало взять технологии Нортел? а получилось только у Хуавей. Сколько у  США не воруй, своего не вернёшь.

 Нынешние США поднялись на том что разграбили СССР и страны Восточной Европы (Болгария, Румыния до сих пор в заднице и членство в ЕС не помогло), Ирака, Азии и ЕС… чего собственно в  США никто и не скрывает, просто пишут это не в газетах СМИ, а в книгах которые 95% пожирателей гамбургеров не читают.
avatar
Как же его протестировать если входа нет
chat.deepseek.com/sign_in
Только поверить на слово что круче всех.

Федор Подпольный, https://chat.deepseek.com/sign_up
avatar
Гуру Хренов,  Тут тоже засада. Проверочный код не высылает.

Sorry! We're having trouble sending you an email right now. Please try again later.


Федор Подпольный, у меня та же самая проблема
avatar
Федор Подпольный, deepseek-ai.ru/
так попробуй
Китай, по их заявлениям, всегда впереди планеты всей. Пока выглядит, как чудо, но я не верю в чудеса.
Пока я скептически отношусь к этому, потому что у китайцев какие-то другие линейки и в обычном киллометре два-три китайских киллометра.
Посмотрим, потестируем. Если правда все хорошо, то это станет полезной встряской другим компаниям и рынкам.
avatar
Может я ошибаюсь но ИМХО основная сложность не в самом движке нейросетки а в наборе данных для обучения

Движки много у кого есть, считай у любой крупной корпорации из ИТ

Вот китайцы смогли собрать большой набор данных для обучения, ну молодцы
Выкатили свою LLM



avatar
И кстати…  если кто считает что это китайская профанация, то значит через пару-тройку дней американский рынок вернется на вчерашние уровни, 
а значит это можно использовать в торговле

Я покупаю Микс
avatar
не, в совок не инвестирую


В плане технологий Китай нагнет всех. Америка и Европа сколько лет шли к своим ??? А Китай за сколько прошел этот путь??? У него мультипликатор по технологии х5 минимум.
Андрей Борноволоков, 
А Китай за сколько прошел этот путь?
Ну так на сворованном-то фигле не пробежать )) Пусть попробуют вперёд продвинуть
Бабушкин ковер, посмотрите на китайские города… там уже 21 век, а в США бомжи, гопники и наркоманы на улицах.
avatar
Не дают зарегистрироваться, ошибка вылезает, наверное слишком много народу туда полезло.
avatar
dmitry71, туда полезла сейчас вся калифорния я так думаю
avatar
Гуру Хренов, погорельцы?
avatar
Viacheslav Ivanenkov, пытаются понять, когда закроют их стартап и выгонят всех на мороз
avatar

Нормально он работает! Я с утра тестирую)

https://smart-lab.ru/blog/1108763.php вот написал сам про своё влияние на рынок сегодня.

Там сегодня такой наплыв новых юзеров, что он подтормаживает. Не удивительно, новость то как разнесли. В апсторе бьет рекорды. Думаю не только там. Поэтому наверное вам зарегиться не получается. Позже попробуйте.

Для бесплатной версии вообще 

Напишите ему собери новости и сделай обзор почему падает российский рынок или можно закинуть скрин графика из трейдингвью и он напишет теханализ. Я пробовал, работает, и на удивление качественно и без воды. но корректировать конечно иногда его надо. Но всё же! За 10 секунд! На реальных текущих данных собирает ответ и четко его формулирует.

Короче, большая часть смарт-лаба и других околрыночных обзорщиков со в пролете))
Самое интересное, когда ему формулируешь запрос, он сначала прописывает свои рассуждения над ним и источники указывает. Короче, это Zeekr или Li в области ИИ… потому так и очканули на Западе резко.

Вот что он про критику самого себя же пишет, откровенно и интересно:

DeepSeek V3, несмотря на свои инновации и конкурентные преимущества, подвергается критике по нескольким ключевым аспектам в сравнении с ChatGPT-4 и другими генеративными ИИ-моделями. Вот основные причины критики:

---

### 1. **Использование данных конкурентов и нарушение этических норм**
— **Самоидентификация как ChatGPT**: DeepSeek V3 часто ошибочно идентифицирует себя как ChatGPT версии GPT-4, предоставляет инструкции для API OpenAI и даже повторяет шутки, характерные для GPT-4. Это связано с тем, что его обучали на данных, содержащих выходы ChatGPT, что привело к «загрязнению» тренировочного набора и копированию поведения конкурента .
— **Риск нарушения лицензий**: OpenAI запрещает использование своих выходных данных для обучения конкурирующих моделей. Эксперты, такие как Майк Кук из King’s College London, указывают, что такая практика может нарушать условия использования и ухудшать качество модели, подобно «ксерокопии ксерокопии» .

---

### 2. **Технические ограничения и нестабильность**
— **Производительность и баги**: В тестах DeepSeek V3 демонстрирует нестабильность. Например, при решении задачи LeetCode его код не прошел проверку из-за неоптимальных циклов, что привело к превышению лимита времени. Пользователи также жалуются на медленные ответы, частые сбои и неполные решения, особенно в сравнении с более отлаженным ChatGPT-4 Plus .
— **Ограниченная функциональность**: В отличие от мультимодального GPT-4o, DeepSeek V3 работает только с текстом. Хотя его веб-версия поддерживает обработку изображений через отдельные функции, базовая модель не интегрирует аудио или видео .

---

### 3. **Проблемы с оригинальностью и усиление предубеждений**
— **Копирование недостатков GPT-4**: Поскольку DeepSeek V3 частично обучался на данных ChatGPT, он может воспроизводить те же ошибки, предубеждения и «галлюцинации», характерные для исходной модели. Это снижает его надежность в профессиональных сценариях .
— **Отсутствие инноваций**: Некоторые эксперты, включая CEO OpenAI Сэма Альтмана, критикуют подход DeepSeek как «копирование известных решений» вместо создания принципиально новых технологий .

---

### 4. **Этические и юридические риски**
— **Сложность фильтрации AI-контента**: Рост доли сгенерированных ИИ данных в интернете (к 2026 году прогнозируется 90%) усложняет очистку тренировочных наборов. Это повышает риск случайного включения материалов конкурентов, что ставит под сомнение уникальность моделей, подобных DeepSeek V3 .
— **Потенциальные конфликты**: Использование данных GPT-4 может привести к юридическим спорам с OpenAI, особенно если будет доказано прямое копирование .

---

### 5. **Ограничения в специализированных задачах**
— **Узкая направленность**: В отличие от универсального ChatGPT, DeepSeek позиционируется как инструмент для «глубинного поиска» в профессиональных областях (например, медицина, юриспруденция). Однако в тестах его ответы иногда уступают в гибкости и креативности, особенно в творческих заданиях, где ChatGPT демонстрирует более разнообразные решения .
— **Сложности интеграции**: Несмотря на заявленную поддержку API, пользователи отмечают, что для масштабирования DeepSeek V3 в корпоративных решениях требуется дополнительная настройка, тогда как ChatGPT-4o предлагает более готовые решения .

---

### Заключение
DeepSeek V3, безусловно, представляет собой значительный шаг в развитии открытых ИИ-моделей, особенно учитывая его низкую стоимость обучения (557.6 млн долларов против 1 млрд у GPT-4o) и доступность в Китае без VPN. Однако критика фокусируется на этических вопросах, технических недостатках и зависимости от данных конкурентов. Для долгосрочного успеха DeepSeek необходимо усилить оригинальность, стабильность и расширить функциональность, чтобы конкурировать с лидерами рынка.

Андрей Бежин (s_point), следующий шаг — Трамп вводит эмбарго на китайские модели. Как только ему все объяснят. AI — отрасли штатов без этого не выжить, как не выжить автомобильной отрасли без заградительных пошлин на китайские электромобили
avatar
Гуру Хренов, 
пойдут по пути РКН

avatar

Гуру Хренов, ну тут посложнее чем с авто будет изолироваться, тем более что пол мира теперь очевидно будет использовать более дешевый продукт.

И если одни смогли скопипастить OpenAI то значит и другие смогут. Короче, как бы это не стало поводом для начала большой распродажи техов а-ля 2000. Сейчас ещё Фед подвезёт ястребиных ноток и поехали дальше на Юг

Андрей Бежин (s_point), на каком почтовом сервисе у Вас был имейл для верификации? На мой yahoo ничего не шлет, ругается
avatar
Гуру Хренов, gmail
Андрей Бежин (s_point), 
собери новости и сделай обзор почему падает российский рынок

Постфактум вам это любой аналитик за пять секунд сделает..)

можно закинуть скрин графика из трейдингвью и он напишет теханализ. 

Получилось стать долларовым миллионером? )
avatar
ничего он там не рассуждает, тупо все что и так известно сети. Я его много раз спрашивал про фонду с галочкой диптинк, отвечает поверхностной инфой то что есть во всех нейронках 
avatar
Не ну если видео карта за 800тыр рублей для вас дешовая, то эт конечно круто.
Но эт все равно хватит только для модели которая на 32b или 70b параметров, но лучше конечно ДВЕ таких карточки.
Ну а для квантованной урезанной модельки надо что-то RTX 4070Ti и лучше
это от 100тыр
Ну или Mac c M процом и оперативкой от 24Gb.

А для запуска полной версии DeepSeek — надо будет штук 8-10 видеокарт каждая их который стоит от 800тыр
Или сервер арендовать — но стоимость аренды сервака с такми количеством карт вас тоже очень сильно огорчит
avatar
Beach Bunny, 
Ну или Mac c M процом и оперативкой от 24Gb.
Вы это серьезно?
avatar
Viacheslav Ivanenkov, абсолютно, если надо запустить на своем компе малую модель DeepSeek
avatar
Viacheslav Ivanenkov, вот что рекомендуется для запуска



avatar
Beach Bunny, в списке нет Эппл с М процем

Viacheslav Ivanenkov, и что, на них тоже работает, для локальных небольших моделей это дешевле выходит учитывая стоимость NVidia карт

avatar
Beach Bunny, а на компе без Нвидиа локальная небольшая модель не запуститься ?

Например при запуске Ламы можно указать ключ использовать GPU или нет

Viacheslav Ivanenkov,
Без GPU медленно работать, и малые модели они не для решения задач, а в основном для суммаризации/обобщения информации и простых задач.
И потом простых моделей на 70b параметров с удаленным доступом и бесплатных полно в интернете.
И мощных бесплатных — тоже много.
В том же твиттере есть Grok, у google есть Gemini, у французов есть Mistral — который если для программирования, не хуже ChatGPT и DeepSeek, а иногда даже корректнее работает с меньшим количеством ошибок.
Mistral без впн работает
avatar

Качаем, клиент тут: github.com/LostRuins/koboldcpp/releases/tag/v1.82.4
модели здесь: huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-32B-GGUF
или здесь huggingface.co/unsloth/DeepSeek-R1-Distill-Llama-70B-GGUF
Объем модели (соотв.и качество ответов) подбираем по мощности железа.
У меня на 64Gb памяти модель DeepSeek-R1-Distill-Qwen-32B-Q8_0.gguf запускается, сравнительно медленно работает но терпимо, видеокарта 8Gb AMD.
Хорошо код пишет, только нудный — всё так обстоятельно рассказывает, DeepSeek этот. ))

avatar
Andrevs,  64Gb памяти — это оперативная? а на видеокарте 8 ГБ ?

avatar
Максим, да
avatar
мой опыт написания кода — любая модель рано или поздно упирается в стену его сложности и размера и начинает косячить. Помогает чистка окна контекста, но это рано или поздно происходит все равно. o1 держится раза в 2-4 дольше (по размеру кода), чем 4o. Посмотрим, что сможет китаец
avatar
Спасибо, интересно!
Уверен, у истории с названием AI большое продолжение. А невероятных поворотов на пути будет много.

Вместе с тем, американский рынок просится в коррекцию и достаточно взмаха крыла бабочки, чтобы её запустить.
avatar
Посмотрим.
Так или иначе, продавать ничего не буду. Напротив, как придут дивы — докуплю индексы
У них наверняка есть свой «цифровой Путин»
Как сообщает американская пресса, ЦРУ втайне создала цифровые клоны «мировых лидеров» — издания не называют ни одной фамилии. Дипломаты и эксперты, прорабатывающие ту или иную страну, ведут «переговоры» с клоном, как с живым человеком, чтобы узнать, как он будет реагировать. По итогам отбрасываются одни предложения, принимаются другие
avatar
Китаезы сперли чат жпт и выкатили как дикпик даром всем желающим. Смешно. В духе китайцев.
Амеры еще не отошли после того как они электрокары развивали, развивали. А китайцы выкатили свои в 3 раза дешевле… А тут еще интереснее повороты. В целом Китайцы показывают что кроме маркетинга за США мало чего стоит. Но и маркетинг чего-то стоит… А амерский рынок и так пузырь перегретый. Может полететь. Будет весело.
avatar

Прикол! Deepseek что-то знает про Глобальный цивилизационный кризис,:

 

Глобальный цивилизационный кризис, вызванный нехваткой ресурсов, проявляется в сочетании экономических и экологических проблем, усугубленных изменениями климата. Это приводит к переосмыслению моделей роста и устойчивого развития в современном обществе. Внутренние причины кризиса

  • Нехватка ресурсов, включая природные и человеческие, создает давление на экономические системы.


  • Снижение эффективности государственного управления и отсутствие самоорганизации населения усугубляют ситуацию.


  • Кризис традиционных управляющих систем, вызванный самопрограммированием и искажением восприятия реальности.


Внешние факторы

  • Глобальный кризис перепроизводства, вызванный высокими технологиями, приводит к культурным барьерам и ограничивает доступ к новым рынкам.


  • Конкуренция за ресурсы между цивилизациями, особенно в контексте России, которая контролирует уникальные природные ресурсы.


  • Влияние транснациональных корпораций, которые блокируют передачу технологий и способствуют углублению технологического разрыва.


Социальные и культурные аспекты

  • Увеличение цифрового неравенства, которое ограничивает доступ к информационным технологиям как для развивающихся, так и для развитых стран.

  • Вырождение демократии и отрыв элиты от общества, что приводит к потере доверия и снижению ответственности.

  • Проблемы, связанные с восприятием и пониманием реальности, что создает дополнительные сложности в управлении и принятии решений.
Хорошо что я zx спектрум не выкинул. На нем буду запускать ИИ
avatar
Если бы OpenAI не выкатили свою модель в открытый доступ, смогли бы китайцы сделать DeepSeek? Ответ: нет, потому что она обучалась на ответах от GPT. Опять же, чтобы обучить можель, нужно минимум в 10 раз меньше ГПУ, чем для инференса. Это знает любой, кто в теме. Так что беспокойство беспричинно.
avatar

Make_hard, ну да, вместо того, чтобы использовать supervised fine-tuning, когда сажают кучу кенийцев, чтобы они следили, чтобы ChatGPT не сп… л чего то лишнего про меньшинства, просто натренировали на входах / выходах, использовав ChatGPT (и наверное кучу других моделей). Что в принципе тоже неплохое изобретение. И открывает дорогу для санкций в отношении китая за воровство технологий, потому что условия использования от OpenAI наверняка запрещают такие вещи. Надо только дождаться, когда кто то объяснит это Трампу.

Но рядовому пользователю это все пофиг! Если мне надо автоматизировать чатбота для поддержки пользователей, то я поставлю эту штуку на свой сервер и смогу не платить Open AI за их API. Хотя основные деньги в сценарии RAG уходят даже не на inference, а на генерацию Embeddings. Я кстати не знаю — DeepSeek модель для embeddings тоже выкатили ?

avatar
Гуру Хренов, да ваш ник вам хорошо подходит!)
Процесс, который я описал, называется дистилляция знаний. Коротко, это когда ты более легкую и быструю модель учишь на основе ответов тяжелой и долгой. В итоге получаешь модель, которая быстрее работает и меньше требует железа. На сколько я помню, это Facebook придумали для трансформеров как раз еще года так 4 назад))
avatar
Make_hard, непонятно, как знание Вами слова «дистилляция» отменяет то, что я написал. Я тоже знаю много слов разных
avatar

Гуру Хренов, никак, вы абсолютно правы. Я, кстати, статью нашел. Гугл придумал в 21м году) arxiv.org/pdf/2002.03532

То что Китайцев скорее попытаются за это нагнуть абсолютно верно. Я же хочу продолжить свою идею, что падение акций Nvidia и прочих явление весьма временное. До тех пор пока то, что я написал, не скажет какой-нибудь Сэм Альтман или Илон Маск

avatar
Make_hard, 
Коротко, это когда ты более легкую и быструю модель учишь на основе ответов тяжелой и долгой. 
А с людьми так можно?
Бабушкин ковер, можно, если предварительно в башку затолкать видеокарту с большим объемом памяти
avatar
Бабушкин ковер, нууу у людей в целом мозг одинаковый +-. Так что вряд-ли. Хотя, наверное, можно найти аналогии 
avatar
Make_hard, сомнительно 
Бабушкин ковер, репетиторство называется.
avatar
Как же вас развести легко!
DeepSeek будет ПЛАТНЫМ после 8 февраля 2025 !
Это у них написано. 
Оплата в $$$ так российские банковские карты в пролете.
avatar

Никита Шляпников, чтобы всех нелегальных мигрантов вывезти теми темпами, которыми сейчас это делается — понадобятся десятилетия, которых у Трампа нет. Весь этот кипеж с нелегальными мигрантами — это хайп, чтобы голосов на выборах получить побольше. Что Трампу в общем-то удалось

Пока что они из тюрем и из баз данных полиции отбирают тех, кто засветился с какими нибудь преступлениями. Собрать всех остальных нелегалов, которые честно работают на каких то грязных и тяжелых работах — это задача в 10 раз сложней

avatar
Глубокая сика? Deepseek?
Проверил браузерную версию. Этот паразит таки знает сколько букв «с» в слове «искусство».
Какой-то колхозный вариант. Голосового ввода нет, как и вывода само собой. приложения нормального для планшета нет
avatar
А проститутки станут дешевле?.. на95%? нет? жаль.не ненужен этот китайский вариант.и американский тоже.🤣🤣🤣🤣🤣🤣🤣
avatar
Strelok1985, проститутки станут как нефть в 2020 м, отрицательной стоимостью, все это трамп замутил для этого
Пока те кто потупее воюют, те кто поумнее во всяком случае пытаются что-то полезное изобресть…
avatar
Спасибки, интересно.
avatar
 и боюсь, что эта коррекция надолго

Правильно, дрожи инвестор.
Времена идут суровые.
Дивы по 10% покажутся мечтой.
avatar
А я то думал: кто это мне ночью помог 2 рубля заработать? А оно вон оно что Михалыч. Китайцы за одну рабочую смену, на коленке выстрогали «Буратино».

Цитирую сам себя от вчера
И кстати…  если кто считает что это китайская профанация, то значит через пару-тройку дней американский рынок вернется на вчерашние уровни, 
а значит это можно использовать в торговле

Я покупаю Микс
Вчера покупал Микс
Сегодня продаю


Равно как и лидерство США в области AI.  Считалось, что Китай отстает на 2-3 года, а получилось, что он как минимум идет ноздря в ноздрю, а может и опережает.

Забавный вывод, если учесть, что китайцы тупо содрали ) Непонятно, что сподвигло автора сделать такой вывод)
avatar
Значит надо покупать!
паника налицо!.. всё в покупку!
в крипте с текущих последний рост! я даже не читаю что там пишут про крипту — все это развод, раз Трамп впрягается! раз он впрягается — значит толкнуть тяжело быдлу свои лонги без обрушения!
последний рост в крипте, а дальше — в ноль! 0!..

теги блога Гуру Хренов

....все тэги



UPDONW
Новый дизайн