Все рынки валятся сегодня в Штатах, и боюсь, что эта коррекция надолго.
Причина всего этого — не Трамп и не ключевая ставка в Японии
Причина называется Deepseek. Не путать с Dickpic !
Короткое объяснение:
Китайцы выкатили OpenSource — модель, которая работает лучше OpenAI 4o, запускается на дешевой видеокарте и была (по их словам) натренирована за копейки по сравнению с тем, что потратили OpenAI. А запустить ее можно буквально на своем компе, скачав из сети — там есть несколько вариантов на выбор, с разными размерами!!! Стоимость токена упала до нуля, и не надо больше платить кровопийцам из OpenAI за их API или 20 / 200 долл в месяц за ChatGpt!!
Эти новости поступили буквально в последние несколько дней, и ставят под сомнение, что миллиарды, потраченные в Штатах на создание моделей — когда нибудь окупятся
Равно как и лидерство США в области AI. Считалось, что Китай отстает на 2-3 года, а получилось, что он как минимум идет ноздря в ноздрю, а может и опережает.
Посыпятся сегодня все производители чипов и все Hyperscalers ( microsoft, amazon, google, fb)
Я постараюсь к концу дня протестировать эту шнягу и отдельный пост напиcать, если не лень будет.
В любом случае — следите за происходящим, это как остросюжетный сериал, только в реальном времени и с реальными действующими лицами.
Получается, что это только вы осознали, но — это всего лишь только ваше мнение и вы точно не владеете информацией )
Причина в том, что деревья не растут до небес и надо же… иногда бывают коррекции )
А Deepseek это просто китайский вариант цап царапа )
сомнительны их успехи в формализованном слове
скорей это понт
китай поэтому не способен создать ничего нового
только копир, но и то хорошо
Зачем ты пишешь про LLM-ки, если по тексту видно, что ты никакого отношения к нейросеткам не имеешь?
Netro, вот именно! на разработку моделей OpenAI Anthropic и собственных моделей от Амазона Фейсбука и т д — были потрачены миллиарды денег, и уже тогда не было видно, как они окупятся. А сейчас — тем более. Повторяется ситуация с прокладкой оптоволокна по всему миру в начале века. Вот до чего довел планету этот фигляр ПэЖэ. То есть — я хотел сказать, вот к чему приводит свободный обмен информацией. Инвестируют во все это гуглы, а пользуются результатами — китайцы
«Главное при расследовании коррупционной схемы не выйти на самого себя» © прокурор
сами протестируйте.
Меня не впечатлило .
События на площади Тяньаньмэнь в 1989 году представляют собой серию антиправительственных протестов, которые проходили в Китае с апреля по июнь. Протесты были жестоко подавлены военными, что привело к значительным жертвам и международному осуждению. Общие сведения о протестах
Причины протестов
Подавление протестов
Последствия
Кусты'2023 уже не помогают.
И тут как раз Deepseek вовремя подвернулся.
(если что, на постоянке юзаю и o1, теперь и R1, R1, кстати, значительно сильнее o1 подвержена галлюцинированию и придумкам)
Предлагаю более логичное объяснение в духе теории заговоров:
1. У США все хорошо с данными (в плане Big Data), у Китая — нет. Ну т.е., наверное, не стоит учить модели с претензией на универсальность на данных, запертых внутри Великого Китайского Стена Файерволла.
Соответственно, для доступа к широким мировым данным китайцам надо выкатывать свои модели бесплатно или по копеечной цене.
2. У США есть задел в разработке LLM, и они не любят выкатывать свежие модели. Надеюсь, до конца января заценим o3, а больше ничего крутого с конкретными сроками нам пока не обещают.
У китайцев есть необходимость в публикации свежих моделей (см. п.1 про данные для обучения).
3. Вот никто никогда не предъявит пруфов, что 10 китайских студентов обучили новейшую модель на коленке и 100 компьютерах с примитивными видяхами. Скорее (вспоминая историю с Huawei) это чисто легенда, а в реале было огромное спонсирование со стороны Правительства КНР, да и обучение происходило на гигантском количестве ввезенных в обход санкций свежих актуальных нейропроцессоров.
Так что я бы не стал раньше времени хоронить AI в США и ставить на Китай.
PR получился хорошим, это да.
Но PR, собссно, именно для этого и нужен )))
С уважением
Нынешние США поднялись на том что разграбили СССР и страны Восточной Европы (Болгария, Румыния до сих пор в заднице и членство в ЕС не помогло), Ирака, Азии и ЕС… чего собственно в США никто и не скрывает, просто пишут это не в газетах СМИ, а в книгах которые 95% пожирателей гамбургеров не читают.
chat.deepseek.com/sign_in
Только поверить на слово что круче всех.
Sorry! We're having trouble sending you an email right now. Please try again later.
так попробуй
Пока я скептически отношусь к этому, потому что у китайцев какие-то другие линейки и в обычном киллометре два-три китайских киллометра.
Посмотрим, потестируем. Если правда все хорошо, то это станет полезной встряской другим компаниям и рынкам.
Движки много у кого есть, считай у любой крупной корпорации из ИТ
Вот китайцы смогли собрать большой набор данных для обучения, ну молодцы
Выкатили свою LLM
а значит это можно использовать в торговле
Я покупаю Микс
Нормально он работает! Я с утра тестирую)
https://smart-lab.ru/blog/1108763.php вот написал сам про своё влияние на рынок сегодня.
Там сегодня такой наплыв новых юзеров, что он подтормаживает. Не удивительно, новость то как разнесли. В апсторе бьет рекорды. Думаю не только там. Поэтому наверное вам зарегиться не получается. Позже попробуйте.
Для бесплатной версии вообще
Напишите ему собери новости и сделай обзор почему падает российский рынок или можно закинуть скрин графика из трейдингвью и он напишет теханализ. Я пробовал, работает, и на удивление качественно и без воды. но корректировать конечно иногда его надо. Но всё же! За 10 секунд! На реальных текущих данных собирает ответ и четко его формулирует.
Короче, большая часть смарт-лаба и других околрыночных обзорщиков со в пролете))
Самое интересное, когда ему формулируешь запрос, он сначала прописывает свои рассуждения над ним и источники указывает. Короче, это Zeekr или Li в области ИИ… потому так и очканули на Западе резко.
Вот что он про критику самого себя же пишет, откровенно и интересно:
DeepSeek V3, несмотря на свои инновации и конкурентные преимущества, подвергается критике по нескольким ключевым аспектам в сравнении с ChatGPT-4 и другими генеративными ИИ-моделями. Вот основные причины критики:
---
### 1. **Использование данных конкурентов и нарушение этических норм**
— **Самоидентификация как ChatGPT**: DeepSeek V3 часто ошибочно идентифицирует себя как ChatGPT версии GPT-4, предоставляет инструкции для API OpenAI и даже повторяет шутки, характерные для GPT-4. Это связано с тем, что его обучали на данных, содержащих выходы ChatGPT, что привело к «загрязнению» тренировочного набора и копированию поведения конкурента .
— **Риск нарушения лицензий**: OpenAI запрещает использование своих выходных данных для обучения конкурирующих моделей. Эксперты, такие как Майк Кук из King’s College London, указывают, что такая практика может нарушать условия использования и ухудшать качество модели, подобно «ксерокопии ксерокопии» .
---
### 2. **Технические ограничения и нестабильность**
— **Производительность и баги**: В тестах DeepSeek V3 демонстрирует нестабильность. Например, при решении задачи LeetCode его код не прошел проверку из-за неоптимальных циклов, что привело к превышению лимита времени. Пользователи также жалуются на медленные ответы, частые сбои и неполные решения, особенно в сравнении с более отлаженным ChatGPT-4 Plus .
— **Ограниченная функциональность**: В отличие от мультимодального GPT-4o, DeepSeek V3 работает только с текстом. Хотя его веб-версия поддерживает обработку изображений через отдельные функции, базовая модель не интегрирует аудио или видео .
---
### 3. **Проблемы с оригинальностью и усиление предубеждений**
— **Копирование недостатков GPT-4**: Поскольку DeepSeek V3 частично обучался на данных ChatGPT, он может воспроизводить те же ошибки, предубеждения и «галлюцинации», характерные для исходной модели. Это снижает его надежность в профессиональных сценариях .
— **Отсутствие инноваций**: Некоторые эксперты, включая CEO OpenAI Сэма Альтмана, критикуют подход DeepSeek как «копирование известных решений» вместо создания принципиально новых технологий .
---
### 4. **Этические и юридические риски**
— **Сложность фильтрации AI-контента**: Рост доли сгенерированных ИИ данных в интернете (к 2026 году прогнозируется 90%) усложняет очистку тренировочных наборов. Это повышает риск случайного включения материалов конкурентов, что ставит под сомнение уникальность моделей, подобных DeepSeek V3 .
— **Потенциальные конфликты**: Использование данных GPT-4 может привести к юридическим спорам с OpenAI, особенно если будет доказано прямое копирование .
---
### 5. **Ограничения в специализированных задачах**
— **Узкая направленность**: В отличие от универсального ChatGPT, DeepSeek позиционируется как инструмент для «глубинного поиска» в профессиональных областях (например, медицина, юриспруденция). Однако в тестах его ответы иногда уступают в гибкости и креативности, особенно в творческих заданиях, где ChatGPT демонстрирует более разнообразные решения .
— **Сложности интеграции**: Несмотря на заявленную поддержку API, пользователи отмечают, что для масштабирования DeepSeek V3 в корпоративных решениях требуется дополнительная настройка, тогда как ChatGPT-4o предлагает более готовые решения .
---
### Заключение
DeepSeek V3, безусловно, представляет собой значительный шаг в развитии открытых ИИ-моделей, особенно учитывая его низкую стоимость обучения (557.6 млн долларов против 1 млрд у GPT-4o) и доступность в Китае без VPN. Однако критика фокусируется на этических вопросах, технических недостатках и зависимости от данных конкурентов. Для долгосрочного успеха DeepSeek необходимо усилить оригинальность, стабильность и расширить функциональность, чтобы конкурировать с лидерами рынка.
пойдут по пути РКН
Гуру Хренов, ну тут посложнее чем с авто будет изолироваться, тем более что пол мира теперь очевидно будет использовать более дешевый продукт.
И если одни смогли скопипастить OpenAI то значит и другие смогут. Короче, как бы это не стало поводом для начала большой распродажи техов а-ля 2000. Сейчас ещё Фед подвезёт ястребиных ноток и поехали дальше на Юг
Постфактум вам это любой аналитик за пять секунд сделает..)
Получилось стать долларовым миллионером? )
Но эт все равно хватит только для модели которая на 32b или 70b параметров, но лучше конечно ДВЕ таких карточки.
Ну а для квантованной урезанной модельки надо что-то RTX 4070Ti и лучше
это от 100тыр
Ну или Mac c M процом и оперативкой от 24Gb.
А для запуска полной версии DeepSeek — надо будет штук 8-10 видеокарт каждая их который стоит от 800тыр
Или сервер арендовать — но стоимость аренды сервака с такми количеством карт вас тоже очень сильно огорчит
Например при запуске Ламы можно указать ключ использовать GPU или нет
Без GPU медленно работать, и малые модели они не для решения задач, а в основном для суммаризации/обобщения информации и простых задач.
И потом простых моделей на 70b параметров с удаленным доступом и бесплатных полно в интернете.
И мощных бесплатных — тоже много.
В том же твиттере есть Grok, у google есть Gemini, у французов есть Mistral — который если для программирования, не хуже ChatGPT и DeepSeek, а иногда даже корректнее работает с меньшим количеством ошибок.
Mistral без впн работает
Качаем, клиент тут: github.com/LostRuins/koboldcpp/releases/tag/v1.82.4
модели здесь: huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-32B-GGUF
или здесь huggingface.co/unsloth/DeepSeek-R1-Distill-Llama-70B-GGUF
Объем модели (соотв.и качество ответов) подбираем по мощности железа.
У меня на 64Gb памяти модель DeepSeek-R1-Distill-Qwen-32B-Q8_0.gguf запускается, сравнительно медленно работает но терпимо, видеокарта 8Gb AMD.
Хорошо код пишет, только нудный — всё так обстоятельно рассказывает, DeepSeek этот. ))
Уверен, у истории с названием AI большое продолжение. А невероятных поворотов на пути будет много.
Вместе с тем, американский рынок просится в коррекцию и достаточно взмаха крыла бабочки, чтобы её запустить.
Так или иначе, продавать ничего не буду. Напротив, как придут дивы — докуплю индексы
Амеры еще не отошли после того как они электрокары развивали, развивали. А китайцы выкатили свои в 3 раза дешевле… А тут еще интереснее повороты. В целом Китайцы показывают что кроме маркетинга за США мало чего стоит. Но и маркетинг чего-то стоит… А амерский рынок и так пузырь перегретый. Может полететь. Будет весело.
Прикол! Deepseek что-то знает про Глобальный цивилизационный кризис,:
Глобальный цивилизационный кризис, вызванный нехваткой ресурсов, проявляется в сочетании экономических и экологических проблем, усугубленных изменениями климата. Это приводит к переосмыслению моделей роста и устойчивого развития в современном обществе. Внутренние причины кризиса
Нехватка ресурсов, включая природные и человеческие, создает давление на экономические системы.
Снижение эффективности государственного управления и отсутствие самоорганизации населения усугубляют ситуацию.
Кризис традиционных управляющих систем, вызванный самопрограммированием и искажением восприятия реальности.
Внешние факторы
Глобальный кризис перепроизводства, вызванный высокими технологиями, приводит к культурным барьерам и ограничивает доступ к новым рынкам.
Конкуренция за ресурсы между цивилизациями, особенно в контексте России, которая контролирует уникальные природные ресурсы.
Влияние транснациональных корпораций, которые блокируют передачу технологий и способствуют углублению технологического разрыва.
Социальные и культурные аспекты
Make_hard, ну да, вместо того, чтобы использовать supervised fine-tuning, когда сажают кучу кенийцев, чтобы они следили, чтобы ChatGPT не сп… л чего то лишнего про меньшинства, просто натренировали на входах / выходах, использовав ChatGPT (и наверное кучу других моделей). Что в принципе тоже неплохое изобретение. И открывает дорогу для санкций в отношении китая за воровство технологий, потому что условия использования от OpenAI наверняка запрещают такие вещи. Надо только дождаться, когда кто то объяснит это Трампу.
Но рядовому пользователю это все пофиг! Если мне надо автоматизировать чатбота для поддержки пользователей, то я поставлю эту штуку на свой сервер и смогу не платить Open AI за их API. Хотя основные деньги в сценарии RAG уходят даже не на inference, а на генерацию Embeddings. Я кстати не знаю — DeepSeek модель для embeddings тоже выкатили ?
Процесс, который я описал, называется дистилляция знаний. Коротко, это когда ты более легкую и быструю модель учишь на основе ответов тяжелой и долгой. В итоге получаешь модель, которая быстрее работает и меньше требует железа. На сколько я помню, это Facebook придумали для трансформеров как раз еще года так 4 назад))
Гуру Хренов, никак, вы абсолютно правы. Я, кстати, статью нашел. Гугл придумал в 21м году) arxiv.org/pdf/2002.03532
То что Китайцев скорее попытаются за это нагнуть абсолютно верно. Я же хочу продолжить свою идею, что падение акций Nvidia и прочих явление весьма временное. До тех пор пока то, что я написал, не скажет какой-нибудь Сэм Альтман или Илон Маск
Это у них написано.
Оплата в $$$ так российские банковские карты в пролете.
Никита Шляпников, чтобы всех нелегальных мигрантов вывезти теми темпами, которыми сейчас это делается — понадобятся десятилетия, которых у Трампа нет. Весь этот кипеж с нелегальными мигрантами — это хайп, чтобы голосов на выборах получить побольше. Что Трампу в общем-то удалось
Пока что они из тюрем и из баз данных полиции отбирают тех, кто засветился с какими нибудь преступлениями. Собрать всех остальных нелегалов, которые честно работают на каких то грязных и тяжелых работах — это задача в 10 раз сложней
Правильно, дрожи инвестор.
Времена идут суровые.
Дивы по 10% покажутся мечтой.
Цитирую сам себя от вчера Вчера покупал Микс
Сегодня продаю
Забавный вывод, если учесть, что китайцы тупо содрали ) Непонятно, что сподвигло автора сделать такой вывод)
паника налицо!.. всё в покупку!
последний рост в крипте, а дальше — в ноль! 0!..