Блог им. Marek

Китайский стартап DeepSeek пошатнуло доверие инвесторов в США к истории искусственного интеллекта, и целесообразности трат сотни миллиардов американскими технологическими компаниями

  • Китайский стартап DeepSeek вызвал разгром акций технологических компаний США, поскольку его высококонкурентные и потенциально гораздо более дешевые модели вызвали сомнения в миллиардах, которые крупные американские технологические компании тратят на ИИ.
  • Появление DeepSeek пошатнуло доверие инвесторов к истории искусственного интеллекта, которая поднимала бычий рынок США в последние два года.
  • Вот как разворачивалась рыночная распродажа, вызванная DeepSeek, на Уолл-стрит.
 Jan 27 202511:07 AM EST

Молодой китайский стартап DeepSeek, специализирующийся на искусственном интеллекте, в понедельник вызвал массовый обвал акций технологических компаний США, поскольку его высококонкурентные и потенциально шокирующе экономически эффективные модели вызвали сомнения в сотнях миллиардов долларов, которые крупнейшие технологические компании Америки тратят на искусственный интеллект.

Появление DeepSeek пошатнуло доверие инвесторов к истории искусственного интеллекта, которая поднимала бычий рынок США в последние два года. Это ставит под сомнение ажиотаж вокруг чипов Nvidia и распространился по всему рынку, ударив по долям производителей энергии, которые должны были получить импульс от спроса на центры обработки данных с искусственным интеллектом.

Вот как разворачивалась рыночная распродажа, вызванная DeepSeek, на Уолл-стрит:

Новая модель рассуждений

DeepSeek была основана в мае 2023 года Лян Вэньфэном, который частично финансировал компанию через свой хедж-фонд на основе искусственного интеллекта. В конце декабря разработчик искусственного интеллекта запустил бесплатную модель большого языка с открытым исходным кодом, на разработку которой, по его словам, ушло всего два месяца и менее 6 миллионов долларов на создание.

20 января китайская компания DeepSeek из Ханчжоу выпустила R1, модель рассуждения, которая превзошла последнюю модель o1 от Open AI во многих сторонних тестах.

DeepSeek стремится отличаться от своих конкурентов своими возможностями рассуждения, а это означает, что прежде чем дать окончательный ответ, модель сначала генерирует «цепочку мыслей» для повышения точности своих ответов.

Самая производительная модель

Ажиотаж вокруг R1 от DeepSeek, по-видимому, набрал обороты после того, как Александр Ванг, генеральный директор Scale AI, расхваливал его конкурентоспособность по сравнению с лучшими продуктами американских технологических гигантов с мегакапитализацией, которые, как считалось, возглавляют войну ИИ. Scale AI предоставляет данные, чтобы помочь компаниям обучить свои инструменты искусственного интеллекта.

 

«Мы обнаружили, что DeepSeek, которая является ведущей китайской лабораторией искусственного интеллекта, на самом деле является самой эффективной или примерно наравне с лучшими американскими моделями», — сказал Ван в эфире CNBC на Всемирном экономическом форуме в Давосе, Швейцария, на прошлой неделе.

Ван сказал, что DeepSeek на самом деле имеет больше чипов H100 от Nvidia, чем ожидалось — около 50 000 штук. Эти чипы являются предпочтительным процессором для фирм в области искусственного интеллекта в США, таких как OpenAI, и США запретили продажу передовых чипов искусственного интеллекта в Китай.

Акции Nvidia упали на 3% в пятницу, поскольку разговоры о DeepSeek начали набирать обороты.

Приложение No 1

В минувшие выходные ажиотаж вокруг DeepSeek достиг апогея в социальных сетях.

Марк Андриссен, соучредитель и генеральный партнер венчурной компании Andreessen Horowitz, похвалил DeepSeek в адрес X, заявив, что модель R1 является «одним из самых удивительных и впечатляющих прорывов», которые он когда-либо видел. В портфолио Andreessen есть Airbnb и десятки компаний, занимающихся искусственным интеллектом.

Технический инвестор Чамат Палихапития на X указал на «очень хороший» отчет DeepSeek, в котором говорится, что его модель R1 «по сути, взломала один из святых Граалей искусственного интеллекта: заставить модели рассуждать шаг за шагом, не полагаясь на массивные контролируемые наборы данных».

Фьючерсы на США сильно упали в ночь на воскресенье, и инвесторы проснулись в море красного в понедельник утром.
www.cnbc.com/2025/01/27/how-the-buzz-around-chinese-ai-model-deepseek-sparked-a-massive-nasdaq-sell-off.html


Как новая китайская модель искусственного интеллекта DeepSeek угрожает доминированию США
Jan 24 2025

www.cnbc.com/2025/01/24/how-chinas-new-ai-model-deepseek-is-threatening-us-dominance.html

7 комментариев
ну и что там за «цепочка мыслей»? из серии как превратить МУХУ в СЛОНА? то есть такие же ответы но «промежуточные»?
avatar
Кроме 6 миллионов долларов у чувака было несколько вагонов видеокарт, он настолько много их купил, что даже глава Nvidia ему открытку прислал с благодарностью  за возможность купить новую яхту.
avatar
Beach Bunny, 
«Модель» по сути сама себя подтренировывает и не только. А как мы знаем за Alpha Zero были в той же канве еще другие потом существенные улучшения. Придурков, которые рассказывают про спрятанные где-то десятки тысяч контрабандных топ ускорителей можете игнорировать. У многих очень сильно пригорает. Кстати вся кор команда — китайская на 100% никто из них не учился и не работал вне Китая никогда. Сейчас им наверное сделают много интересных предложений.
avatar
il_dottore, их только вы эти помоечные рассуждения собираете.
avatar
Beach Bunny, так себе риторика…
avatar
«по сути, взломала один из святых Граалей искусственного интеллекта: заставить модели рассуждать шаг за шагом, не полагаясь на массивные контролируемые наборы данных».

 

kill all humans! слава роботам!

теперь кожаным мешками останецца только целовать роботов в их блестящую железную задницу, как завещал великий Бендер.


Еще забавная фигня — Deep Seek тренировали на «стреноженых» чипах NVDA, H800. Стреноженость заключается вот в чем — по требованию американских чиновников NVDA порезала возможности шины которая соединяет ядра GPU и ноды GPU между собой (NV Link). Урезание в пропускной способности было 50%. Для тренировки AI нужно гонять много данных в кластере поэтому это важно и серьезная проблема. В ответ на это китайцы написали свой собственный хитрый маршрутизатор/балансировщик нагрузки сократив потребности в трафике в разы. И таким образом превратив «стреноженые» чипы по сути в нормальные. Для NVDA это тоже плохие новости — ответ Вашингтона будет предсказуем — будут ужесточать ограничения на экспорт и возможно не только в Китай но и другие соседние страны типа Сингапура.

 

© ффлиппер конешшно, ктож ищо


теги блога Марэк

....все тэги



UPDONW
Новый дизайн