Комментарии к постам Марэк
«Модель» по сути сама себя подтренировывает и не только. А как мы знаем за Alpha Zero были в той же канве еще другие потом существенные улучшения. Придурков, которые рассказывают про спрятанные где-то десятки тысяч контрабандных топ ускорителей можете игнорировать. У многих очень сильно пригорает. Кстати вся кор команда — китайская на 100% никто из них не учился и не работал вне Китая никогда. Сейчас им наверное сделают много интересных предложений.
Еще забавная фигня — Deep Seek тренировали на «стреноженых» чипах NVDA, H800. Стреноженость заключается вот в чем — по требованию американских чиновников NVDA порезала возможности шины которая соединяет ядра GPU и ноды GPU между собой (NV Link). Урезание в пропускной способности было 50%. Для тренировки AI нужно гонять много данных в кластере поэтому это важно и серьезная проблема. В ответ на это китайцы написали свой собственный хитрый маршрутизатор/балансировщик нагрузки сократив потребности в трафике в разы. И таким образом превратив «стреноженые» чипы по сути в нормальные. Для NVDA это тоже плохие новости — ответ Вашингтона будет предсказуем — будут ужесточать ограничения на экспорт и возможно не только в Китай но и другие соседние страны типа Сингапура.
© ффлиппер конешшно, ктож ищо
«по сути, взломала один из святых Граалей искусственного интеллекта: заставить модели рассуждать шаг за шагом, не полагаясь на массивные контролируемые наборы данных».
kill all humans! слава роботам!
теперь кожаным мешками останецца только целовать роботов в их блестящую железную задницу, как завещал великий Бендер.