Блог им. BackLaN

США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3

Уступите место, DeepSeek. В городе появился новый чемпион по искусственному интеллекту — и он американец. В четверг Ai2, некоммерческий исследовательский институт искусственного интеллекта из Сиэтла, выпустил модель, которая, по его утверждению, превосходит DeepSeek V3, одну из ведущих систем китайской компании DeepSeek.

Модель Ai2 под названием Tulu3-405B также превосходит GPT-4o от OpenAI по некоторым показателям AI, согласно результатам внутреннего тестирования Ai2. Более того, в отличие от GPT-4o (и даже DeepSeek V3), Tulu3-405B имеет открытый исходный код, а это значит, что все компоненты, необходимые для его воспроизведения с нуля, доступны бесплатно и имеют разрешённую лицензию.

Представитель Ai2 сообщил TechCrunch, что, по мнению лаборатории, Tulu3-405B «подчёркивает потенциал США в качестве лидера в мировой разработке лучших в своём классе моделей генеративного AI».

«Эта веха — ключевой момент для будущего открытого AI, укрепляющий позиции США как лидера в области конкурентоспособных моделей с открытым исходным кодом, — сказал представитель компании.  — С помощью этого запуска Ai2 представляет мощную альтернативу моделям DeepSeek, разработанную в США, — это поворотный момент не только в развитии AI, но и в демонстрации того, что США могут лидировать в области конкурентоспособного AI с открытым исходным кодом, не зависящего от технологических гигантов».

Tulu3-405B — довольно большая модель. По данным Ai2, она содержит 405 миллиардов параметров, и для её обучения потребовалось 256 графических процессоров, работающих параллельно. Параметры примерно соответствуют навыкам модели в решении задач, и модели с большим количеством параметров обычно работают лучше, чем модели с меньшим количеством параметров.
США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3

Согласно Ai2, одним из ключей к достижению конкурентоспособных результатов с помощью Tulu3-405B была техника, называемая обучением с подкреплением и поддающимся проверке вознаграждением. Обучение с подкреплением и поддающимися проверке вознаграждениями, или RLVR, обучает модели выполнению заданий с «поддающимися проверке» результатами, такими как решение математических задач и следование инструкциям.

Ai2 утверждает, что в тесте PopQA, состоящем из 14 000 специализированных вопросов из Википедии, Tulu3-405B превзошёл не только DeepSeek V3 и GPT-4o, но и модель Meta Llama 3.1 405B. Tulu3-405B также показал самую высокую производительность среди моделей своего класса в тесте GSM8K, состоящем из математических задач для начальной школы.

Tulu3-405B доступен для тестирования в веб-приложении чат-бота Ai2  (без ВПН)
=> playground.allenai.org/

код для обучения модели находится на GitHub и платформе для разработки AI Hugging Face.

techcrunch.com/2025/01/30/ai2-says-its-new-ai-model-beats-one-of-deepseeks-best/



★1
#119 по плюсам, #53 по комментариям
9 комментариев
чем бы дети дебильного капитала не  тешились
avatar
Гонка США и Китая уже не важна, главное прототип был Советский из журнала «Наука и жизнь»
avatar
milili, эатк команда использовала найденные записи Ломоносова о разработанной им Думающей Машины!
зы
Эти записки считались безвозвратно утерянными, во время революционных событий
avatar
Beach Bunny, бесполезно США тягаться с Китаем по ИИ. Сколько автопроизводителей в европах и США вместе взятых? А в Китае производителей автомобилей в разы больше чем сумма европ и США.
Так будет и с ИИ. 
 
Чет зачастили. По 4 прорывных нейросети за пятидневку.
avatar
Покупаем попкорн, лишь бы про нас забыли
Делаем простой вывод, вся эта возня стоит в сотни раз меньше, чем раньше об этом говорили и думали. Этак каждый компьютерный техникум из райцентра где-нибудь на среднем западе или в синьцзяне скоро выпустит еще более крутую открытую версию. 
avatar
SergeyJu, хотите сказать что команда Яндекса со своим ИИ, хуже команды компьютерного техникума из райцентра на среднем западе?
avatar
Beach Bunny, хочу сказать, что откупорился рог изобилия. И уникальное становится почти обыденным. А в итоге победит несколько конкурирующих проектов, не потому, что лучшие, а потому что победят в продвижении и придумают правильную схему монетизации. 
Железо последним товарищам обошлось миллионов в 5 долларов. Ну пусть даже в 10. Планка входа  резко снизилась. 
avatar

теги блога Beach Bunny

....все тэги



UPDONW
Новый дизайн