США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3

31 января 2025, 18:41
|
Beach Bunny

Уступите место, DeepSeek. В городе появился новый чемпион по искусственному интеллекту — и он американец. В четверг Ai2, некоммерческий исследовательский институт искусственного интеллекта из Сиэтла, выпустил модель, которая, по его утверждению, превосходит DeepSeek V3, одну из ведущих систем китайской компании DeepSeek.

Модель Ai2 под названием Tulu3-405B также превосходит GPT-4o от OpenAI по некоторым показателям AI, согласно результатам внутреннего тестирования Ai2. Более того, в отличие от GPT-4o (и даже DeepSeek V3), Tulu3-405B имеет открытый исходный код, а это значит, что все компоненты, необходимые для его воспроизведения с нуля, доступны бесплатно и имеют разрешённую лицензию.

Представитель Ai2 сообщил TechCrunch, что, по мнению лаборатории, Tulu3-405B «подчёркивает потенциал США в качестве лидера в мировой разработке лучших в своём классе моделей генеративного AI».

«Эта веха — ключевой момент для будущего открытого AI, укрепляющий позиции США как лидера в области конкурентоспособных моделей с открытым исходным кодом, — сказал представитель компании. — С помощью этого запуска Ai2 представляет мощную альтернативу моделям DeepSeek, разработанную в США, — это поворотный момент не только в развитии AI, но и в демонстрации того, что США могут лидировать в области конкурентоспособного AI с открытым исходным кодом, не зависящего от технологических гигантов».

Tulu3-405B — довольно большая модель. По данным Ai2, она содержит 405 миллиардов параметров, и для её обучения потребовалось 256 графических процессоров, работающих параллельно. Параметры примерно соответствуют навыкам модели в решении задач, и модели с большим количеством параметров обычно работают лучше, чем модели с меньшим количеством параметров.

США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3

Согласно Ai2, одним из ключей к достижению конкурентоспособных результатов с помощью Tulu3-405B была техника, называемая обучением с подкреплением и поддающимся проверке вознаграждением. Обучение с подкреплением и поддающимися проверке вознаграждениями, или RLVR, обучает модели выполнению заданий с «поддающимися проверке» результатами, такими как решение математических задач и следование инструкциям.

Ai2 утверждает, что в тесте PopQA, состоящем из 14 000 специализированных вопросов из Википедии, Tulu3-405B превзошёл не только DeepSeek V3 и GPT-4o, но и модель Meta Llama 3.1 405B. Tulu3-405B также показал самую высокую производительность среди моделей своего класса в тесте GSM8K, состоящем из математических задач для начальной школы.

Tulu3-405B доступен для тестирования в веб-приложении чат-бота Ai2 (без ВПН)
=> playground.allenai.org/

код для обучения модели находится на GitHub и платформе для разработки AI Hugging Face.

techcrunch.com/2025/01/30/ai2-says-its-new-ai-model-beats-one-of-deepseeks-best/

Ключевые слова:
DeepSeek,
llm,
AI,
США,
Китай

★1

9 комментариев

чем бы дети дебильного капитала не тешились

ВВШ

31 января 2025, 18:53
Ответить

Гонка США и Китая уже не важна, главное прототип был Советский из журнала «Наука и жизнь»

satisfaction

31 января 2025, 18:54
Ответить

milili, эатк команда использовала найденные записи Ломоносова о разработанной им Думающей Машины!
зы
Эти записки считались безвозвратно утерянными, во время революционных событий

Beach Bunny

31 января 2025, 19:22
Ответить

Beach Bunny, бесполезно США тягаться с Китаем по ИИ. Сколько автопроизводителей в европах и США вместе взятых? А в Китае производителей автомобилей в разы больше чем сумма европ и США.
Так будет и с ИИ.

Александр Сережкин

31 января 2025, 19:36
Ответить

Чет зачастили. По 4 прорывных нейросети за пятидневку.

Jame Bonds

31 января 2025, 19:15
Ответить

Покупаем попкорн, лишь бы про нас забыли

Ольга НеБузова

31 января 2025, 19:15
Ответить

Делаем простой вывод, вся эта возня стоит в сотни раз меньше, чем раньше об этом говорили и думали. Этак каждый компьютерный техникум из райцентра где-нибудь на среднем западе или в синьцзяне скоро выпустит еще более крутую открытую версию.

SergeyJu

31 января 2025, 19:23
Ответить

SergeyJu, хотите сказать что команда Яндекса со своим ИИ, хуже команды компьютерного техникума из райцентра на среднем западе?

Beach Bunny

31 января 2025, 19:29
Ответить

Beach Bunny, хочу сказать, что откупорился рог изобилия. И уникальное становится почти обыденным. А в итоге победит несколько конкурирующих проектов, не потому, что лучшие, а потому что победят в продвижении и придумают правильную схему монетизации.
Железо последним товарищам обошлось миллионов в 5 долларов. Ну пусть даже в 10. Планка входа резко снизилась.

SergeyJu

31 января 2025, 20:57
Ответить

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога Beach Bunny

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога Beach Bunny