Блог им. Koleso
Первая в мире «модель рассуждений», продвинутая форма искусственного интеллекта, была выпущена в сентябре американской компанией OpenAI.
o1, как она называется, использует «цепочку рассуждений» для ответов на сложные вопросы в области науки и математики, разбивая задачи на составные части и тестируя различные подходы к решению за кулисами, прежде чем представить пользователю вывод. Её презентация вызвала гонку по копированию этого метода.
В декабре компания Google представила модель рассуждений под названием «Gemini Flash Thinking». Через несколько дней OpenAI ответил обновлением o3 для o1.
Диаграмма: The EconomistНо Google, несмотря на все свои ресурсы, на самом деле не была первой компанией, которая попыталась повторить OpenAI.
Менее чем через три месяца после запуска o1 китайский гигант электронной коммерции Alibaba выпустил новую версию своего чат-бота Qwen, QwQ, с такими же «рассуждающими» возможностями.
«Что значит думать, задавать вопросы, понимать?»
— спросила компания в цветистом посте в блоге со ссылкой на бесплатную версию модели.
Другая китайская компания, DeepSeek, за неделю до этого выпустила «предварительную версию» модели рассуждений под названием R1. Несмотря на попытки американского правительства сдерживать развитие китайской индустрии искусственного интеллекта, две китайские компании сократили технологическое отставание от своих американских коллег до нескольких недель.
Китайские компании лидируют не только в разработке моделей рассуждений: в декабре DeepSeek опубликовала новую большую языковую модель (LLM), разновидность ИИ, которая анализирует и генерирует текст.
Версия 3 занимала почти 700 гигабайт, была слишком большой для работы на чём-либо, кроме специализированного оборудования, и содержала 685 миллиардов параметров — отдельных элементов, которые в совокупности образуют нейронную сеть модели.
Это сделало её больше, чем всё, что было ранее выпущено для бесплатного скачивания. Llama 3.1, флагманский LLM от Meta, материнской компании Facebook, выпущенный в июле, имеет всего 405 миллиардов параметров.
LLM от DeepSeek не только больше, чем многие его западные аналоги, но и лучше, уступая только проприетарным моделям Google и OpenAI.
Пол Готье, основатель Aider, платформы для ИИ-кодирования, протестировал новую модель DeepSeek и обнаружил, что она превосходит всех своих конкурентов, кроме самого o1.
Lmsys, рейтинг чат-ботов, составленный с помощью краудсорсинга, ставит его на седьмое место, выше, чем любую другую модель с открытым исходным кодом, и выше, чем модель, созданная компанией, отличной от Google или OpenAI (см. диаграмму).