По работе мне постоянно приходится быть в курсе разных нейросетей и простых решений на них, чтобы подсмотреть часть идей для использования в компании. В феврале я наткнулся на исследование OpenAI под названием SWE-Lancer, в котором ИИ должен был заработать $1 млн .
Что такое SWE-Lancer? Если коротко, то
Опытные специалисты из OpenAI (разработчик ChatGPT) выгрузили с фриланс-биржи Upwork кучу задач. Далее отобрали только те, где в описании есть все данные для решения задачи. Осталось 1488 штуки. После этого начали тестировать как с ними справятся нейросети.
Сколько «заработали» нейросети (в теории)?
Самая лучшая на тот момент, Claude 3.5 Sonnet, успешно справилась с 26,2% задач кодирования и 44,9% решений по управлению проектами (например: выбор подрядчиков, оценка рисков, распределение бюджета).
Что меня особенно заинтересовало в этом исследовании: ИИ оказался сильнее в принятии решений, чем в написании кода, при том, что в СМИ рассуждают о программистах, копирайтерах и дизайнерах. У меня на работе больше менеджеров, чем программистов, но есть вероятность, что они не очень будут рады новым возможностям по использованию нейросетей.
Согласно последней годовой отчётности, к концу декабря общая численность сотрудников Shopify сократилась до 8100 человек по сравнению с 8300 годом ранее.
Возможно эти шаги направлены на повышение эффективности и внедрение автоматизированных инструментов, которые способны заменить рутинные задачи, при этом позволяя работникам сосредоточиться на более интересных задачах.
CEO Shopify, Тобиас Литке, 07 апреля обратился ко всей команде, подчеркивая, что в современных условиях искусственный интеллект становится не просто инструментом, а настоящим мультипликатором возможностей. Основные идеи его обращения можно резюмировать так:
«Яндекс» представил бета-версию нового сервиса «Нейроэксперт», который позволяет анализировать до 25 различных файлов, включая документы, презентации, аудио- и видеофайлы, а также ссылки из интернета. Система может пересказывать содержание, делать выводы, сравнивать данные и отвечать на вопросы, основываясь только на загруженных источниках.
Сервис предназначен для студентов, преподавателей, аналитиков и других пользователей, работающих с большими объемами информации. В будущем «Яндекс» планирует добавить корпоративные функции, включая интеграцию с внутренними базами данных.
Монетизация сервиса будет осуществляться по подписной модели и через продажу on-premise решений для бизнеса. По мнению экспертов, «Нейроэксперт» может стать первым российским B2B-решением, сочетающим аналитику данных и генерацию ответов на их основе.
Источник: www.rbc.ru/technology_and_media/03/04/2025/67ed83e19a7947332ddab3ef?from=from_main_3
LLM — новая реальность. Да, осталось много кто про них ещё не особо знает, кто «не верит» и т.д., но им всё сложнее не верить и не замечать.
Я заметил много параллелей между работой LLM и человеческим мозгом. Осознание некоторых параллелей очень порождает многие внутренние рассуждения и инсайты.
Какие параллели и инсайты я вижу:
— Модели очень разные, есть например, рассуждающие модели, а есть не рассуждающие — так же и люди, есть те, кто шустро, быстро что-то делают и хороши в этом, а есть те, кто много думают и хороши в этом. Первые хороши где надо по-быстрому подсуетиться, вторые — где качественно подумать. И «применять» таких людей нужно в релевантных этой составляющей задачах… как и нейросети. Нужен просто фактологический ответ — спроси «быструю», нужно обдумать — спроси «умную».
— У нейросети есть системные промпты. Это и те которые ты прописываешь и те, которые разработчики зашили. О, это отличный аналог всему тому, что у человека на уровне подсознания — это и ценности, убеждения, какие-то яркие предыдущие прожженные в мозгу опыты и т.д.
Автоматизация рутинных задач с помощью искусственного интеллекта (ИИ) может значительно сократить расходы бизнеса. Согласно исследованию компании «Инфомаксимум», внедрение ИИ позволит автоматизировать 34% задач, выполняемых около 12 млн офисных сотрудников в России. Это приведет к экономии более 4,13 трлн рублей в год на фонд оплаты труда.
ИИ особенно эффективен в таких областях, как клиентское обслуживание и анализ данных. Внедрение нейросетей сокращает время на выполнение задач в 2 раза, а количество ошибок и переработок — на 70%. Например, в сфере обслуживания клиентов можно уменьшить время ручных ответов на 50-60%, а в страховых компаниях повысить продуктивность на 30%.
Однако внедрение ИИ требует значительных инвестиций, от 1 млн до десятков миллионов рублей, и окупается в течение 1–3 лет. Прогнозируется, что к 2025–2027 гг. более 60% российских компаний будут использовать ИИ для рутинных задач. Эксперты считают, что ИИ перераспределит задачи сотрудников, позволяя им сосредоточиться на более креативных и сложных задачах.
В 2025 году началась грандиозная битва ИИ за лидерство. Все крупные игроки наперебой представляют публике улучшения и новые функции своих языковых моделей.
Началось все с нашумевшего выхода новой ИИ-модели DeepSeek R1 от крупного китайского фонда. Эта модель превзошла лидера рынка ChatGPT по некоторым техническим показателям. По заявлению китайцев они потратили на обучение модели в 18 раз меньше денег, чем американский конкурент. Что якобы возможно благодаря особой архитектуре. Из-за этой новости акции производителя чипов для ИИ Nvidia упали в моменте на 23%. Однако вскоре цена акций вернулась назад.
Компании OpenAI и Microsoft обвинили китайскую сторону в неправомерном использовании их данных. Могу заметить, что ответы DeepSeek действительно очень напоминают ChatGPT. Также из-за утечки данных использование DeepSeek было запрещено в некоторых госучреждениях США и Италии.
Следует отметить, что DeepSeek имеет открытый исходный код и в настоящее время полностью бесплатен.
Вскоре другая китайская компания Alibaba представила свою новую ИИ-модель Qwen. Которая в свою очередь превосходит DeepSeek по некоторым параметрам!