Добрый вечер, коллеги!
В прошлом посте я поругал автоматическую генерацию кода и сделал это с удовольствием и полной уверенностью.
Теперь я хочу рассказать (тем, кому это интересно), почему AI Code Assistant вроде Cursor AI или Windsurf — это безумно круто, а сами эти продукты кроют ChatGPT, Gemini, DeepSuck, Claude etc. как Тузик — грелку.
Для начала надо определиться с типичным сценарием использования AI пользователем.
Если это модель «вопрос-ответ», то все понятно. Рулят ChatGPT o3 и 4.5, Gemini 2.5 догоняет, DeepSuck занимается ровно тем, что у него указано в названии...
Если это попытка напустить AI на совершение действий на компьютере пользователя, то все становится сильно сложнее. Из грандов только OpenAI предоставляет сервис ChatGPT operator (подписка Pro $200/мес., только в США), который позволяет лазить по сайтам, совершать действия от имени пользователя (с его подтверждением, конечно), запускать отдельные программы на компе и анализировать результат.
В теории есть еще новый корпоративный Copilot с похожим функционалом, но я не смог его потестить, т.к. он требует корпоративный акк. Microsoft, а это сейчас сильно сложнее, чем VPN или виртуальная кредитка.
Более того, самые продвинутые LLM часто очень капризны в плане входных данных — ChatGPT хорошо кушает только файлы md (с pdf и docx бываю косяки), Gemini хорошо кушает только txt (просит md, но загрузить их не может) и т.д.
Перевод крупных файлов на другой язык с сохранением форматирования — это вообще лютый квест. Сама по себе задача для LLM тривиальная, думаю, в модели просто добавлены ограничения на использование их в качестве массовых переводчиков. Я кое-что научился ломать промптами, но все это мутные и костыльные решения.
Теперь берем широко известный Cursor AI и начинаем использовать его в качестве универсального агента.
Забываем про программирование и пишем свои хотелки в окно Composer. Загружаем любые файлы и делаем любой поиск в интернете.
1. Загрузился файл на незнакомом языке — Ок, просим Cursor перевести его на русский. Cursor быстро рожает программу на python, подключает нужные библиотеки — и выводит текст в любом формате
2. Написали промпт для LLM текстом — просим преобразовать его в формат markdown. Опять мгновенно генерится программа на python, быстро выполняется — и не нужно лазить в поисках сервиса на сторонние сайты
3. Надо обработать картинку — нет ничего легче
4. Надо составить summary внешнего файла или электронного письма — нет проблем
5. Надо найти нужные билеты на aviasales — it's Ok
Ну т.е. в такой парадигме немного меняется понимание агента.
Там, где ChatGPT делает сложные манипуляции, Cursor просто предлагает написать и исполнить код на python при любом затыке (когда он не понимает, как это сделать). Код из себя представляет 2-3 строки (просто вызов сторонних библиотек). Работает быстро — результат радует.
Всячески рекомендую энтузиастам.
Пока гранды (OpenAI, Google, Anthropic) не сподобились сделать нормальных агентов-операторов, Cursor и Windsurf (cascade) позволяют легко решать такие задачи руками (прикладное программирование в чистом виде). x5 к личной производительности )))
Что вы думаете по этому поводу, коллеги?
С уважением
Купят — сразу перейду на Windsurf
(очень нравится качество платных продуктов от OpenAI)
С уважением
В целом все это еще только начало. Мне вот интересно, а существует ли предел. Те области действий, где ИИ так и не сможет превзойти разум человека. Иначе давайте считать себя индейцами, которых скоро загонят в резервацию.
в ютубчике в одной передаче один ученый рассказал пример. Решили они проверить у этой бездушной машины задачки олимпиадные по астрономии. Из семи штук решила одну, потому что эту задачу слили в инет. По остальным написала какой то бред )
я вот тоже периодически свои решения в chatgpt проверяю. Особенно что касается fpga. Пока что из коллег никто не стремится слить в инет, бездушная машина вообще пока бессильна
smart-lab.ru/blog/1143910.php