19 февраля 2025, 22:26

Третьесортные знания для стран третьего мира

Добрый вечер, коллеги!

В Пн 03.02.25 я сподобился приобрести подписку Pro на ChatGPT. Это недешево ($200/мес.), но очень полезно для работы. Модель o1pro очень неплоха, у 4o контекстное окно 128000 токенов (100 страниц формата A4 против 8000 токенов для подписки Plus, бесплатные варианты даже не обсуждаю), у o3 mini-high слабее ограничения на число запросов. Ну и самое главное — доступны опции Agent и Deep Research.

Речь пойдет о Deep Research. Эта такая крутая энжина, которая проводит полноценное исследование по интересующей тебя тематике. Сопит и пыхтит минут 30, лопатит весь доступный интернет и выдает саммари на 20-30 страниц с самим исследованием и перечнем первоисточников со ссылками. Ну это как промпт составить, здесь тоже целое искусство.
Работает очень хорошо, специалисту на подготовку такого отчета потребуется часов 6-8, неспециалисту — неделя (и результат будет плох, скорее).

Но хохма не в этом.
Меня заинтересовали отдельные аспекты интернет-трафика, в которых я слабо шарю (как ламер). Но любопытство меня одолевало, поэтому я попросил товарища с подпиской Pro запустить Deep Research, пока я тренировался с кредитками для оплаты (отдельный квест).
Он прислал мне свой отчет, а уже вечером я запустил свой.

Каково же было мое удивление, когда я получил 2 совершенно разных отчета по одному и тому же промпту!

Ну, я человек упертый, поэтому стал исследовать, какие параметры влияют на итоговый отчет.
Методом научного тыка было установлено, что на содержимое отчета влияет тип браузера и региональные установки. И если в Chrome это зависит только от учетной записи, то в Edge — от региональных установок Bing (здесь и далее — речь только про Windows).

Я завелся, и изготовил 8 отчетов (ниже в списке — модель, тип VPN, браузер и региональные установки, длина документа приведена в числе слов, посчитанных Word).

o3mh VPN Edge ENUS (9007 слов) – сжато и конкретно, мне понравился больше всего
o1pro proxy Edge ENUK (9171 слов) – подробнее, но меньше охват по темам
o1pro VPN Edge ENUS (8921 слов) – сжато и по делу, чуть меньше охват по темам
4o VPN Edge ENUS (8968 слов) – хорошо, но слабее o1 и o3
o1pro VPN Edge RURU (6143 слова) – сжато, но слабо
o1pro VPN Chrome RURU (10784 слов) – много воды, слабее
o1pro VPN Edge RUWW (7715 слов) – много воды, еще слабее
o3mh VPN Edge ENUK (4407 слов) – самый слабый (?!)

Что видно невооруженным глазом? Длина отчета может отличаться в 2.5 раза.
Что видно вооруженным глазом? Длина отчета не влияет на его содержательность, так отчет в Chrome самый длинный, но и самый водянистый (ни о чем).
Идеальные отчеты выдают модели o3mh и o1pro в регионе ENUS. Теперь пользуюсь только ими.

Вопрос: теперь сообщаемые LLM знания будут зависеть от региона?! Ну т.е. как регионально таргетируется реклама?!

Не, я понимаю, что составление отчета требует полазить в интернете, а выдача ссылок браузером точно зависит от региональных настроек. Но разница в длине отчета в 2.5 раза?!

Что вы думаете по этому вопросу, коллеги?

С уважением

P.S. Если интересно — могу поделиться опытом программирования математических задач с помощью Canvas. Вкратце — это лютый трэш...
P.P.S. Хочу слегка огорчить всех, кто тихонько надрачивает на китайский Deep Suck.
Чтобы затестить рассуждающую нейросеть — надо просто задать ей сложный вопрос. Ответ на который нельзя найти в опубликованной книге или в одной конкретной статье. А нужно прочитать 3-5-10 статей и попытаться сделать выводы.
Тест (моя бывшая специальность): Рассчитай K3 группы Милнора и Квиллена для поля рациональных чисел
Ответ ChatGPT o3-mini-high: Z6 и Z48 (циклические группы порядков 6 и 48) — правильный
Ответ Deep Suck: Z+Z2 и Z24+Z2 (Z — аддитивная группа целых чисел) — полная чушь, слегка похожая на правду. Проблема в том, что первая группа — это подгруппа второй
При этом Deep Suck начинает рассуждать правильно, а потом пишет «очевидно, что...» а дальше вообще лютый треш «таким образом, данный вывод подтвержден как теоретически, так и экспериментально». Какие, б@ядь, эксперименты с высшими K-группами?!

ChatGPT искусственный интеллект

Мальчик buybuy

Lisboa

424

23 836

с 11 августа 2018

44 Комментария

Auximen
19 февраля 2025, 22:42
В общении с нейросетями главное — это промт — формулировка вопроса. Об этом написаны книги, в которых рассказывается, как надо задавать вопросы.
-1
- Мальчик buybuy
  19 февраля 2025, 22:53
  Auximen, повторяю
  
  Во всех 8 кейсах промпт один и тот же
  Написал я, потом тюнинговал с помощью o3
  
  С уважением
  0
  - Auximen
    19 февраля 2025, 23:03
    Мальчик buybuy, а нейросети обучены по-разному, «один и тот же промт» в данном случае не является правильным подходом, к каждой нейросети надо искать свой подход, формировать промты (если вы обратите внимание, в учебниках и мануалах обычно указывают промты для конкретных нейросетей, а не вообще для нейросетей).
    -1
    - Мальчик buybuy
      19 февраля 2025, 23:08
      Auximen, и это я знаю
      
      Тем не менее, на базе моего драфта o3 составила идентичные промпты для себя, для o1pro и для 4o (это я только про Deep Research).
      А она точно в этом разбирается лучше )))
      
      С уважением
      0
- MiSh
  19 февраля 2025, 22:57
  Auximen, книги увы бесполезны так как система меняется все время и то что было даже неделю назад сегодня может уже быть совершенно иначе
  +2
  - Мальчик buybuy
    19 февраля 2025, 23:06
    MiSh, именно так
    
    Все специалисты (и я не исключение) пишут драфт промпта, а сам промпт составляет рассуждающая модель (я использую o3).
    
    Ну и желательно прочитать гайд на openai.com про составление промптов для традиционных (3.5, 4, 4o) и рассуждающих (o1, o1pro, o3-mini, o3-mini-high) моделей. Это 2 разных документа в свободном доступе.
    
    С уважением
    0
Makstrade
19 февраля 2025, 23:06
Мне хватает бесплатной ChatGPT на смартфоне )

оцени..

0
- Мальчик buybuy
  19 февраля 2025, 23:14
  Makstrade, по Квиллену верно
  
  По Милнору — нет (см. выше)
  
  С уважением
  0
Миллиардер из Сибири
19 февраля 2025, 23:15
Это же нейросети. Даже просто немного измененная выдача гугла, может изменить в корне ответ. Тем более в этой приблуде, которая вероятно прогоняет через себя не один запрос, пока готовит финальный результат. Как эффект бабочки короче)
+1
- Мальчик buybuy
  19 февраля 2025, 23:19
  Миллиардер из Сибири, ну Ок
  
  А разница в 2.5 раза в длине отчета? )))
  
  С уважением
  0
  - Миллиардер из Сибири
    19 февраля 2025, 23:26
    Мальчик buybuy, Вот две картинки из моей работы по обнаружению атак. Тут сегментация данных, но это не важно.
    
    Вроде картинки то одинаковые, а такие разные ответы у сетки. Хотя на глаз разницу даже не увидеть. А тут 30 минут думает. Да там всё что угодно может произойти. Мизерное отклонение в начале, выльется в космическое отклонение на выходе после такой работы. Это нормально короче. Пока по другому не научились тренировать. Скажи ей, что хочешь непременно 5 страниц — поможет.
    0
Гуру Хренов
19 февраля 2025, 23:26
я подписался на один месяц на эту 200-долларовую подписку, и пришел к выводу, что она нечем ни лучше 1o, которая за 20 дол (хотя за 20 долл там рано или поздно заканчивается лимит, и это конечно большой минус)
За 200 долл улучшенная 1o с большим контекстным окном — работает раздражающе долго, а выдает сопоставимый результат. Что мне помогло гораздо лучше, это очистить память chatgpt, потому что по умолчанию содержание всех предыдущих диалогов тоже идет в контекстное окно, и основательно его засирает
+2
- Мальчик buybuy
  19 февраля 2025, 23:21
  Гуру Хренов, ну это не так
  
  Попробуйте в подписке plus сделать саммари статьи или книги страниц на 50
  Попробуйте изготовить отчет из 10 загруженных файлов pdf
  Agent и Deep Research только в Pro (причем пока только в США)
  o3 можно долбить значительно интенсивнее и с меньшей задержкой
  И т.д....
  
  С уважением
  0
  - Маркиз Лафайет
    20 февраля 2025, 02:08
    Мальчик buybuy, а если я, например, забью название новой книжки-бестселлера с Амазона, чат мне выдаст саммари на 50 страниц?
    0
    - Мальчик buybuy
      20 февраля 2025, 02:15
      Маркиз Лафайет, нет
      
      Но если загрузишь doc или pdf — до 100 страниц обработает
      В т.ч. переведет )))
      
      С уважением
      +1
      - Маркиз Лафайет
        20 февраля 2025, 02:17
        Мальчик buybuy, спасибо.
        0
      - il_dottore
        20 февраля 2025, 05:35
        Мальчик buybuy, вот так вот. Т.е. теперь работа переводчика перешла к корректору…
        0
Gonzo_071
20 февраля 2025, 00:38
Спроси, пожалуйста: влияние микродозинга псилоцибина, на детей с синдромом дауна, аутистов, и детей с задержкой развития интеллекта.
Я пока не приобщился к ИИ, видать старческий консерватизЬмЪ подхватил.
-1
- Мальчик buybuy
  20 февраля 2025, 00:43
  Gonzo_071, ответ короткий и явно цензурированный
  
  Исследование влияния микродозинга псилоцибина на детей с синдромом Дауна, аутистов и детей с задержкой развития интеллекта — это довольно сложная и чувствительная тема, поскольку на данный момент научных данных, подтверждающих безопасность и эффективность микродозинга псилоцибина в этих группах, нет. В этом контексте стоит отметить, что микродозинг псилоцибина (приём малых доз психоактивного вещества) является относительно новым и малораспространённым явлением, и исследования на эту тему всё ещё находятся на ранней стадии.
  Микродозинг псилоцибина: Что это?
  Микродозинг — это практика приёма очень малых доз психоактивных веществ, таких как псилоцибин (главный компонент псилоцибиновых грибов), с целью улучшения настроения, когнитивных функций, концентрации или креативности, но без ярко выраженных галлюциногенных эффектов. Дозы для микродозинга обычно составляют около 1/10 — 1/20 обычной дозы.
  Основные утверждения сторонников микродозинга:
  - Улучшение настроения.
  - Повышение концентрации внимания и креативности.
  - Снижение уровня стресса и тревоги.
  Тем не менее, стоит помнить, что на сегодняшний день большинство исследований о микродозинге псилоцибина проводятся на взрослых, и результаты часто ограничены малым числом участников.
  Влияние на детей с синдромом Дауна, аутизмом и задержкой развития интеллекта
  1. Синдром Дауна (Трисомия 21)
  Синдром Дауна — это генетическое расстройство, вызванное дополнительной хромосомой 21. Дети с синдромом Дауна часто имеют когнитивные задержки, а также могут сталкиваться с трудностями в обучении и социальной адаптации.
  - Отсутствие данных: На данный момент нет исследований, которые бы специально изучали влияние микродозинга псилоцибина на детей с синдромом Дауна.
  - Теоретические риски: Псилоцибин может влиять на восприятие и когнитивные функции, что может быть опасно для детей с уже существующими когнитивными нарушениями. Возможные непредсказуемые психоактивные эффекты могут усугубить симптомы у детей с задержкой развития, что ставит под сомнение безопасность применения этого вещества.
  2. Аутизм (РАС — расстройства аутистического спектра)
  Аутизм — это группа расстройств, характеризующихся нарушениями социального взаимодействия и коммуникации, а также ограниченными и повторяющимися паттернами поведения. Некоторые исследования показали, что психоделики могут оказывать влияние на социальное взаимодействие и восприятие у взрослых людей с аутизмом.
  - Неопределённые результаты: Хотя есть несколько исследовательских проектов, изучающих использование психоделиков в лечении аутизма, их результаты на данный момент не являются достаточно обоснованными для применения в лечении детей с аутизмом. Для детской аудитории тем более требуется крайне осторожный подход.
  - Риски: Психоактивные вещества могут вызвать тревогу или стресс у людей с аутизмом, что сделает их небезопасными для этой группы. Микродозинг, в свою очередь, может иметь непредсказуемые эффекты на нейропсихологическое развитие.
  3. Задержка развития интеллекта
  Задержка развития интеллекта может быть вызвана различными факторами, включая генетические, экологические и социальные. Дети с задержкой развития интеллекта часто имеют трудности с обучением и адаптацией к социальной среде.
  - Неизученные последствия: Исследования на тему микродозинга псилоцибина среди детей с задержкой развития интеллекта также не проводились. Псилоцибин может повлиять на мозговую активность, что в теории может повлиять на когнитивные функции.
  - Потенциальные риски: Психоактивные вещества могут оказывать сильное воздействие на мозг и нервную систему, что может быть небезопасным для детей с когнитивными нарушениями.
  Этические и медицинские соображения
  1. Этические вопросы: Применение психоактивных веществ для лечения детей требует строгого соблюдения этических норм. Дети не могут дать информированное согласие на использование подобных веществ, и это поднимает вопросы о правомерности их использования в качестве лечения.
  2. Безопасность и риски: Поскольку психоделики могут иметь непредсказуемые последствия для психики, особенно у людей с нарушениями развития, необходимо с большой осторожностью подходить к использованию таких веществ в детской практике.
  3. Недостаток исследований: На данный момент существует крайне мало научных исследований, посвящённых воздействию псилоцибина (в том числе в микродозах) на детей. Большинство исследований сосредоточены на взрослых, и их результаты не могут быть непосредственно перенесены на детскую аудиторию.
  Заключение
  На текущий момент нет научных доказательств того, что микродозинг псилоцибина безопасен и эффективен для детей с синдромом Дауна, аутизмом или задержкой развития интеллекта. Безопасность таких вмешательств требует более тщательных исследований, которые должны учитывать как потенциальную пользу, так и риски для здоровья и психики детей.
  Существующие исследования в области психоделиков сосредоточены на взрослых и касаются в основном психиатрических заболеваний, таких как депрессия и тревожные расстройства. Для детей, особенно с когнитивными нарушениями, важно сначала исследовать традиционные методы терапии и подходы, которые доказали свою эффективность.
  
  С уважением
  +2
  - Gonzo_071
    20 февраля 2025, 00:59
    Мальчик buybuy, Благодарю.
    Я так и знал, скрывают. Это заговор!
    Моё мнение, нужно их ударными дозами пичкать, а не микро.
    Те кто переживёт и приспособится, вполне себе могут стать магами, псайкерами и биотиками.
    Во имя Императора, конечно же!
    Толку от них откровенно — никакого, а риск дело благородное.
    -1
    - Мальчик buybuy
      20 февраля 2025, 01:09
      Gonzo_071, ну вот не факт
      
      Я в жизни попробовал практически все наркотики (кроме героина внутривенно и дешевой шляпы типа спидов), в т.ч. почти все галлюциногены.
      
      И галлюциногены настолько сильно расширяют мир, что неустойчивая психика очень быстро шурша едет крышей. Не верите — спросите любого, кто хоть раз словил bad trip, о том, что он видел )))
      Поэтому скармливать лошадиные дозы псилобицина детям с неустойчивой психикой — это треш, IMHO.
      
      С уважением
      +2
      - Gonzo_071
        20 февраля 2025, 02:10
        Мальчик buybuy, ну почему же лошадиные… пусть, как для пони расчитают! И выберут тех кто поустойчивей. А то весь возможный (вполне!) прогресс, тормозит вопрос этики.
        Уже колличественно и временем доказано, что перспективы у этих детей с классическим подходом -около нулевой. У взрослого мозг сформирован практически, у детей же огромный потенциал к изменению, хоть и в разные стороны.
        Я, конечно, не горю желанием ситтером для них быть. И находиться рядом, когда солнечный словит затмение.
        0
      - il_dottore
        20 февраля 2025, 05:42
        Мальчик buybuy, токари так шутят;)
        0
      - Liberalism
        20 февраля 2025, 09:34
        Мальчик buybuy, оно и заметно, знаете ли…
        0
    - il_dottore
      20 февраля 2025, 05:41
      Gonzo_071, так ты же про микродозинг запрос отправил, а рассуждаешь об ударных дозах! Шиза?!
      0
    - ves2010
      20 февраля 2025, 14:37
      Gonzo_071, я помню одна рууская девица употребила случайно пол стакана лсд... на год ушла в глюки но выжила
      +1
  - il_dottore
    20 февраля 2025, 05:39
    Мальчик buybuy, а витамин С для тех же групп испытуемых?)
    0
Виктор Громов
20 февраля 2025, 01:45
Интуитивно параметры скоринговых моделей, которые будут таргетировать вкусовые предпочтения, не определить ИМХО. Вторая проблема — отсутствие критериев контроля, снова внутренняя кухня скоринга.

Ну и понятно, что гипотетически можно назвать десятки характеристик оценки эффективности, от региона и платежеспособности, до кол-ва символов и обратной связи, но это все пустота.

Так что есть? Есть офигенный подход — выходим на компанду разработчиков, кто пилит ИИ. Через них выходим на команды, которые пилили ИИ в предыдущих поколениях, плюс тусовка (те нам сливают данные по скорингу, какие модели были раньше). Ну и исходя из них (что уже устарело и не представляет коммерческую тайну на сегодня), уже формируем более корректные предположения. А тусовка эта небольшая, будет от силы 100 человек, если напарсить достаточно данных заранее у кого нужно.

найти координаты разрабов просто. 2-3 месяца и инфа есть, часто там сидят люди, которые явно недооценены своим бывшим работодателем (именно такие мысли у них в голове и на это давить) и кротчайший путь через линктын и ейчаров, за 50 баксов или дешевле будет инфа)
0
- Мальчик buybuy
  20 февраля 2025, 04:58
  Виктор Громов, зачем?!
  
  Ставим VPN на USA и юзаем Edge с регионом ENUS.
  (настройки делаем в Bing, настройки Windows ChatGPT упорно не видит)
  
  Проверено — это наилучший результат )))
  
  С уважением
  0
Виктор Громов
20 февраля 2025, 01:42
А если уже отсебятину, то проект глобальный, я не думаю, что будет привязка к региону, ну и если увеличиваем выборку, то числа будут другие. Плюс же еще надо понимать, в чем разница работы каждой конкретной модели. А это уже знают кто пишет код, самим голову ломать не надо, есть люди, сами расскажут. Задача решается просто, первый курс для осинта и 10-50 баксов, плюс жесткий диск на 2 террабайта, бро)
0
- Мальчик buybuy
  20 февраля 2025, 05:00
  Виктор Громов, ты слишком щедрый, бро
  
  Я контакты людей (из LinkedIn и не только) покупаю по цене 1000 руб. за 100 лидов. Какие нах баксы? )))
  
  С уважением
  0
Dangerous Assumption
20 февраля 2025, 20:14
Может быть это оттого, что англоязычная база в интернете в разы больше русскоязычной?
+1
Strelok1985
20 февраля 2025, 21:03
Почитал.и у меня такое.стойкое ощущение.что я забрел на урок английского языка.нехрена непонятно.переведите и огласите весь список.
0