Блог им. Buybuy

Третьесортные знания для стран третьего мира

Добрый вечер, коллеги!

В Пн 03.02.25 я сподобился приобрести подписку Pro на ChatGPT. Это недешево ($200/мес.), но очень полезно для работы. Модель o1pro очень неплоха, у 4o контекстное окно 128000 токенов (100 страниц формата A4 против 8000 токенов для подписки Plus, бесплатные варианты даже не обсуждаю), у o3 mini-high слабее ограничения на число запросов. Ну и самое главное — доступны опции Agent и Deep Research.

Речь пойдет о Deep Research. Эта такая крутая энжина, которая проводит полноценное исследование по интересующей тебя тематике. Сопит и пыхтит минут 30, лопатит весь доступный интернет и выдает саммари на 20-30 страниц с самим исследованием и перечнем первоисточников со ссылками. Ну это как промпт составить, здесь тоже целое искусство.
Работает очень хорошо, специалисту на подготовку такого отчета потребуется часов 6-8, неспециалисту — неделя (и результат будет плох, скорее).

Но хохма не в этом.
Меня заинтересовали отдельные аспекты интернет-трафика, в которых я слабо шарю (как ламер). Но любопытство меня одолевало, поэтому я попросил товарища с подпиской Pro запустить Deep Research, пока я тренировался с кредитками для оплаты (отдельный квест).
Он прислал мне свой отчет, а уже вечером я запустил свой.

Каково же было мое удивление, когда я получил 2 совершенно разных отчета по одному и тому же промпту!

Ну, я человек упертый, поэтому стал исследовать, какие параметры влияют на итоговый отчет.
Методом научного тыка было установлено, что на содержимое отчета влияет тип браузера и региональные установки. И если в Chrome это зависит только от учетной записи, то в Edge — от региональных установок Bing (здесь и далее — речь только про Windows).

Я завелся, и изготовил 8 отчетов (ниже в списке — модель, тип VPN, браузер и региональные установки, длина документа приведена в числе слов, посчитанных Word).

  1. o3mh VPN Edge ENUS (9007 слов) – сжато и конкретно, мне понравился больше всего
  2. o1pro proxy Edge ENUK (9171 слов) – подробнее, но меньше охват по темам
  3. o1pro VPN Edge ENUS (8921 слов) – сжато и по делу, чуть меньше охват по темам
  4. 4o VPN Edge ENUS (8968 слов) – хорошо, но слабее o1 и o3
  5. o1pro VPN Edge RURU (6143 слова) – сжато, но слабо
  6. o1pro VPN Chrome RURU (10784 слов) – много воды, слабее
  7. o1pro VPN Edge RUWW (7715 слов) – много воды, еще слабее
  8. o3mh VPN Edge ENUK (4407 слов) – самый слабый (?!)
Что видно невооруженным глазом? Длина отчета может отличаться в 2.5 раза.
Что видно вооруженным глазом? Длина отчета не влияет на его содержательность, так отчет в Chrome самый длинный, но и самый водянистый (ни о чем).
Идеальные отчеты выдают модели o3mh и o1pro в регионе ENUS. Теперь пользуюсь только ими.

Вопрос: теперь сообщаемые LLM знания будут зависеть от региона?! Ну т.е. как регионально таргетируется реклама?!

Не, я понимаю, что составление отчета требует полазить в интернете, а выдача ссылок браузером точно зависит от региональных настроек. Но разница в длине отчета в 2.5 раза?!

Что вы думаете по этому вопросу, коллеги?

С уважением

P.S. Если интересно — могу поделиться опытом программирования математических задач с помощью Canvas. Вкратце — это лютый трэш...
P.P.S. Хочу слегка огорчить всех, кто тихонько надрачивает на китайский Deep Suck.
Чтобы затестить рассуждающую нейросеть — надо просто задать ей сложный вопрос. Ответ на который нельзя найти в опубликованной книге или в одной конкретной статье. А нужно прочитать 3-5-10 статей и попытаться сделать выводы.
Тест (моя бывшая специальность): Рассчитай K3 группы Милнора и Квиллена для поля рациональных чисел
Ответ ChatGPT o3-mini-high: Z6 и Z48 (циклические группы порядков 6 и 48) — правильный
Ответ Deep Suck: Z+Z2 и Z24+Z2 (Z — аддитивная группа целых чисел) — полная чушь, слегка похожая на правду. Проблема в том, что первая группа — это подгруппа второй
При этом Deep Suck начинает рассуждать правильно, а потом пишет «очевидно, что...» а дальше вообще лютый треш «таким образом, данный вывод подтвержден как теоретически, так и экспериментально». Какие, б@ядь, эксперименты с высшими K-группами?!
★10
44 комментария
В общении с нейросетями главное — это промт — формулировка вопроса. Об этом написаны книги, в которых рассказывается, как надо задавать вопросы.
avatar
Auximen, повторяю

Во всех 8 кейсах промпт один и тот же
Написал я, потом тюнинговал с помощью o3

С уважением
avatar
Мальчик buybuy, а нейросети обучены по-разному, «один и тот же промт» в данном случае не является правильным подходом, к каждой нейросети надо искать свой подход, формировать промты (если вы обратите внимание, в учебниках и мануалах обычно указывают промты для конкретных нейросетей, а не вообще для нейросетей).
avatar
Auximen, и это я знаю

Тем не менее, на базе моего драфта o3 составила идентичные промпты для себя, для o1pro и для 4o (это я только про Deep Research).
А она точно в этом разбирается лучше )))

С уважением
avatar
Auximen, книги увы бесполезны так как система меняется все время и то что было даже неделю назад сегодня может уже быть совершенно иначе
avatar
MiSh, именно так

Все специалисты (и я не исключение) пишут драфт промпта, а сам промпт составляет рассуждающая модель (я использую o3).

Ну и желательно прочитать гайд на openai.com про составление промптов для традиционных (3.5, 4, 4o) и рассуждающих (o1, o1pro, o3-mini, o3-mini-high) моделей. Это 2 разных документа в свободном доступе.

С уважением
avatar
Мне хватает бесплатной ChatGPT на смартфоне )

оцени..



avatar
Makstrade, по Квиллену верно

По Милнору — нет (см. выше)

С уважением
avatar
Это же нейросети. Даже просто немного измененная выдача гугла, может  изменить в корне ответ. Тем более в этой приблуде, которая вероятно прогоняет через себя не один запрос, пока готовит финальный результат.   Как эффект бабочки короче)  
Миллиардер из Сибири, ну Ок

А разница в 2.5 раза в длине отчета? )))

С уважением
avatar
Мальчик buybuy, Вот две картинки из моей работы по обнаружению атак. Тут сегментация данных, но это не важно.



Вроде картинки то одинаковые, а такие разные ответы у сетки. Хотя на глаз разницу даже не увидеть.  А тут 30 минут думает. Да там всё что угодно может произойти. Мизерное отклонение в начале, выльется в космическое отклонение на выходе после такой работы. Это нормально короче. Пока по другому не научились тренировать. Скажи ей, что хочешь непременно 5 страниц — поможет.
Makstrade, да

o1 выдает неверный ответ (не стал об этом писать)
o3 уже рассуждает правильно

С уважением
avatar
Мальчик buybuy,  Я сказал, что должно быть 6 и мне выдали верный  ответ )))  А ты говоришь o1 не правильно считает… как задашь вопрос  ИИ так она и считает )))

avatar
Makstrade, ))))))

Встречаются 2 грузина
(первый) Гоги, ти чего такой грустный?
(второй) Да понимаишь, Гиви, я тут доктор ходил. Тот сказал, что печень плохо, пить нельза савсэм
(первый) Вах! И что ты сдэлал?!
(второй) Аааа, дал 100 баксов — сказал, что можьно...

Как-то так

С уважением
avatar
Makstrade, 

Каким образом некий недоумок с нулевым рейтингом smart-lab.ru/profile/tanp76/ ставит минусы, Если он у меня в ЧС?





@Тимофей Мартынов ты обещал решить проблему
avatar

я подписался на один месяц на эту 200-долларовую подписку, и пришел к выводу, что она нечем ни лучше 1o, которая за 20 дол (хотя за 20 долл там рано или поздно заканчивается лимит, и это конечно большой минус) 
За 200 долл улучшенная 1o с большим контекстным окном — работает раздражающе долго, а выдает сопоставимый результат. Что мне помогло гораздо лучше, это очистить память chatgpt, потому что по умолчанию содержание всех предыдущих диалогов тоже идет в контекстное окно, и основательно его засирает

avatar
Гуру Хренов, ну это не так

Попробуйте в подписке plus сделать саммари статьи или книги страниц на 50
Попробуйте изготовить отчет из 10 загруженных файлов pdf
Agent и Deep Research только в Pro (причем пока только в США)
o3 можно долбить значительно интенсивнее и с меньшей задержкой
И т.д....

С уважением
avatar
Мальчик buybuy, а если я, например, забью название новой книжки-бестселлера с Амазона, чат мне выдаст саммари на 50 страниц?
Маркиз Лафайет, нет

Но если загрузишь doc или pdf — до 100 страниц обработает
В т.ч. переведет )))

С уважением
Мальчик buybuy, спасибо.
Мальчик buybuy, вот так вот. Т.е. теперь работа переводчика перешла к корректору…
avatar
Спроси, пожалуйста: влияние микродозинга псилоцибина, на детей с синдромом дауна, аутистов, и детей с задержкой развития интеллекта.
Я пока не приобщился к ИИ, видать старческий консерватизЬмЪ подхватил.
avatar
Gonzo_071, ответ короткий и явно цензурированный


Исследование влияния микродозинга псилоцибина на детей с синдромом Дауна, аутистов и детей с задержкой развития интеллекта — это довольно сложная и чувствительная тема, поскольку на данный момент научных данных, подтверждающих безопасность и эффективность микродозинга псилоцибина в этих группах, нет. В этом контексте стоит отметить, что микродозинг псилоцибина (приём малых доз психоактивного вещества) является относительно новым и малораспространённым явлением, и исследования на эту тему всё ещё находятся на ранней стадии.

Микродозинг псилоцибина: Что это?

Микродозинг — это практика приёма очень малых доз психоактивных веществ, таких как псилоцибин (главный компонент псилоцибиновых грибов), с целью улучшения настроения, когнитивных функций, концентрации или креативности, но без ярко выраженных галлюциногенных эффектов. Дозы для микродозинга обычно составляют около 1/10 — 1/20 обычной дозы.

Основные утверждения сторонников микродозинга:

  • Улучшение настроения.
  • Повышение концентрации внимания и креативности.
  • Снижение уровня стресса и тревоги.

Тем не менее, стоит помнить, что на сегодняшний день большинство исследований о микродозинге псилоцибина проводятся на взрослых, и результаты часто ограничены малым числом участников.

Влияние на детей с синдромом Дауна, аутизмом и задержкой развития интеллекта

1. Синдром Дауна (Трисомия 21)

Синдром Дауна — это генетическое расстройство, вызванное дополнительной хромосомой 21. Дети с синдромом Дауна часто имеют когнитивные задержки, а также могут сталкиваться с трудностями в обучении и социальной адаптации.

  • Отсутствие данных: На данный момент нет исследований, которые бы специально изучали влияние микродозинга псилоцибина на детей с синдромом Дауна.
  • Теоретические риски: Псилоцибин может влиять на восприятие и когнитивные функции, что может быть опасно для детей с уже существующими когнитивными нарушениями. Возможные непредсказуемые психоактивные эффекты могут усугубить симптомы у детей с задержкой развития, что ставит под сомнение безопасность применения этого вещества.

2. Аутизм (РАС — расстройства аутистического спектра)

Аутизм — это группа расстройств, характеризующихся нарушениями социального взаимодействия и коммуникации, а также ограниченными и повторяющимися паттернами поведения. Некоторые исследования показали, что психоделики могут оказывать влияние на социальное взаимодействие и восприятие у взрослых людей с аутизмом.

  • Неопределённые результаты: Хотя есть несколько исследовательских проектов, изучающих использование психоделиков в лечении аутизма, их результаты на данный момент не являются достаточно обоснованными для применения в лечении детей с аутизмом. Для детской аудитории тем более требуется крайне осторожный подход.
  • Риски: Психоактивные вещества могут вызвать тревогу или стресс у людей с аутизмом, что сделает их небезопасными для этой группы. Микродозинг, в свою очередь, может иметь непредсказуемые эффекты на нейропсихологическое развитие.

3. Задержка развития интеллекта

Задержка развития интеллекта может быть вызвана различными факторами, включая генетические, экологические и социальные. Дети с задержкой развития интеллекта часто имеют трудности с обучением и адаптацией к социальной среде.

  • Неизученные последствия: Исследования на тему микродозинга псилоцибина среди детей с задержкой развития интеллекта также не проводились. Псилоцибин может повлиять на мозговую активность, что в теории может повлиять на когнитивные функции.
  • Потенциальные риски: Психоактивные вещества могут оказывать сильное воздействие на мозг и нервную систему, что может быть небезопасным для детей с когнитивными нарушениями.

Этические и медицинские соображения

  1. Этические вопросы: Применение психоактивных веществ для лечения детей требует строгого соблюдения этических норм. Дети не могут дать информированное согласие на использование подобных веществ, и это поднимает вопросы о правомерности их использования в качестве лечения.

  2. Безопасность и риски: Поскольку психоделики могут иметь непредсказуемые последствия для психики, особенно у людей с нарушениями развития, необходимо с большой осторожностью подходить к использованию таких веществ в детской практике.

  3. Недостаток исследований: На данный момент существует крайне мало научных исследований, посвящённых воздействию псилоцибина (в том числе в микродозах) на детей. Большинство исследований сосредоточены на взрослых, и их результаты не могут быть непосредственно перенесены на детскую аудиторию.

Заключение

На текущий момент нет научных доказательств того, что микродозинг псилоцибина безопасен и эффективен для детей с синдромом Дауна, аутизмом или задержкой развития интеллекта. Безопасность таких вмешательств требует более тщательных исследований, которые должны учитывать как потенциальную пользу, так и риски для здоровья и психики детей.

Существующие исследования в области психоделиков сосредоточены на взрослых и касаются в основном психиатрических заболеваний, таких как депрессия и тревожные расстройства. Для детей, особенно с когнитивными нарушениями, важно сначала исследовать традиционные методы терапии и подходы, которые доказали свою эффективность.

С уважением

Мальчик buybuy, Благодарю.
Я так и знал, скрывают. Это заговор!
Моё мнение, нужно их ударными дозами пичкать, а не микро.
Те кто переживёт и приспособится, вполне себе могут стать магами, псайкерами и биотиками.
Во имя Императора, конечно же!
Толку от них откровенно — никакого, а риск дело благородное.
avatar
Gonzo_071, ну вот не факт

Я в жизни попробовал практически все наркотики (кроме героина внутривенно и дешевой шляпы типа спидов), в т.ч. почти все галлюциногены.

И галлюциногены настолько сильно расширяют мир, что неустойчивая психика очень быстро шурша едет крышей. Не верите — спросите любого, кто хоть раз словил bad trip, о том, что он видел )))
Поэтому скармливать лошадиные дозы псилобицина детям с неустойчивой психикой — это треш, IMHO.

С уважением
Мальчик buybuy, ну почему же лошадиные… пусть, как для пони расчитают! И выберут тех кто поустойчивей. А то весь возможный (вполне!) прогресс, тормозит вопрос этики.
Уже колличественно и временем доказано, что перспективы у этих детей с классическим подходом -около нулевой. У взрослого мозг сформирован практически, у детей же огромный потенциал к изменению, хоть и в разные стороны.
Я, конечно, не горю желанием ситтером для них быть. И находиться рядом, когда солнечный словит затмение.
avatar
Мальчик buybuy, токари так шутят;)
avatar
Мальчик buybuy, оно и заметно, знаете ли…
avatar
Gonzo_071, так ты же про микродозинг запрос отправил, а рассуждаешь об ударных дозах! Шиза?!
avatar
Gonzo_071, я  помню одна рууская девица употребила случайно пол стакана лсд...  на год ушла в глюки но выжила
avatar
Мальчик buybuy, а витамин С для тех же групп испытуемых?)
avatar
Интуитивно параметры скоринговых моделей, которые будут таргетировать вкусовые предпочтения, не определить ИМХО. Вторая проблема — отсутствие критериев контроля, снова внутренняя кухня скоринга. 

Ну и понятно, что гипотетически можно назвать десятки характеристик оценки эффективности, от региона и платежеспособности, до кол-ва символов и обратной связи, но это все пустота. 

Так что есть? Есть офигенный подход — выходим на компанду разработчиков, кто пилит ИИ. Через них выходим на команды, которые пилили ИИ в предыдущих поколениях, плюс тусовка (те нам сливают данные по скорингу, какие модели были раньше). Ну и исходя из них (что уже устарело и не представляет коммерческую тайну на сегодня), уже формируем более корректные предположения. А тусовка эта небольшая, будет от силы 100 человек, если напарсить достаточно данных заранее у кого нужно. 

найти координаты разрабов просто. 2-3 месяца и инфа есть, часто там сидят люди, которые явно недооценены своим бывшим работодателем (именно такие мысли у них в голове и на это давить) и кротчайший путь через линктын и ейчаров, за 50 баксов или дешевле будет инфа) 
Виктор Громов, зачем?!

Ставим VPN на USA и юзаем Edge с регионом ENUS.
(настройки делаем в Bing, настройки Windows ChatGPT упорно не видит)

Проверено — это наилучший результат )))

С уважением
А если уже отсебятину, то проект глобальный, я не думаю, что будет привязка к региону, ну и если увеличиваем выборку, то числа будут другие. Плюс же еще надо понимать, в чем разница работы каждой конкретной модели. А это уже знают кто пишет код, самим голову ломать не надо, есть люди, сами расскажут. Задача решается просто, первый курс для осинта и 10-50 баксов, плюс жесткий диск на 2 террабайта, бро)
Виктор Громов, ты слишком щедрый, бро

Я контакты людей (из LinkedIn и не только) покупаю по цене 1000 руб. за 100 лидов. Какие нах баксы? )))

С уважением
Gonzo_071, ну ты же даже не спрашивал! А спросил противоположное по смыслу своим дальнейшим рассуждениям. И выводы, сука, выводы делаешь!!! Иди, фрезу точи! Доктор он… Давайте генетические отклонения лечит галлюциногенами. А головную боль — гвоздями? Слабо не пить, не курить, не нюхать, не колоться, не принимать внутрь — и рожать здоровых детей? Сла-а-або!
avatar
Может быть это оттого, что англоязычная база в интернете в разы больше русскоязычной?
Почитал.и у меня такое.стойкое ощущение.что я забрел на урок английского языка.нехрена непонятно.переведите и огласите весь список.
avatar
Gonzo_071, ты слепой, что ли, или сочетание букв «генетическое» у тебя приступы вызывает? Ты свою родословную сам пишешь.
avatar

теги блога Мальчик buybuy

....все тэги



UPDONW
Новый дизайн