Добрый вечер, коллеги!
В Пн 03.02.25 я сподобился приобрести подписку Pro на ChatGPT. Это недешево ($200/мес.), но очень полезно для работы. Модель o1pro очень неплоха, у 4o контекстное окно 128000 токенов (100 страниц формата A4 против 8000 токенов для подписки Plus, бесплатные варианты даже не обсуждаю), у o3 mini-high слабее ограничения на число запросов. Ну и самое главное — доступны опции Agent и Deep Research.
Речь пойдет о Deep Research. Эта такая крутая энжина, которая проводит полноценное исследование по интересующей тебя тематике. Сопит и пыхтит минут 30, лопатит весь доступный интернет и выдает саммари на 20-30 страниц с самим исследованием и перечнем первоисточников со ссылками. Ну это как промпт составить, здесь тоже целое искусство.
Работает очень хорошо, специалисту на подготовку такого отчета потребуется часов 6-8, неспециалисту — неделя (и результат будет плох, скорее).
Но хохма не в этом.
Меня заинтересовали отдельные аспекты интернет-трафика, в которых я слабо шарю (как ламер). Но любопытство меня одолевало, поэтому я попросил товарища с подпиской Pro запустить Deep Research, пока я тренировался с кредитками для оплаты (отдельный квест).
Он прислал мне свой отчет, а уже вечером я запустил свой.
Каково же было мое удивление, когда я получил 2 совершенно разных отчета по одному и тому же промпту!
Ну, я человек упертый, поэтому стал исследовать, какие параметры влияют на итоговый отчет.
Методом научного тыка было установлено, что на содержимое отчета влияет тип браузера и региональные установки. И если в Chrome это зависит только от учетной записи, то в Edge — от региональных установок Bing (здесь и далее — речь только про Windows).
Я завелся, и изготовил 8 отчетов (ниже в списке — модель, тип VPN, браузер и региональные установки, длина документа приведена в числе слов, посчитанных Word).
- o3mh VPN Edge ENUS (9007 слов) – сжато и конкретно, мне понравился больше всего
- o1pro proxy Edge ENUK (9171 слов) – подробнее, но меньше охват по темам
- o1pro VPN Edge ENUS (8921 слов) – сжато и по делу, чуть меньше охват по темам
- 4o VPN Edge ENUS (8968 слов) – хорошо, но слабее o1 и o3
- o1pro VPN Edge RURU (6143 слова) – сжато, но слабо
- o1pro VPN Chrome RURU (10784 слов) – много воды, слабее
- o1pro VPN Edge RUWW (7715 слов) – много воды, еще слабее
- o3mh VPN Edge ENUK (4407 слов) – самый слабый (?!)
Что видно невооруженным глазом? Длина отчета может отличаться в 2.5 раза.
Что видно вооруженным глазом? Длина отчета не влияет на его содержательность, так отчет в Chrome самый длинный, но и самый водянистый (ни о чем).
Идеальные отчеты выдают модели o3mh и o1pro в регионе ENUS. Теперь пользуюсь только ими.
Вопрос: теперь сообщаемые LLM знания будут зависеть от региона?! Ну т.е. как регионально таргетируется реклама?!
Не, я понимаю, что составление отчета требует полазить в интернете, а выдача ссылок браузером точно зависит от региональных настроек. Но разница в длине отчета в 2.5 раза?!
Что вы думаете по этому вопросу, коллеги?
С уважением
P.S. Если интересно — могу поделиться опытом программирования математических задач с помощью Canvas. Вкратце — это лютый трэш...
P.P.S. Хочу слегка огорчить всех, кто тихонько надрачивает на китайский Deep Suck.
Чтобы затестить рассуждающую нейросеть — надо просто задать ей сложный вопрос. Ответ на который нельзя найти в опубликованной книге или в одной конкретной статье. А нужно прочитать 3-5-10 статей и попытаться сделать выводы.
Тест (моя бывшая специальность): Рассчитай K3 группы Милнора и Квиллена для поля рациональных чисел
Ответ ChatGPT o3-mini-high: Z6 и Z48 (циклические группы порядков 6 и 48) — правильный
Ответ Deep Suck: Z+Z2 и Z24+Z2 (Z — аддитивная группа целых чисел) — полная чушь, слегка похожая на правду. Проблема в том, что первая группа — это подгруппа второй
При этом Deep Suck начинает рассуждать правильно, а потом пишет «очевидно, что...» а дальше вообще лютый треш «таким образом, данный вывод подтвержден как теоретически, так и экспериментально». Какие, б@ядь, эксперименты с высшими K-группами?!
Во всех 8 кейсах промпт один и тот же
Написал я, потом тюнинговал с помощью o3
С уважением
Тем не менее, на базе моего драфта o3 составила идентичные промпты для себя, для o1pro и для 4o (это я только про Deep Research).
А она точно в этом разбирается лучше )))
С уважением
Все специалисты (и я не исключение) пишут драфт промпта, а сам промпт составляет рассуждающая модель (я использую o3).
Ну и желательно прочитать гайд на openai.com про составление промптов для традиционных (3.5, 4, 4o) и рассуждающих (o1, o1pro, o3-mini, o3-mini-high) моделей. Это 2 разных документа в свободном доступе.
С уважением
оцени..
По Милнору — нет (см. выше)
С уважением
А разница в 2.5 раза в длине отчета? )))
С уважением
Вроде картинки то одинаковые, а такие разные ответы у сетки. Хотя на глаз разницу даже не увидеть. А тут 30 минут думает. Да там всё что угодно может произойти. Мизерное отклонение в начале, выльется в космическое отклонение на выходе после такой работы. Это нормально короче. Пока по другому не научились тренировать. Скажи ей, что хочешь непременно 5 страниц — поможет.
o1 выдает неверный ответ (не стал об этом писать)
o3 уже рассуждает правильно
С уважением
Встречаются 2 грузина
(первый) Гоги, ти чего такой грустный?
(второй) Да понимаишь, Гиви, я тут доктор ходил. Тот сказал, что печень плохо, пить нельза савсэм
(первый) Вах! И что ты сдэлал?!
(второй) Аааа, дал 100 баксов — сказал, что можьно...
Как-то так
С уважением
Каким образом некий недоумок с нулевым рейтингом smart-lab.ru/profile/tanp76/ ставит минусы, Если он у меня в ЧС?
@Тимофей Мартынов ты обещал решить проблему
я подписался на один месяц на эту 200-долларовую подписку, и пришел к выводу, что она нечем ни лучше 1o, которая за 20 дол (хотя за 20 долл там рано или поздно заканчивается лимит, и это конечно большой минус)
За 200 долл улучшенная 1o с большим контекстным окном — работает раздражающе долго, а выдает сопоставимый результат. Что мне помогло гораздо лучше, это очистить память chatgpt, потому что по умолчанию содержание всех предыдущих диалогов тоже идет в контекстное окно, и основательно его засирает
Попробуйте в подписке plus сделать саммари статьи или книги страниц на 50
Попробуйте изготовить отчет из 10 загруженных файлов pdf
Agent и Deep Research только в Pro (причем пока только в США)
o3 можно долбить значительно интенсивнее и с меньшей задержкой
И т.д....
С уважением
Но если загрузишь doc или pdf — до 100 страниц обработает
В т.ч. переведет )))
С уважением
Я пока не приобщился к ИИ, видать старческий консерватизЬмЪ подхватил.
Исследование влияния микродозинга псилоцибина на детей с синдромом Дауна, аутистов и детей с задержкой развития интеллекта — это довольно сложная и чувствительная тема, поскольку на данный момент научных данных, подтверждающих безопасность и эффективность микродозинга псилоцибина в этих группах, нет. В этом контексте стоит отметить, что микродозинг псилоцибина (приём малых доз психоактивного вещества) является относительно новым и малораспространённым явлением, и исследования на эту тему всё ещё находятся на ранней стадии.
Микродозинг псилоцибина: Что это?
Микродозинг — это практика приёма очень малых доз психоактивных веществ, таких как псилоцибин (главный компонент псилоцибиновых грибов), с целью улучшения настроения, когнитивных функций, концентрации или креативности, но без ярко выраженных галлюциногенных эффектов. Дозы для микродозинга обычно составляют около 1/10 — 1/20 обычной дозы.
Основные утверждения сторонников микродозинга:
Тем не менее, стоит помнить, что на сегодняшний день большинство исследований о микродозинге псилоцибина проводятся на взрослых, и результаты часто ограничены малым числом участников.
Влияние на детей с синдромом Дауна, аутизмом и задержкой развития интеллекта
1. Синдром Дауна (Трисомия 21)
Синдром Дауна — это генетическое расстройство, вызванное дополнительной хромосомой 21. Дети с синдромом Дауна часто имеют когнитивные задержки, а также могут сталкиваться с трудностями в обучении и социальной адаптации.
2. Аутизм (РАС — расстройства аутистического спектра)
Аутизм — это группа расстройств, характеризующихся нарушениями социального взаимодействия и коммуникации, а также ограниченными и повторяющимися паттернами поведения. Некоторые исследования показали, что психоделики могут оказывать влияние на социальное взаимодействие и восприятие у взрослых людей с аутизмом.
3. Задержка развития интеллекта
Задержка развития интеллекта может быть вызвана различными факторами, включая генетические, экологические и социальные. Дети с задержкой развития интеллекта часто имеют трудности с обучением и адаптацией к социальной среде.
Этические и медицинские соображения
Этические вопросы: Применение психоактивных веществ для лечения детей требует строгого соблюдения этических норм. Дети не могут дать информированное согласие на использование подобных веществ, и это поднимает вопросы о правомерности их использования в качестве лечения.
Безопасность и риски: Поскольку психоделики могут иметь непредсказуемые последствия для психики, особенно у людей с нарушениями развития, необходимо с большой осторожностью подходить к использованию таких веществ в детской практике.
Недостаток исследований: На данный момент существует крайне мало научных исследований, посвящённых воздействию псилоцибина (в том числе в микродозах) на детей. Большинство исследований сосредоточены на взрослых, и их результаты не могут быть непосредственно перенесены на детскую аудиторию.
Заключение
На текущий момент нет научных доказательств того, что микродозинг псилоцибина безопасен и эффективен для детей с синдромом Дауна, аутизмом или задержкой развития интеллекта. Безопасность таких вмешательств требует более тщательных исследований, которые должны учитывать как потенциальную пользу, так и риски для здоровья и психики детей.
Существующие исследования в области психоделиков сосредоточены на взрослых и касаются в основном психиатрических заболеваний, таких как депрессия и тревожные расстройства. Для детей, особенно с когнитивными нарушениями, важно сначала исследовать традиционные методы терапии и подходы, которые доказали свою эффективность.
С уважением
Я так и знал, скрывают. Это заговор!
Моё мнение, нужно их ударными дозами пичкать, а не микро.
Те кто переживёт и приспособится, вполне себе могут стать магами, псайкерами и биотиками.
Во имя Императора, конечно же!
Толку от них откровенно — никакого, а риск дело благородное.
Я в жизни попробовал практически все наркотики (кроме героина внутривенно и дешевой шляпы типа спидов), в т.ч. почти все галлюциногены.
И галлюциногены настолько сильно расширяют мир, что неустойчивая психика очень быстро шурша едет крышей. Не верите — спросите любого, кто хоть раз словил bad trip, о том, что он видел )))
Поэтому скармливать лошадиные дозы псилобицина детям с неустойчивой психикой — это треш, IMHO.
С уважением
Уже колличественно и временем доказано, что перспективы у этих детей с классическим подходом -около нулевой. У взрослого мозг сформирован практически, у детей же огромный потенциал к изменению, хоть и в разные стороны.
Я, конечно, не горю желанием ситтером для них быть. И находиться рядом, когда солнечный словит затмение.
Ну и понятно, что гипотетически можно назвать десятки характеристик оценки эффективности, от региона и платежеспособности, до кол-ва символов и обратной связи, но это все пустота.
Так что есть? Есть офигенный подход — выходим на компанду разработчиков, кто пилит ИИ. Через них выходим на команды, которые пилили ИИ в предыдущих поколениях, плюс тусовка (те нам сливают данные по скорингу, какие модели были раньше). Ну и исходя из них (что уже устарело и не представляет коммерческую тайну на сегодня), уже формируем более корректные предположения. А тусовка эта небольшая, будет от силы 100 человек, если напарсить достаточно данных заранее у кого нужно.
найти координаты разрабов просто. 2-3 месяца и инфа есть, часто там сидят люди, которые явно недооценены своим бывшим работодателем (именно такие мысли у них в голове и на это давить) и кротчайший путь через линктын и ейчаров, за 50 баксов или дешевле будет инфа)
Ставим VPN на USA и юзаем Edge с регионом ENUS.
(настройки делаем в Bing, настройки Windows ChatGPT упорно не видит)
Проверено — это наилучший результат )))
С уважением
Я контакты людей (из LinkedIn и не только) покупаю по цене 1000 руб. за 100 лидов. Какие нах баксы? )))
С уважением