AIT
AIT личный блог
29 августа 2023, 19:22

Помогите разобраться с задачкой по теории вероятности? (часть 2) Ошибка базового процента

Пару недель назад публиковал пост smart-lab.ru/mobile/topic/931383/, где просил помочь с задачкой:
Дано:
А) Если в предыдущий день было жарко и душно, то сегодня с вероятностью 0,55 будет дождь Б) Если в соседнем городе ночью был дождь, то с вероятностью 0,6 у нас тоже будет дождь Вопрос: С какой вероятностью у нас будет дождь, если вчера было жарко и душно, а ночью был дождь в соседнем городе? и какое из правил применяется в данной задаче?

В комментариях были ответы, которые показались мне логичными, но я решил задать тот же вопрос чату ГПТ
Пример ответа из комментариев:
Рассмотрим противоположное событие: B — дождь не пойдет. Его вероятность равна P(B) = (1-0.55)*(1-0.6)=0.18. Тогда вероятность, что дождь пойдет P(A)=1-0.18=0.82.
или
0,6. так как оба события равновероятны, берём то, которое имеет большую вероятность. могу ошибаться, но скорее всего прав.

Ответ чата ГПТ 4:
Используем формулу условной вероятности: P(дождь сегодня|жарко и душно вчера и дождь в соседн ем городе вчера) = P(дождь сегодня и жарко и душно вчера и дождь в соседнем городе вчера) / P(жарко и душно вчера и дождь в соседнем городе вчера) Первую вероятность можно найти как произведение вероятностей из условия А) и Б): P(дождь сегодня и жарко и душно вчера и дождь в соседнем городе вчера) = P(дождь сегодня|жарко и душно вчера) * P(дождь в соседнем городе вчера) * P(жарко и душно вчера) P(дождь сегодня и жарко и душно вчера и дождь в соседнем городе вчера) = 0.55 * 0.6 * 1 = 0.33 Вторую вероятность можно также выразить через условные вероятности: P(жарко и душно вчера и дождь в соседнем городе вчера) = P(дождь в соседнем городе вчера|жарко и душно вчера) * P(жарко и душно вчера) P(дождь в соседнем городе вчера|жарко и душно вчера) = 0.55 (из условия А)) P(жарко и душно вчера) = 1 (из условия) P(жарко и душно вчера и дождь в соседнем городе вчера) = 0.55 * 1 = 0.55 Теперь можем найти искомую вероятность: P(дождь сегодня|жарко и душно вчера и дождь в соседнем городе вчера) = P(дождь сегодня и жарко и душно вчера и дождь в соседнем городе вчера) / P(жарко и душно вчера и дождь в соседнем городе вчера) = 0.33 / 0.55 ≈ 0.6 Ответ: с вероятностью ≈0.6 у нас сегодня будет дождь, если вчера в нашем городе было жарко и душно, а вчера был дождь в соседнем городе.

При этом если задать вероятности 0,30 и 0,36, например, чат не выдает наибольшее. Я понимаю, что данная нейросеть не математическая, а текстовая, поэтому хочу попросить решения этой задачи еще раз)

P.S. Пытаясь подбирать разные, но схожие условия задачи для чата, наткнулся на вариант, где вероятность сильно снижается, пришлось копаться и наткнулся на интересную штуку и любопытный пример:

Ошибка базового процента

В городе с миллионным населением 100 террористов и 999900 мирных жителей. Для упрощения примера предполагается, что все люди в городе есть его население.

Пытаясь схватить террористов, город устанавливает систему тревоги с камерами наблюдения и программным обеспечением автоматического распознавания лиц.

Программное обеспечение имеет две возможные ошибки с вероятностью 1 % каждая:

  • Отрицательная ошибка: Когда камера видит террориста, сигнал тревоги прозвучит в 99 % случаев, и промолчит в 1 % случаев.
  • Положительная ошибка: Когда камера видит мирного жителя, сигнал тревоги промолчит в 99 % случаев, и прозвучит в 1 % случаев.

Теперь представьте, что сигнал тревоги прозвучал на случайного жителя. Какие шансы, что он — террорист?

Те, кто подвергаются заблуждению базового процента, скажут, что 99 %. Хотя такое предположение кажется правильным, на самом деле это около 1 %.

Заблуждение возникает вследствие смешения природы двух разных процентов ошибки. Количество случаев отсутствия звонка на 100 террористов и количество мирных жителей на 100 звонков является несвязанными количествами. Одно необязательно равно другому, и они даже не должны быть почти равны. Для иллюстрации этого, подумайте, что случится, если аналогичная система будет установлена ​​в другом городе, где террористов нет вовсе. Как и в первом городе, тревога сработает один раз на каждые 100 жителей города, которые не являются террористами, однако тревога никогда не сработает для террориста. Таким образом, в 100 % случаев тревога звучит для не-террориста, а отрицательной ошибки просто не существует.

Представьте, что всё население города в 1 млн пройдёт перед камерой. На около 99 из 100 террористов сработает тревога, но так же она сработает для примерно 9999 из 999900 мирных жителей. В сумме тревога прозвучит для около 10098 человек, из которых лишь ~99 будут террористами. Таким образом, вероятность, что человек, для которого сработала тревога, является террористом, — 99 раз из 10098, что меньше 1 %, и намного ниже изначальной догадки в 99 %.

В этом случае заблуждение базового процента такое сильное потому, что мирных жителей гораздо больше, чем террористов.


 

 

  
4 Комментария
  • А. Г.
    29 августа 2023, 20:01
    Задача поставлена некорректно, так как в условиях нет ничего о зависимости событий:

    — в предыдущий день было жарко и душно;
      — в соседнем городе ночью был дождь.

    А при разных зависимостях будут совсем разные вероятности события «И».
  • Василий Федорович
    29 августа 2023, 20:26
    «При этом если задать вероятности 0,30 и 0,36» — ппц, полный.
    Как можно задавать вероятность???????????????????
    Вероятность определяется на основе статистики!!!!!!!
    Только статистика определяет вероятность!!!
  • К.О'Тяра
    29 августа 2023, 23:57
    предположим было 10 дней с дождем в соседнем (Д) — тогда из них 6 с дождем в нашем
    и 10 дней жарких — тогда с дождем в нашем 5

    всего (5+6)/20 = 0.55
    и эта вероятность строго для пары значений (Д, Ж) — только такие дни рассматриваются, для других (0, Ж), (Д,0), (0,0) — мы ничего не можем предсказать, данных недостаточно

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн