Компаунд распределение пуассона. Распределение Пуассона

Биномиальный закон распределения относится к случаям, когда была сделана выборка фиксированного объема. Распределение Пуассона относится к случаям, когда число случайных событий происходит на определенных длине, площади, объеме или времени, при этом определяющим параметром распределения является среднее число событийт , а не объем выборки п и вероятность успеха р. Например, количество несоответствий в выборке или количество несоответствий, приходящихся на единицу продукции.

Распределение вероятностей для числа успехов х имеет при этом следующий вид:

Или можно сказать, что дискретная случайная величина X распределена по закону Пуассона, если ее возможные значения 0,1, 2, ...т, ...п, а вероятность появления таких значений определяется соотношением:

(14)

где m или λ- некоторая положительная величина, называемая параметром распределения Пуассона.

Закон Пуассона распространяется на «редко» происходящие события, при этом возможность очередной удачи (например, сбоя) сохраняется непрерывно, является постоянной и не зависит от числа предыдущих удач или неудач (когда речь идет о процессах, развивающихся во времени, это называют «независимостью от прошлого»). Классическим примером, когда применим закон Пуассона, является число телефонных вызовов на телефонной станции в течение заданного интервала времени. Другими примерами могут быть число чернильных клякс на странице, неаккуратно написанной рукописи, или число соринок, оказавшихся на кузове автомобиля во время его окраски. Закон распределения Пуассона измеряет число дефектов, а не число бракованных изделий.

Распределению Пуассона подчиняется количество случайных событий, которые появляются в фиксированные промежутки времени или в фиксированной области пространства, При λ<1 значение P(m) монотонно убывает с ростом m то, a при λ> 1 значениеP(m)с ростом т проходит через максимум вблизи /

Особенностью распределения Пуассона является равенство дисперсии математическому ожиданию. Параметры распределения Пуассона

M(x) = σ 2 = λ (15)

Эта особенность распределения Пуассона позволяет на практике утверждать, что экспериментально полученное распределение случайной величины подчинено распределению Пуассона, если выборочные значения математического ожидания и дисперсии примерно равны.

Закон редких событий применяется в машиностроении для выборочного контроля готовой продукции, когда по техническим условиям в принимаемой партии продукции допускается некоторый процент брака (обычно небольшой) q<<0.1.

Если вероятность q события А очень мала (q≤0,1), а число испытаний велико, то вероятность того, что событие А наступит m раз в n испытаниях, будет равна



,

где λ = М(х) = nq

Для вычисления распределения Пуассона можно пользоваться следующими рекуррентными соотношениями

и (16)

Распределение Пуассона играет важную роль в статистических методах обеспечения качества, поскольку с его помощью можно аппроксимировать гипергеометрическое и биномиальное распределения.

Такая аппроксимация допустима, когда , при условии, что qn имеет конечный предел и q<0.1. Когда п →∞ , а р → 0, среднее п р = т = const.

При помощи закона редких событий можно вычислить вероятность того, что в выборке из n единиц будет содержаться: 0,1,2,3, и т.д. бракованных деталей, т.е. заданное m раз. Можно также вычислить вероятность появления в такой выборке m штук дефектных деталей и более. Эта вероятность на основании правила сложения вероятностей будет равна-:

Пример 1 . В партии имеются бракованные детали, доля которых составляет 0,1. Последовательно берут 10 деталей и обследуют, после чего их возвращают в партию, т.е. испытания носят независимый характер. Какова вероятность того, что при проверке 10 деталей попадется одна бракованная?

Решение Из условия задачи q=0,1; n=10; m=1.Очевидно, что р=1-q=0,9.

Полученный результат можно отнести и к тому случаю, когда извлекается подряд 10 деталей без возврата их обратно в партию. При достаточно большой партии, например, 1000 шт., вероятность извлечения деталей изменится ничтожно мало. Поэтому при таких условиях извлечение бракованной детали можно рассматривать как событие, не зависящее от результатов предшествующих испытаний.

Пример 2. В партии имеется 1% бракованных дета- лей. Какова вероятность того, что при взятии из партии выборки объемом 50 единиц продукции в ней будет находиться 0, 1, 2, 3 ,4дефектных деталей??

Решение. Здесь q=0.01, nq=50*0.01=0.5

Таким образом, для эффективного применения распределения Пуассона как аппроксимации биномиального необходимо, чтобы вероятность успеха р была существенно меньше q . a п р = т была порядка единицы (или нескольких единиц).

Таким образом, в статистических методах обеспечения качества

гипергеометрический закон применим для выборок любого объема п и любого уровня несоответствий q ,

биномиальный закон и закон Пуассона являются его частными случаями соответственно при условии, если n/N<0,1 и

Например, регистрируется количество дорожных происшествий за неделю на определенном участке дороги. Это число представляет собой случайную величину, которая может принимать значения: (верхнего предела нет). Число дорожных происшествий может быть каким угодно большим. Если рассмотреть какой-либо короткий временной промежуток в течение недели, скажем минуту, то происшествие либо произойдет на его протяжении, либо нет. Вероятность дорожного происшествия в течение отдельно взятой минуты очень мала, и примерно такая же она для всех минут.

Распределение вероятностей числа происшествий описывается формулой:

где m - среднее количество происшествий за неделю на определенном участке дороги; е - константа, равная 2,718...

Характерные особенности данных, для которых наилучшим образом подходит распределение Пуассона, следующие:

1. Каждый малый интервал времени может рассматриваться как опыт, результатом которого является одно из двух: либо происшествие (“успех”), либо его отсутствие (“неудача”). Интервалы столь малы, что может быть только один “успех” в одном интервале, вероятность которого мала и неизменна.

2. Число “успехов" в одном большом интервале не зависит от их числа в другом, т.е. “успехи” беспорядочно разбросаны по временным промежуткам.

3. Среднее число “успехов” постоянно на протяжении всего времени. Распределение вероятностей Пуассона может быть использовано не только при работе со случайными величинами на временных интервалах, но и при учете дефектов дорожного покрытия на километр пути или опечаток на страницу текста. Общая формула распределения вероятностей Пуассона:

где m - среднее число “успехов” на единицу.

В таблицах распределения вероятностей Пуассона значения табулированы для определенных значений m и

Пример 2.7. В среднем на телефонной станции заказывают три телефонных разговора в течение пяти минут. Какова вероятность, что будет заказано 0, 1,2, 3, 4 или больше четырех разговоров в течение пяти минут?

Применим распределение вероятностей Пуассона, так как:

1. Существует неограниченное количество опытов, т.е. маленьких отрезков времени, когда может появиться заказ на телефонный разговор, вероятность чего мала и постоянна.

2. Считается, что спрос на телефонные разговоры беспорядочно распределен во времени.

3. Считается, что среднее число телефонных разговоров в любом -минутном отрезке времени одинаково.

В этом примере среднее число заказов равно 3 за 5 минут. Отсюда, распределение Пуассона:

При распределении вероятностей Пуассона, зная среднее число “успехов” на 5-минутном промежутке (например как в примере 2.7), для того чтобы узнать среднее число “успехов” за один час, нужно просто умножить на 12. В примере 2.7 среднее число заказов в час составит: 3 х 12 = 36. Аналогично, если требуется определить среднее число заказов в минуту:

Пример 2.8. В среднем за пять дней рабочей недели на автоматической линии происходят 3,4 неполадок. Какова вероятность двух неполадок в каждый день работы? Решение.

Можно применить распределение Пуассона:

1. Существует неограниченное количество опытов, т.е. малых промежутков времени, в течение каждого из них может произойти или не произойти неполадка на автоматической линии. Вероятность этого для каждого промежутка времени мала и постоянна.

2. Предполагается, что неполадки беспорядочно расположены во времени.

3. Предполагается, что среднее число неполадок в течение любых пяти дней постоянно.

Среднее число неполадок равно 3, 4 за пять дней. Отсюда число неполадок в день:

Следовательно,

Основные законы распределения случайной величины

ЛЕКЦИЯ 9

(продолжение)

Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А равна р . Для определения вероятности k – появлений события А в этих испытаниях используют, как вам уже известно, формулу Бернулли. Однако, как быть если n велико, а вероятность р события А достаточно мала (). В таких случаях прибегают к асимптотической формуле Пуассона.

Итак, поставим своей задачей найти вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно k раз.

Сделаем важное допущение: пусть произведение сохраняет постоянное значение, а именно . Это означает, что среднее число появлений события в различных сериях испытаний, то есть при различных значениях n , остаётся неизменным.

Воспользуемся формулой Бернулли для вычисления интересующей нас вероятности:

Приняв во внимание, что n имеет очень большое значение, вместо найдём . При этом будет найдено лишь приближённое значение отыскиваемой вероятности: n хотя и велико, но всё же конечно, а при отыскании предела мы устремим n к бесконечности.

В результате (для простоты записи знак приближённого равенства опущен) запишем

.

Эта формула выражает закон распределения Пуассона вероятностей массовых (n велико) редких (р мало) событий.

Таким образом, будем говорить, что дискретная случайная величина , принимающая счётное множество значений, подчиняется закону распределения Пуассона, если вероятности её возможных значений задаются выражением:

Свойства распределения Пуассона:

Действительно:

2. .

3. если , то из биномиального распределения следует закон распределения Пуассона.

ПРИМЕР 1 .Завод отправил на базу 5000 доброкачественных изделий. Вероятность того, что в пути изделие повредится, равна 0,0002. Найти вероятность того, что на базу прибудут: а) три негодных изделия; б) не более трёх повреждённых изделия.

Решение : по условию n =5000, p =0,0002. Найдём .

а) k = 3. Искомая вероятность по формуле Пуассона приближённо равна

.

б) Пусть случайная величина Х – число изделий, повреждённых в пути, то есть . Очевидно, что данная случайная величина распределена по биномиальному закону. Следовательно, искомую вероятность можно вычислить по формуле

Но, так как , то по свойству 3 о можем воспользоваться законом распределения Пуассона, то есть, можем записать.

Рассмотрим распределение Пуассона, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL ПУАССОН.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения, его математического ожидания и стандартного отклонения.

Сначала дадим сухое формальное определение распределения, затем приведем примеры ситуаций, когда распределение Пуассона (англ. Poisson distribution ) является адекватной моделью для описания случайной величины.

Если случайные события происходят в заданный период времени (или в определенном объеме вещества) со средней частотой λ(лямбда ), то число событий x , произошедших за этот период времени, будет иметь распределение Пуассона .

Применение распределения Пуассона

Примеры, когда Распределение Пуассона является адекватной моделью:

  • число вызовов, поступивших на телефонную станцию за определенный период времени;
  • число частиц, подвергнувшихся радиоактивному распаду за определенный период времени;
  • число дефектов в куске ткани фиксированной длины.

Распределение Пуассона является адекватной моделью, если выполняются следующие условия:

  • события происходят независимо друг от друга, т.е. вероятность последующего события не зависит от предыдущего;
  • средняя частота событий постоянна. Как следствие, вероятность события пропорциональна длине интервала наблюдения;
  • два события не могут произойти одновременно;
  • число событий должно принимать значения 0; 1; 2…

Примечание : Хорошей подсказкой, что наблюдаемая случайная величина имеет распределение Пуассона, является тот факт, что приблизительно равно (см. ниже).

Ниже представлены примеры ситуаций, когда Распределение Пуассона не может быть применено:

  • число студентов, которые выходят из университета в течение часа (т.к. средний поток студентов не постоянен: во время занятий студентов мало, а в перерыве между занятиями число студентов резко возрастает);
  • число землетрясений амплитудой 5 баллов в год в Калифорнии (т.к. одно землетрясение может вызвать повторные толчки сходной амплитуды – события не независимы);
  • число дней, которые пациенты проводят в отделении интенсивной терапии (т.к. число дней, которое пациенты проводят в отделении интенсивной терапии всегда больше 0).

Примечание : Распределение Пуассона является приближением более точных дискретных распределений: и .

Примечание : О взаимосвязи распределения Пуассона и Биномиального распределения можно прочитать в статье . О взаимосвязи распределения Пуассона и Экспоненциального распределения можно прочитать в статье про .

Распределение Пуассона в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Распределения Пуассона имеется функция ПУАССОН.РАСП() , английское название - POISSON.DIST(), которая позволяет вычислить не только вероятность того, что за заданный период времени произойдет х событий (функцию плотности вероятности p(x), см. формулу выше), но и (вероятность того, что за заданный период времени произойдет не меньше x событий).

До MS EXCEL 2010 в EXCEL была функция ПУАССОН() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). ПУАССОН() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .

Распределение Пуассона имеет скошенную форму (длинный хвост справа у функции вероятности), но при увеличении параметра λ становится все более симметричным.

Примечание : Среднее и дисперсия (квадрат ) равны параметру распределения Пуассона – λ (см. файл примера лист Пример ).

Задача

Типичным применением Распределения Пуассона в контроле качества является модель количества дефектов, которые могут появиться в приборе или устройстве.

Например, при среднем количестве дефектов в микросхеме λ (лямбда) равном 4, вероятность, что случайно выбранная микросхема будет иметь 2 или меньше дефектов, равна: =ПУАССОН.РАСП(2;4;ИСТИНА)=0,2381

Третий параметр в функции установлен = ИСТИНА, поэтому функция вернет интегральную функцию распределения , то есть вероятность того, что число случайных событий окажется в диапазоне от 0 до 4 включительно.

Вычисления в этом случае производятся по формуле:

Вероятность того, что случайно выбранная микросхема будет иметь ровно 2 дефекта, равна: =ПУАССОН.РАСП(2;4;ЛОЖЬ)=0,1465

Третий параметр в функции установлен = ЛОЖЬ, поэтому функция вернет плотность вероятности.

Вероятность того, что случайно выбранная микросхема будет иметь больше 2-х дефектов, равна: =1-ПУАССОН.РАСП(2;4;ИСТИНА) =0,8535

Примечание : Если x не является целым числом, то при вычислении формулы . Формулы =ПУАССОН.РАСП(2 ; 4; ЛОЖЬ) и =ПУАССОН.РАСП(2,9 ; 4; ЛОЖЬ) вернут одинаковый результат.

Генерация случайных чисел и оценка λ

При значениях λ>15 , Распределение Пуассона хорошо аппроксимируется Нормальным распределением со следующими параметрами: μ, σ 2 .

Подробнее о связи этих распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .

Где λ равна среднему числу появления событий в одинаковых независимых испытаниях, т.е. λ = n × p, где p – вероятность события при одном испытании, e = 2,71828 .

Ряд распределения закона Пуассона имеет вид:


Назначение сервиса . Онлайн-калькулятор используется для построения Пуассоновского распределения и вычисления всех характеристик ряда: математического ожидания, дисперсии и среднеквадратического отклонения. Отчет с решением оформляется в формате Word .
Число испытаний: n = , Вероятность p =
Вычислить вероятность для: m =
наступит раз
менее раз
не менее раз
более раз
не более раз
не менее и не более раз
наступит хотя бы один раз
В случае, когда n велико, а λ = p·n > 10 формула Пуассона дает очень грубое приближение и для расчета P n (m) используют локальную и интегральную теоремы Муавра-Лапласа .

Числовые характеристики случайной величины Х

Математическое ожидание распределения Пуассона
M[X] = λ

Дисперсия распределения Пуассона
D[X] = λ

Пример №1 . Семена содержат 0.1% сорняков. Какова вероятность при случайном отборе 2000 семян обнаружить 5 семян сорняков?
Решение.
Вероятность р мала, а число n велико. np = 2 P(5) = λ 5 e -5 /5! = 0.03609
Математическое ожидание : M[X] = λ = 2
Дисперсия : D[X] = λ = 2

Пример №2 . Среди семян ржи имеется 0.4% семян сорняков. Составить закон распределения числа сорняков при случайном отборе 5000 семян. Найти математическое ожидание и дисперсию этой случайной величины.
Решение. Математическое ожидание: M[X] = λ = 0.004*5000 = 20. Дисперсия: D[X] = λ = 20
Закон распределения:

X 0 1 2 m
P e -20 20e -20 200e -20 20 m e -20 /m!

Пример №3 . На телефонной станции неправильное соединение происходит с вероятностью 1/200. Найдите вероятность того, что среди 200 соединений произойдет:
а) ровно одно неправильное соединение;
б) меньше чем три неправильных соединения;
в) больше чем два неправильных соединения.
Решение. По условию задачи вероятность события мала, поэтому используем формулу Пуассона (15).
а) Задано: n = 200, p = 1/200, k = 1. Найдем P 200 (1).
Получаем: . Тогда P 200 (1) ≈ e -1 ≈ 0,3679.
б) Задано: n = 200, p = 1/200, k < 3. Найдем P 200 (k < 3).
Имеем: a = 1.

в) Задано: n = 200, p = 1/200, k > 2. Найдем P 200 (k > 2).
Эту задачу можно решить проще: найти вероятность противоположного события, так как в этом случае нужно вычислить меньше слагаемых. Принимая во внимание предыдущий случай, имеем

Рассмотрим случай, когда n является достаточно большим, а p - достаточно малым; положим np = a, где a - некоторое число. В этом случае искомая вероятность определяется формулой Пуассона:


Вероятность появления k событий за время длительностью t можно также найти по формуле Пуассона:
где λ - интенсивность потока событий, то есть среднее число событий, которые появляются в единицу времени.

Пример №4 . Вероятность того, что деталь бракованная, равна 0.005. проверяется 400 деталей. Укажите формулу вычисления вероятности того, что больше 3 деталей оказались с браком.

Пример №5 . Вероятность появления бракованных деталей при их массовом производстве равна p. определить вероятность того, что в партии из N деталей содержится а) ровно три детали; б) не более трех бракованных деталей.
p=0,001; N = 4500
Решение.
Вероятность р мала, а число n велико. np = 4.5 < 10. Значит случайная величина Х – распределена по Пуассоновскому распределению. Составим закон.
Случайная величина X имеет область значений (0,1,2,...,m). Вероятности этих значений можно найти по формуле:

Найдем ряд распределения X.
Здесь λ = np = 4500*0.001 = 4.5
P(0) = e - λ = e -4.5 = 0.01111
P(1) = λe -λ = 4.5e -4.5 = 0.04999

Тогда вероятность того, что в партии из N деталей содержится ровно три детали, равна:

Тогда вероятность того, что в партии из N деталей содержится не более трех бракованных деталей:
P(x<3) = P(0) + P(1) + P(2) = 0,01111 + 0,04999 + 0,1125 = 0,1736

Пример №6 . Автоматическая телефонная станция получает в среднем за час N вызовов. Определить вероятность того, что за данную минуту она получит: а) ровно два вызова; б) более двух вызовов.
N = 18
Решение.
За одну минуту АТС в среднем получает λ = 18/60 мин. = 0,3
Считая, что случайное число X вызовов, поступивших на АТС за одну минуту,
подчиняется закону Пуассона, по формуле найдем искомую вероятность

Найдем ряд распределения X.
Здесь λ = 0.3
P(0) = e - λ = e -0.3 = 0.7408
P(1) = λe -λ = 0.3e -0.3 = 0.2222

Вероятность того, что за данную минуту она получит ровно два вызова:
P(2) = 0,03334
Вероятность того, что за данную минуту она получит более двух вызовов:
P(x>2) = 1 – 0,7408 – 0,2222 – 0,03334 = 0,00366

Пример №7 . Рассматриваются два элемента, работающих независимо друг от друга. Продолжительность времени безотказной работы имеет показательное распределение с параметром λ1 = 0,02 для первого элемента и λ2 = 0,05 для второго элемента. Найти вероятность того, что за 10 часов: а) оба элемента будут работать безотказно; б) только Вероятность того, что за 10 часов элемент №1 не выйдет из строя:
Рещение.
P 1 (0) = e -λ1*t = e -0.02*10 = 0,8187

Вероятность того, что за 10 часов элемент №2 не выйдет из строя:
P 2 (0) = e -λ2*t = e -0.05*10 = 0,6065

а) оба элемента будут работать безотказно;
P(2) = P 1 (0)*P 2 (0) = 0,8187*0,6065 = 0,4966
б) только один элемент выйдет из строя.
P(1) = P 1 (0)*(1-P 2 (0)) + (1-P 1 (0))*P 2 (0) = 0.8187*(1-0.6065) + (1-0.8187)*0.6065 = 0.4321

Пример №7 . Производство даёт 1% брака. Какова вероятность того, что из взятых на исследование 1100 изделий выбраковано будет не больше 17?
Примечание : поскольку здесь n*p =1100*0.01=11 > 10, то необходимо использовать