Користувач:Yura Kuch/Біноміальний розподіл Пуассона: відмінності між версіями

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Вилучено вміст Додано вміст
Створено шляхом перекладу сторінки «Poisson binomial distribution»
(Немає відмінностей)

Версія за 19:27, 22 лютого 2024

Біноміальний розподіл Пуассона
Параметри — ймовірності успіху для кожного з n випробувань
Носій функціїk ∈ { 0, …, n }
Розподіл імовірностей
Функція розподілу ймовірностей (cdf)
Середнє
Медіана{{{median}}}
Мода{{{mode}}}
Дисперсія
Коефіцієнт асиметрії
Коефіцієнт ексцесу
Ентропія{{{entropy}}}
Твірна функція моментів (mgf)
Характеристична функція{{{char}}}

У теорії ймовірностей та статистиці розподіл Пуассона-біноміальний є дискретним ймовірнісним розподілом суми незалежних випробувань Бернуллі, які не обов'язково мають однаковий розподіл. Концепція отримала назву на честь Сімеона Дені Пуассона.

Інакше кажучи, це ймовірнісний розподіл кількості успіхів у колекції з n незалежних експериментів з можливими відповідями "так" або "ні" та імовірностями успіху . Звичайний біноміальний розподіл є спеціальним випадком розподілу Пуассона-біноміального, коли всі ймовірності успіху однакові, тобто .

Визначення

Функція ймовірностей

Імовірність k успішних випробувань із загальної кількості n можна записати у вигляді суми [1]

де множина всіх підмножин з k ∈ , що вибрані з колекції . До прикладу, якщо n = 3, тоді . є доповненням до , тобто .

Множина міститиме елементів. Цю суму не можливо обчислитина практиці, якщо кількість випробувань n мала (наприклад, якщо n = 30, містить понад 1020 елементів). Однак існують інші, більш ефективні способи обчислення .

Поки жодна з ймовірностей успіху дорівнюватиме одиниці, обчислити ймовірність k успіхів можливо за рекурсивною формулою [2] [3]

де

Рекурсивна формула не є чисельно стійкою, тому, якщо кількість випробувань перевищувати 20 їй треба шукати заміну. Альтернативою може стати використання алгоритму «розділяй і володарюй»: якщо ми припустимо, що є степенем двійки, тоді позначивши через біном Пуассона , а оператор згортки через , маємо наступне: .

Іншою можливістю є використання дискретного перетворення Фур'є . [4]

де і .

Існують й інші методи обчислення ймовірностей описані в «Статистичних застосуваннях біноміального Пуассона та умовного розподілу Бернуллі» Чена та Лю. [5]

Кумулятивна функція розподілу

Кумулятивну функцію розподілу (CDF) можна виразити як:

,

де множина всіх підмножин розміру 𝑙, які можна вибрати з колекції .

Властивості

Середнє значення та дисперсія

Оскільки змінна, що розподілена за законом Пуассона-біноміального розподілу, є сумою n незалежних змінних, що розподілені за законом Бернуллі, її середнє значення та дисперсія будуть просто сумою середнього значення та дисперсії цих n розподілених змінних Бернуллі:

Для фіксованого середнього ( ) та розміру ( n ), дисперсія максимальна, коли всі ймовірності успіху однакові (біноміальний розподіл). Коли середнє значення фіксоване, дисперсія обмежена зверху дисперсією розподілу Пуассона з тим самим середнім значенням, яке досягається асимптотично при наближенні n до нескінченності.

Нерівність Чернова

Ймовірність того, що розподіл Пуассона-біноміальний стає великим, може бути обмежена за допомогою його функції згортки моментів наступним чином (дійсна, коли і для будь-якого ):

де . Подібно до хвостових меж біноміального розподілу .

Обчислювальні методи

За посиланням [6] наведене обговорення методу оцінки функції маси ймовірності біноміального розподілу Пуассона. На ньому базуються наступні програмні реалізації:

  • Пакет R poibin був наданий разом із документом [6], який доступний для обчислення cdf, pmf, квантильної функції та генерації випадкових чисел біноміального розподілу Пуассона. Для обчислення PMF можна вказати алгоритм DFT або рекурсивний алгоритм для обчислення точного PMF, а також можна вказати методи апроксимації з використанням нормального розподілу та розподілу Пуассона.
  • poibin — реалізація Python — може обчислювати PMF і CDF, для цього використовує метод DFT, описаний у статті.

Дивись також

  • Теорема Ле Кама

Список літератури

  1. Wang, Y. H. (1993). On the number of successes in independent trials (PDF). Statistica Sinica. 3 (2): 295—312.
  2. Shah, B. K. (1994). On the distribution of the sum of independent integer valued random variables. American Statistician. 27 (3): 123—124. JSTOR 2683639.
  3. Chen, X. H.; A. P. Dempster; J. S. Liu (1994). Weighted finite population sampling to maximize entropy (PDF). Biometrika. 81 (3): 457. doi:10.1093/biomet/81.3.457.
  4. Fernandez, M.; S. Williams (2010). Closed-Form Expression for the Poisson-Binomial Probability Density Function. IEEE Transactions on Aerospace and Electronic Systems. 46 (2): 803—817. Bibcode:2010ITAES..46..803F. doi:10.1109/TAES.2010.5461658.
  5. Chen, S. X.; J. S. Liu (1997). Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions. Statistica Sinica. 7: 875—892.
  6. а б Hong, Yili (March 2013). On computing the distribution function for the Poisson binomial distribution. Computational Statistics & Data Analysis. 59: 41—51. doi:10.1016/j.csda.2012.10.006. Помилка цитування: Некоректний тег <ref>; назва «hong2013» визначена кілька разів з різним вмістом

[[Категорія:Факторіали і біноміальні коефіцієнти]] [[Категорія:Дискретні розподіли]]