Користувач:Yura Kuch/Біноміальний розподіл Пуассона: відмінності між версіями
Створено шляхом перекладу сторінки «Poisson binomial distribution» Мітки: перше редагування Переклад вмісту Переклад вмісту 2 |
(Немає відмінностей)
|
Версія за 19:27, 22 лютого 2024
Біноміальний розподіл Пуассона | |
---|---|
Параметри | — ймовірності успіху для кожного з n випробувань |
Носій функції | k ∈ { 0, …, n } |
Розподіл імовірностей | |
Функція розподілу ймовірностей (cdf) | |
Середнє | |
Медіана | {{{median}}} |
Мода | {{{mode}}} |
Дисперсія | |
Коефіцієнт асиметрії | |
Коефіцієнт ексцесу | |
Ентропія | {{{entropy}}} |
Твірна функція моментів (mgf) | |
Характеристична функція | {{{char}}} |
У теорії ймовірностей та статистиці розподіл Пуассона-біноміальний є дискретним ймовірнісним розподілом суми незалежних випробувань Бернуллі, які не обов'язково мають однаковий розподіл. Концепція отримала назву на честь Сімеона Дені Пуассона.
Інакше кажучи, це ймовірнісний розподіл кількості успіхів у колекції з n незалежних експериментів з можливими відповідями "так" або "ні" та імовірностями успіху . Звичайний біноміальний розподіл є спеціальним випадком розподілу Пуассона-біноміального, коли всі ймовірності успіху однакові, тобто .
Визначення
Функція ймовірностей
Імовірність k успішних випробувань із загальної кількості n можна записати у вигляді суми [1]
де множина всіх підмножин з k ∈ , що вибрані з колекції . До прикладу, якщо n = 3, тоді . є доповненням до , тобто .
Множина міститиме елементів. Цю суму не можливо обчислитина практиці, якщо кількість випробувань n мала (наприклад, якщо n = 30, містить понад 1020 елементів). Однак існують інші, більш ефективні способи обчислення .
Поки жодна з ймовірностей успіху дорівнюватиме одиниці, обчислити ймовірність k успіхів можливо за рекурсивною формулою [2] [3]
де
Рекурсивна формула не є чисельно стійкою, тому, якщо кількість випробувань перевищувати 20 їй треба шукати заміну. Альтернативою може стати використання алгоритму «розділяй і володарюй»: якщо ми припустимо, що є степенем двійки, тоді позначивши через біном Пуассона , а оператор згортки через , маємо наступне: .
Іншою можливістю є використання дискретного перетворення Фур'є . [4]
де і .
Існують й інші методи обчислення ймовірностей описані в «Статистичних застосуваннях біноміального Пуассона та умовного розподілу Бернуллі» Чена та Лю. [5]
Кумулятивна функція розподілу
Кумулятивну функцію розподілу (CDF) можна виразити як:
,
де множина всіх підмножин розміру 𝑙, які можна вибрати з колекції .
Властивості
Середнє значення та дисперсія
Оскільки змінна, що розподілена за законом Пуассона-біноміального розподілу, є сумою n незалежних змінних, що розподілені за законом Бернуллі, її середнє значення та дисперсія будуть просто сумою середнього значення та дисперсії цих n розподілених змінних Бернуллі:
Для фіксованого середнього ( ) та розміру ( n ), дисперсія максимальна, коли всі ймовірності успіху однакові (біноміальний розподіл). Коли середнє значення фіксоване, дисперсія обмежена зверху дисперсією розподілу Пуассона з тим самим середнім значенням, яке досягається асимптотично при наближенні n до нескінченності.
Нерівність Чернова
Ймовірність того, що розподіл Пуассона-біноміальний стає великим, може бути обмежена за допомогою його функції згортки моментів наступним чином (дійсна, коли і для будь-якого ):
де . Подібно до хвостових меж біноміального розподілу .
Обчислювальні методи
За посиланням [6] наведене обговорення методу оцінки функції маси ймовірності біноміального розподілу Пуассона. На ньому базуються наступні програмні реалізації:
- Пакет R poibin був наданий разом із документом [6], який доступний для обчислення cdf, pmf, квантильної функції та генерації випадкових чисел біноміального розподілу Пуассона. Для обчислення PMF можна вказати алгоритм DFT або рекурсивний алгоритм для обчислення точного PMF, а також можна вказати методи апроксимації з використанням нормального розподілу та розподілу Пуассона.
- poibin — реалізація Python — може обчислювати PMF і CDF, для цього використовує метод DFT, описаний у статті.
Дивись також
- Теорема Ле Кама
Список літератури
- ↑ Wang, Y. H. (1993). On the number of successes in independent trials (PDF). Statistica Sinica. 3 (2): 295—312.
- ↑ Shah, B. K. (1994). On the distribution of the sum of independent integer valued random variables. American Statistician. 27 (3): 123—124. JSTOR 2683639.
- ↑ Chen, X. H.; A. P. Dempster; J. S. Liu (1994). Weighted finite population sampling to maximize entropy (PDF). Biometrika. 81 (3): 457. doi:10.1093/biomet/81.3.457.
- ↑ Fernandez, M.; S. Williams (2010). Closed-Form Expression for the Poisson-Binomial Probability Density Function. IEEE Transactions on Aerospace and Electronic Systems. 46 (2): 803—817. Bibcode:2010ITAES..46..803F. doi:10.1109/TAES.2010.5461658.
- ↑ Chen, S. X.; J. S. Liu (1997). Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions. Statistica Sinica. 7: 875—892.
- ↑ а б
Hong, Yili (March 2013). On computing the distribution function for the Poisson binomial distribution. Computational Statistics & Data Analysis. 59: 41—51. doi:10.1016/j.csda.2012.10.006.
Помилка цитування: Некоректний тег
<ref>
; назва «hong2013» визначена кілька разів з різним вмістом
[[Категорія:Факторіали і біноміальні коефіцієнти]] [[Категорія:Дискретні розподіли]]