Како одредити тип дистрибуције вјероватноће за податке

Преглед садржаја:

Anonim

Када прикупите податке о вашем систему или процесу, следећи корак је да одредите коју врсту дистрибуције вероватноће имате. Врсте раздвајања вјероватноћа су: дискретна униформност, Бернули, биномна, негативна биномна, Поиссонова, геометријска, континуирана једнолична, нормална (звона звона), експоненцијална, гама и бета дистрибуција. Сужавање још неколико са листе могућности чини одређивање које је најближе Р квадрату много брже.

Ставке које су вам потребне

  • Грапхинг софтваре

  • Средства за израчунавање Р квадратне вредности (најбоља анализа)

Исцртајте податке за визуелни приказ типа података.

Један од првих корака у одређивању дистрибуције података - а тиме и типа једнаџбе за моделирање података - је да се искључи оно што не може бити. • Ако постоје било какви пикови у скупу података, то не може бити дискретна равномјерна дистрибуција. • Ако подаци имају више од једног врха, то није Поиссон или бином. • Ако има једну кривуљу, нема секундарних врхова и има спор нагиб на свакој страни, то може бити Поиссон или гама дистрибуција. Али то не може бити дискретна равномерна дистрибуција. • Ако су подаци равномерно распоређени, а то је без искривљења према једној страни, сигурно је искључити гама или Веибулл дистрибуцију. • Ако функција има равномерну дистрибуцију или врх у средини графички приказаних резултата, то није геометријска дистрибуција или експоненцијална дистрибуција. • Ако се појава фактора разликује у зависности од варијабле животне средине, то вероватно није Поиссонова дистрибуција.

Након што се тип дистрибуције вероватноће сузио, урадите Р квадратну анализу сваког могућег типа дистрибуције вероватноће. Онај са највишом Р квадратном вредношћу је вероватно исправан.

Уклоните једну тачку података. Затим поново израчунајте Р на квадрат. Ако се исти тип дистрибуције вероватноће појави као најближа подударност, онда постоји велико уверење да је ово исправна дистрибуција вероватноће за скуп података.

Савети

  • Ако подаци показују вишеструке ширине, могуће је да се одвијају два одвојена процеса или се узорак производа мијеша. Запамтите податке и затим их поново анализирајте.

Упозорење

Проверите да ли су једнаџбе генерисане у односу на касније скупове података да бисте потврдили да је она још увек тачна за скуп података. Могуће је да су фактори окружења и процесни помаци учинили нетачне садашње једначине и моделе.