Како израчунати варијансу у статистици

Преглед садржаја:

Anonim

Један од најосновнијих појмова у статистици је просек, или аритметичко значење, броја бројева. Средња вредност означава централну вредност за скуп података. Тхе варијанца сета података мери колико су елементи тог скупа података раширени од средине. Скупови података у којима су сви бројеви блиски средњим вредностима ће имати ниску варијанцу. Они скупови у којима су бројеви много већи или нижи од средњег ће имати велику варијанцу.

Израчунајте средњу вредност скупа података

Цалцулате Скуаред Дифференцес

Следећи корак укључује израчунавање разлике између сваког елемента у скупу података и средњег. Пошто ће неки елементи бити већи од средње вредности, а неки ће бити нижи, израчунавање варијанце користи квадрат разлика.

Дан 1 Продаја - Средња продаја: $ 62,000 - $ 65414.29 = (- $ 3,414.29); (-3,414.29)2 = 11,657,346.94

Дан 2 Продаја - Средња продаја: $ 64,800- $ 65414.29 = (- $ 614.29); (-614,29)2 = 377,346.94

Дан 3 Продаја - Средња продаја: $ 62,600 - $ 65414.29 = (- $ 2,814.29); (-2,814.29)2 = 7,920,204.08

Дан 4. Продаја - Средња продаја: $ 69,200 - $ 65414.29 = (+ $ 3,785.71); (+3,785.71)2 = 14,331,632.65

Дан 5 Продаја - Средња продаја: $ 66,000 - $ 65414.29 = (+ $ 585.71); (+585.71)2 = 343,061.22

Дан 6 Продаја - Средња продаја: $ 63,900 - $ 65414.29 = (- $ 1,514.29); (-1,514.29)2 = 2,293,061.22

Дан 7 Продаја - Средња продаја: $ 69,400 - $ 65414.29 = (+ $ 3,985.71); (+3,985.71)2 = 15,885,918.37

БЕЛЕШКА: Квадратне разлике се не мере у доларима. Ови бројеви се користе у следећем кораку за израчунавање варијанце.

Варијанца и стандардна девијација

Варијанца је дефинисана као средња вредност квадрата разлика.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Пошто варијанса користи квадрат разлике, квадратни корен варијансе ће дати јаснију индикацију стварног ширења. У статистици, квадратни корен варијансе се назива стандардна девијација.

СКРТ (7,544,081.63) = 2,746.65 $

Користи за одступање и стандардно одступање

И варијанце и стандардна девијација су веома корисне у статистичкој анализи. Варијација мери укупно ширење скупа података из средње вредности. Стандардна девијација помаже у откривању оутлиерс, или елементе скупа података који су превише удаљени од средње вредности.

У горе наведеном скупу података варијација је прилично висока, са само два дневна укупна износа продаје који се крећу у оквиру 1.000 долара средње вредности. Скуп података такође показује да су два од седам дневних укупних продајних износа више од једне стандардне девијације изнад средње вредности, док су друга два више од једне стандардне девијације испод средње вредности.