У статистичкој анализи варијанца међу члановима скупа података показује колико су удаљене тачке података од линије тренда, такође познате као а регресиона линија. Што је већа варијација, то су тачке података шире. Проучавање анализе варијанце показује који се делови варијансе могу објаснити карактеристикама података, а који се могу приписати случајним факторима. Дио варијанце који се не може објаснити назива се резидуална варијанца.
Коришћење Екцел табела за израчунавање резидуалне варијансе
Формула за израчунавање резидуалне варијансе укључује бројне сложене прорачуне. За мале скупове података, процес израчунавања резидуалне варијансе ручно може бити заморан. За велике скупове података, задатак може бити исцрпљујући. Користећи Екцел табелу, потребно је само да унесете тачке података и изаберете исправну формулу. Програм обрађује сложене прорачуне и даје резултат брзо.
Подаци указују
Отворите нову Екцел табелу и унесите тачке података у две колоне. Линије регресије захтијевају да свака точка података има два елемента. Статистички људи типично означавају ове елементе "Кс" и "И". На пример, Генериц Инсуранце Цо. жели да пронађе резидуалне разлике у висини и тежини својих запослених. Кс варијабла представља висину, а И варијабла представља тежину. Упишите висину у колону А и тежине у колону Б.
Финдинг тхе Меан
Тхе значити представља просјек за сваки елемент у скупу података. У овом примеру, Генериц осигурање жели да пронађе просек, стандардну девијацију и коваријансу од 10 висина и тежина запослених. Просек висине наведених у колони А може се наћи уносом функције "= АВЕРАГЕ (А1: А10)" у ћелију Ф1. Просек тежина наведених у колони Б може се наћи уносом функције "= АВЕРАГЕ (Б1: Б10)" у ћелију Ф3.
Проналажење стандардне девијације и коваријанце
Тхе стандардна девијација мери колико су удаљене тачке података раширене од средње вредности. Тхе коваријанца мјери колико се два елемента точке података мијењају заједно. Стандардна девијација висина се проналази уносом функције "= СТДЕВ (А1: А10)" у ћелију Ф2. Стандардна девијација утега налази се уносом функције "= СТДЕВ (Б1: Б10)" у ћелију Ф4. Коваријанца између висина и тежина се проналази уносом функције "= ЦОВАР (А1: А10; Б1: Б10)" у ћелију Ф5.
Проналажење линије регресије
Тхе регресиона линија представља линеарну функцију која прати тренд података. Формула за регресиону линију изгледа овако: И = аКс + б.
Корисник може пронаћи вриједности за "а" и "б" користећи израчуне за средства, стандардне девијације и коваријанце. Вредност за "б" представља тачку где регресиона линија пресреће И-осу. Вредност се може наћи тако што ћемо узети коваријансу и поделити је на квадрат стандардне девијације Кс-вредности. Екцелова формула иде у ћелију Ф6 и изгледа овако: = Ф5 / Ф2 ^ 2.
Вредност за "а" представља нагиб линије регресије. Екцелова формула иде у ћелију Ф7 и изгледа овако: = Ф3-Ф6 * Ф1.
Да бисте видели формулу за регресиону линију, унесите ово повезивање низа у ћелију Ф8:
= ЦОНЦАТЕНАТЕ ("И ="; РОУНД (Ф6; 2); "Кс"; ИФ (СИГН (Ф7) = 1; "+"; "-"); АБС (РОУНД (Ф7; 2)))
Израчунајте И вредности
Следећи корак укључује израчунавање И-вредности на линији регресије за дате Кс-вредности у скупу података. Формула за проналажење И вредности иде у колону Ц и изгледа овако:
= $ Ф $ 6 * А (и) + $ Ф $ 7
Где је А (и) вредност за колону А у реду (и). Формуле изгледају овако у табели:
= $ Ф $ 6 * А1 + $ Ф $ 7
= $ Ф $ 6 * А2 + $ Ф $ 7
= $ Ф $ 6 * А3 + $ Ф $ 7, и тако даље
Уноси у колони Д показују разлике између очекиваних и стварних вредности за И. Формуле изгледају овако:
= Б (и) -Ц (и), Где су Б (и) и Ц (и) вредности у реду (и) у колонама Б и Ц, респективно.
Проналажење резидуалне варијанце
Тхе формула за резидуалну варијанцу прелази у ћелију Ф9 и изгледа овако:
= СУМСК (Д1: Д10) / (ЦОУНТ (Д1: Д10) -2)
Где је СУМСК (Д1: Д10) сума квадрата разлика између стварних и очекиваних И вредности, и (ЦОУНТ (Д1: Д10) -2) је број тачака података, минус 2 за степене слободе у података.