Statistiskajā analīzē dispersijas datu kopas dalībnieku vidū parāda, cik tālu no datu punktiem atrodas tendenču līnija, kas pazīstama arī kā a regresijas līnija. Jo lielāks dispersijas variants, jo plašāks datu punktu skaits. Dispersijas analīzes pētījums parāda, kuras dispersijas daļas var izskaidrot ar datu īpašībām un kuras var attiecināt uz nejaušiem faktoriem. To dispersijas daļu, ko nevar izskaidrot, sauc par atlikušo dispersiju.
Izmantojot Excel izklājlapas, lai aprēķinātu atlikušo variantu
Atlikuma dispersijas aprēķināšanas formula ietver daudzus sarežģītus aprēķinus. Mazu datu kopu gadījumā atlikušās dispersijas aprēķināšanas process ar rokām var būt garlaicīgs. Lieliem datu kopumiem uzdevums var būt nogurdinošs. Izmantojot Excel izklājlapu, nepieciešams ievadīt tikai datu punktus un izvēlēties pareizo formulu. Programma rīkojas ar sarežģītiem aprēķiniem un ātri nodrošina rezultātu.
Datu punkti
Atveriet jaunu Excel izklājlapu un ievadiet datu punktus divās kolonnās. Regresijas līnijas prasa, lai katram datu punktam būtu divi elementi. Statististi parasti iezīmē šos elementus "X" un "Y". Piemēram, Generic Insurance Co. vēlas atrast savu darbinieku augstuma un svara atlikušo dispersiju. X mainīgais attēlo augstumu un Y mainīgais ir svars. Ievadiet augstumus A slejā un svarus - B slejā.
Mean noteikšana
The nozīmē ir katras datu kopas vidējais lielums. Šajā piemērā Generic Insurance vēlas atrast vidējo, standarta novirzi un kovariāciju par 10 darbinieku augstumiem un svariem. A slejā uzskaitīto augstumu vidējo vērtību var atrast, ievadot funkciju "= AVERAGE (A1: A10)" šūnā F1. B slejā uzskaitīto svaru vidējo lielumu var atrast, ievadot funkciju "= AVERAGE (B1: B10)" šūnā F3.
Standarta novirzes un kovariācijas atrašana
The standarta novirze nosaka, cik lielā mērā datu punkti ir nošķirti no vidējā. The kovariācija novērtē, cik lielā mērā divi datu punkta elementi mainās kopā. Augstumu standarta novirze tiek konstatēta, ievadot funkciju "= STDEV (A1: A10)" šūnā F2. Svaru standarta novirze tiek konstatēta, ievadot funkciju "= STDEV (B1: B10)" šūnā F4. Kovarāciju starp augstumiem un svariem konstatē, ievadot funkciju "= COVAR (A1: A10; B1: B10)" šūnā F5.
Regresijas līnijas atrašana
The regresijas līnija ir lineāra funkcija, kas seko datu punktu tendencei. Regresijas līnijas formula izskatās šādi: Y = aX + b.
Lietotājs var atrast "a" un "b" vērtības, izmantojot aprēķinus par līdzekļiem, standarta novirzēm un kovariāciju. "B" vērtība ir punkts, kur regresijas līnija pārtver Y-asi. Vērtību var atrast, izmantojot kovariāciju un dalot to ar X-vērtību standarta novirzes kvadrātu. Excel formula iet uz šūnu F6 un izskatās šādi: = F5 / F2 ^ 2.
"A" vērtība ir regresijas līnijas slīpums. Excel formula iet uz šūnu F7 un izskatās šādi: = F3-F6 * F1.
Lai redzētu regresijas līnijas formulu, ievadiet šo virknes sametināšanu šūnā F8:
= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (SIGN (F7) = 1; "+"; "-"); ABS (ROUND (F7; 2)))
Aprēķināt Y vērtības
Nākamais solis ietver Y-vērtību aprēķināšanu regresijas rindā dotā datu kopas dotajām X vērtībām. Formula, lai atrastu Y vērtības, nonāk C slejā un izskatās šādi:
= $ F $ 6 * A (i) + $ F $ 7
Ja A (i) ir A slejas vērtība rindā (i). Formulas izskatās izklājlapā šādi:
= $ F $ 6 * A1 + $ F $ 7
= $ F $ 6 * A2 + $ F $ 7
= $ F $ 6 * A3 + $ F $ 7, un tā tālāk
D slejas ieraksti parāda atšķirības starp Y paredzamajām un faktiskajām vērtībām. Formulas izskatās šādi:
= B (i) -C (i), Ja B (i) un C (i) ir attiecīgi B un C slejas (i) rindas vērtības.
Atlikušās dispersijas atrašana
The atlikuma dispersijas formula iet F9 šūnā un izskatās šādi:
= SUMSQ (D1: D10) / (COUNT (D1: D10) -2)
Ja SUMSQ (D1: D10) ir atšķirību starp faktisko un sagaidāmo Y vērtību kvadrātu summa, un (COUNT (D1: D10) -2) ir datu punktu skaits, mīnus 2 brīvības pakāpēm. datus.