Viens no galvenajiem statistikas jēdzieniem ir vidējais vai aritmētiskais, skaitļu kopu. Vidējais ir datu kopas centrālā vērtība. The dispersijas datu kopas mērījumi nosaka, cik lielā mērā šī datu kopa ir sadalīta no vidējā. Datu kopām, kurās skaitļi ir tuvu vidējam līmenim, būs zema dispersija. Tiem komplektiem, kuros skaitļi ir daudz augstāki vai zemāki par vidējo, būs liela dispersija.
Aprēķiniet datu kopas vidējo vērtību
Aprēķināt atšķirības kvadrātu
Nākamais solis ir aprēķināt starpību starp katru datu kopas elementu un vidējo. Tā kā daži elementi būs augstāki par vidējo un daži būs zemāki, dispersijas aprēķins izmanto atšķirību kvadrātu.
1. diena - vidējais pārdošanas apjoms: $ 62,000 - $ 65414.29 = (- $ 3,414.29); (-3,414,29)2 = 11,657,346.94
2. diena - vidējais pārdošanas apjoms: $ 64,800 - $ 65414.29 = (- $ 614.29); (-614.29)2 = 377,346.94
3. diena - vidējais pārdošanas apjoms: $ 62,600 - $ 65414.29 = (- $ 2,814.29); (-2,814,29)2 = 7,920,204.08
4. diena Pārdošana - vidējais pārdošanas apjoms: $ 69,200 - $ 65414.29 = (+ $ 3,785.71); (+3,785,71)2 = 14,331,632.65
5. diena - vidējais pārdošanas apjoms: $ 66,000 - $ 65414.29 = (+ $ 585.71); (+585.71)2 = 343,061.22
6. diena Pārdošana - vidējais pārdošanas apjoms: $ 63,900 - $ 65414.29 = (- $ 1,514.29); (-1,514,29)2 = 2,293,061.22
7. diena Pārdošana - vidējais pārdošanas apjoms: $ 69,400 - $ 65414.29 = (+ $ 3,985.71); (+3,985,71)2 = 15,885,918.37
PIEZĪME: Kvadrātveida atšķirības netiek mērītas dolāros. Šie skaitļi tiek izmantoti nākamajā solī, lai aprēķinātu dispersiju.
Variancija un standarta novirze
Variansi tiek definēta kā kvadrātu atšķirību vidējā vērtība.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
Tā kā dispersija izmanto atšķirības kvadrātu, dispersijas kvadrātsakne sniegs skaidrāku norādi par faktisko izplatību. Statistikā dispersijas kvadrātsakni sauc par standarta novirze.
SQRT (7,544,081,63) = 2,746,65 ASV dolāri
Izmantojumi variācijām un standarta novirzēm
Gan dispersijas, gan standarta novirzes ir ļoti noderīgas statistikas analīzē. Dispersija mēra vidējo datu kopas izplatību. Standarta novirze palīdz noteikt izņēmumivai datu kopas elementi, kas ir pārāk tālu no vidējā.
Iepriekš sniegtajos datos dispersija ir diezgan augsta, un tikai divi ikdienas pārdošanas apjomi tiek sasniegti 1000 ASV dolāru robežās. Datu kopa arī parāda, ka divi no septiņiem ikdienas pārdošanas kopsummas ir vairāk nekā viena standarta novirze virs vidējā, bet divi citi ir vairāk nekā viena standarta novirze zem vidējā.