Kā noteikt datu izplatīšanas varbūtības veidu

Satura rādītājs:

Anonim

Kad esat savācis datus par savu sistēmu vai procesu, nākamais solis ir noteikt, kāda veida varbūtības sadalījums ir. Varbūtības sadalījumu veidi ir: diskrēta vienādojums, Bernulli, binomiskais, negatīvais binomiskais, Poisson, ģeometriskais, nepārtraukts vienveidīgs, normāls (zvanu līkne), eksponenciālais, gammas un beta sadalījums. Dažu iespēju sašaurināšana no iespēju saraksta ļauj noteikt, kas ir tuvākā R kvadrāta vērtība daudz ātrāk.

Preces, kas jums būs nepieciešamas

  • Grafikas programmatūra

  • R kvadrāta vērtības aprēķināšanas līdzekļi (vislabāk piemērota analīze)

Uzzīmējiet datus, lai vizuāli attēlotu datu tipu.

Viens no pirmajiem soļiem, lai noteiktu, kāda datu izplatīšana ir - un līdz ar to vienādojuma veids, ko izmanto datu modelēšanai - ir izslēgt to, ko tā nevar būt. • Ja datu kopā ir kādas virsotnes, tas nevar būt diskrēts vienots sadalījums. • Ja datiem ir vairāk nekā viens maksimums, tas nav Poisson vai binomiāls. • Ja tai ir viena līkne, nav sekundāru pīķu, un abās pusēs ir lēns slīpums, tas var būt Poisson vai gamma sadalījums. Bet tas nevar būt diskrēta vienota izplatīšana. • Ja dati ir vienmērīgi sadalīti, un tas nav vērsts pret vienu pusi, ir droši izslēgt gamma vai Weibull sadalījumu. • Ja funkcijai ir vienmērīgs sadalījums vai maksimums grafisko rezultātu vidū, tas nav ģeometriskais sadalījums vai eksponenciālais sadalījums. • Ja faktora rašanās mainās atkarībā no vides mainīgā, tas, iespējams, nav Poisson sadalījums.

Pēc varbūtības sadalījuma veida samazināšanas veiciet katra iespējamā varbūtības sadalījuma veida R kvadrāta analīzi. Tas, kuram ir vislielākā R kvadrāta vērtība, visticamāk ir pareiza.

Novērsiet vienu izejošo datu punktu. Tad pārrēķiniet R kvadrātā. Ja tas pats varbūtības sadalījuma veids parādās kā tuvākā atbilstība, tad ir liela pārliecība, ka tas ir pareizais varbūtības sadalījums, ko izmanto datu kopai.

Padomi

  • Ja dati uzrāda vairākus virsotnes, tad ir iespējams, ka notiek divi atsevišķi procesi vai ja paraugs tiek sajaukts. Atcerieties datus un pēc tam atkārtoti analizējiet.

Brīdinājums

Apstipriniet vienādojumus, kas izveidoti pret vēlākiem datu kopumiem, lai apstiprinātu, ka tas joprojām ir precīzs datu kopai. Iespējams, ka vides faktori un procesu novirze ir padarījuši pašreizējos vienādojumus un modeļus nepareizi.