Przeglądaj wersję html pliku:

ciaga 2


Porównanie kształtów histogramów

Najprostszym sposobem oceny zgodności rozkładu obserwacji próby z
rozk. hipotet. jest wizualne porównanie histogramu częstości z funk.
Gęstości lub hist. skumulowanej częstości z dystrybuantą.
Porównanie wizualne pozwala na natychmiastowe oszacowanie bliskości
rozkładu danych zaobserwowanych z rozkładem hipotetycznym oraz
dostarcza cennych inf. o obszarach niezgodności.

Porównanie hist. częst. z fun. gęstości

Z powodu konieczności grupowania danych w klasach, potrzebnych dla
zbudow. hist, najczęściej istotne cechy prawdziwych końców rozkładu
nie są przedst. na wykresie i ulegają zatraceniu. Wybór węższych
przedziałów klasowych zwiększa czytelność wykresów, ale mniejsza
licz.oserwacji w klasach powoduje większe zmiany w wys.słupków.
Mając dany rzeczywisty rozkład zmiennej losowej i zbiór przedziałów
klasowych, obserwowane częstości w przedziałach klas.są zmiennymi
losowymi, wprost proporcjonal.do liczby obserwacji z próby należących
do tych przezdiałów. Liczby te są zmiennymi losowymi o łącznym
rozkładzie wielomianowym. Dla ustalonej liczby klas k, wzrost
liczebności n próby może uczynić zgodność histogr.częstości z
funkcją gęstości niemal pewną. Porównując kształt
hist.częst.danych z funkcją gęstości rozkł.hipopet.należy tak
wybrać liczbę klas histogramu aby wypośrodkować między większą
niejednoznaczn.a większą zmiennością.

Porównanie hist.skumulo.częst z dystryb

Porównanie kształtu hist.skumulowanej częstości z dystrybuantą ma
wyraźną przewagę nad porównaniem histogr.częst.z funkcją
gęstości. W tym przypadku znacznie zmniejsza się niejednoznaczność
i zmienność hist.związana z koniecznością grupowania danych.
Należy jednak pamiętać, że można oczekiwać zmienności
hist.skumul.częst.w stosunku do dystrybuanty nawet wtedy gdy dane mają
rozkład określony tą dystryb.oraz, że inne prawo probabilistyczne
może rządzić generowaniem danych nawet jeśli wydają się one zgodne
z proponowanym rozkład.

Test chi-kwadrat (χ2)zgodności



Porównując liczebności zaobserwowane z teoret otrzymuje się
statystykę testową



Statystyka ta posiada asymptotycznie (tzn. dla n→∞) rozkład χ2 z
liczbą stopni swobody k-1. W praktyce przyjmuje się, że jeśli
parametry rozkładu ocenia się na podstawie próby, to liczeb.próby
powinna wynosić co najmniej100, a liczba klas od10-25.Dla rozkładu
normaln., gdy parametry rozkładu są znane, liczba klas może być
zmniejszona, ale powinna wynosić od 5-10. Następnie wybiera się
poziom istotności α oblicza wartość statystyki i porównuje ją z
wartością krytyczną χ2α, k-r-l dla k-r-1 stopni swobody. Jeżeli
zachodzi nierówność χ2> χ2α, k-r-l to hipotezę zerową należy
odrzucić. W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy
zerowej.

Test zgodności Kołmogorowa

Przyjmuje się, że zmienna losowa X typu ciągłego ma rozkład
określony dystrybuantą F(x). Pobraną próbę porządkuje się w
ciągu niemalejącym i wyznacza dystrybuantę empiryczną Fn(x).
Statystyka testowa testu jest:



Statystyka ta przy prawdziwości hipotezy zerowej ma rozkład
Kołmogorowa, którego jednym parametrem jest liczebność próby.
Przyjmując wartość poziomu istotności α z tablic wartości
krytycznych rozkł.Kołm.odczytuje się wartość kryt. Dα,n. Jeżeli
Dn> Dα,n, to hipot.zer.odrzuca się na poziomie istotności α. Może
być on stosowany dla prób o małej liczebności (dla n>5), ale tylko
wtedy gdy hipotetyczny rozkład jest przyjmowany całkowicie
niezależnie od danych, tzn. nie zachodzi konieczność szacowania
parametrów rozkładu na podstawie próbki. W przypadku gdy wartości
parametrów rozkładu hipotetycznego są estymowane z próby.
Liczebność próbki powinna wynosić co najmniej 100 i wówczas można
stosować test graficzny λ-Kołmogorowa.

Test normalności Lillieforsa

Test ten służy do weryfikacji hipot.zer.że zmienna losowa X ma
rozkład normalny N(μ,σ). Jeżeli parametry tego rozkładu są znane,
to weryfikacji hip.zer.można stosować opisany wcześniej test
Kołmogorowa. Jeśli zaś parametry te nie są znane to należy
stosować zmodyfikowany test Koł.znany pod nazwą testu Lillieforsa.
Statystyka tego testu jest taka sama jak testu Koł., z tym, że do
wyznaczenia hipotetycznej dystrybuanty F(x) wykożystuje się oceny x i
s2 nieznanych parametrów roz.normal. Otrzymaną wart.satyst.testowej Dn
porównuje się ze zmodyfikowanymi wartościami krytyczn.testu Koł.

Test normalności Shapiro-Wilka

Drugim testem do weryfikacji hip.o normalności roz.zmiennej losowej w
przypadku gdy nie znane są parametry roz.hipotet. jest test S-W.
Pobraną próbę należy uporządkować niemalejąco i obliczyć
stat.testową

gdzie ai,n są specjalnymi współczyn oraz

W zależności od przyjętego poziomu istotności α i liczności
próbki n należy odczytać z tablic wart.kryt.testu S-W wart.kryt.
Wα,n. Jeżeli W< Wα,n to hipotezę o normalności rozkładu zmiennej
losowej X należy odrzucić.

Porównanie kształtów histogramów

Najprostszym sposobem oceny zgodności rozkładu obserwacji próby z
rozk. hipotet. jest wizualne porównanie histogramu częstości z funk.
Gęstości lub hist. skumulowanej częstości z dystrybuantą.
Porównanie wizualne pozwala na natychmiastowe oszacowanie bliskości
rozkładu danych zaobserwowanych z rozkładem hipotetycznym oraz
dostarcza cennych inf. o obszarach niezgodności.

Porównanie hist. częst. z fun. gęstości

Z powodu konieczności grupowania danych w klasach, potrzebnych dla
zbudow. hist, najczęściej istotne cechy prawdziwych końców rozkładu
nie są przedst. na wykresie i ulegają zatraceniu. Wybór węższych
przedziałów klasowych zwiększa czytelność wykresów, ale mniejsza
licz.oserwacji w klasach powoduje większe zmiany w wys.słupków.
Mając dany rzeczywisty rozkład zmiennej losowej i zbiór przedziałów
klasowych, obserwowane częstości w przedziałach klas.są zmiennymi
losowymi, wprost proporcjonal.do liczby obserwacji z próby należących
do tych przezdiałów. Liczby te są zmiennymi losowymi o łącznym
rozkładzie wielomianowym. Dla ustalonej liczby klas k, wzrost
liczebności n próby może uczynić zgodność histogr.częstości z
funkcją gęstości niemal pewną. Porównując kształt
hist.częst.danych z funkcją gęstości rozkł.hipopet.należy tak
wybrać liczbę klas histogramu aby wypośrodkować między większą
niejednoznaczn.a większą zmiennością.

Porównanie hist.skumulo.częst z dystryb

Porównanie kształtu hist.skumulowanej częstości z dystrybuantą ma
wyraźną przewagę nad porównaniem histogr.częst.z funkcją
gęstości. W tym przypadku znacznie zmniejsza się niejednoznaczność
i zmienność hist.związana z koniecznością grupowania danych.
Należy jednak pamiętać, że można oczekiwać zmienności
hist.skumul.częst.w stosunku do dystrybuanty nawet wtedy gdy dane mają
rozkład określony tą dystryb.oraz, że inne prawo probabilistyczne
może rządzić generowaniem danych nawet jeśli wydają się one zgodne
z proponowanym rozkład.

Test chi-kwadrat (χ2)zgodności



Porównując liczebności zaobserwowane z teoret otrzymuje się
statystykę testową



Statystyka ta posiada asymptotycznie (tzn. dla n→∞) rozkład χ2 z
liczbą stopni swobody k-1. W praktyce przyjmuje się, że jeśli
parametry rozkładu ocenia się na podstawie próby, to liczeb.próby
powinna wynosić co najmniej100, a liczba klas od10-25.Dla rozkładu
normaln., gdy parametry rozkładu są znane, liczba klas może być
zmniejszona, ale powinna wynosić od 5-10. Następnie wybiera się
poziom istotności α oblicza wartość statystyki i porównuje ją z
wartością krytyczną χ2α, k-r-l dla k-r-1 stopni swobody. Jeżeli
zachodzi nierówność χ2> χ2α, k-r-l to hipotezę zerową należy
odrzucić. W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy
zerowej.

Test zgodności Kołmogorowa

Przyjmuje się, że zmienna losowa X typu ciągłego ma rozkład
określony dystrybuantą F(x). Pobraną próbę porządkuje się w
ciągu niemalejącym i wyznacza dystrybuantę empiryczną Fn(x).
Statystyka testowa testu jest:



Statystyka ta przy prawdziwości hipotezy zerowej ma rozkład
Kołmogorowa, którego jednym parametrem jest liczebność próby.
Przyjmując wartość poziomu istotności α z tablic wartości
krytycznych rozkł.Kołm.odczytuje się wartość kryt. Dα,n. Jeżeli
Dn> Dα,n, to hipot.zer.odrzuca się na poziomie istotności α. Może
być on stosowany dla prób o małej liczebności (dla n>5), ale tylko
wtedy gdy hipotetyczny rozkład jest przyjmowany całkowicie
niezależnie od danych, tzn. nie zachodzi konieczność szacowania
parametrów rozkładu na podstawie próbki. W przypadku gdy wartości
parametrów rozkładu hipotetycznego są estymowane z próby.
Liczebność próbki powinna wynosić co najmniej 100 i wówczas można
stosować test graficzny λ-Kołmogorowa.

Test normalności Lillieforsa

Test ten służy do weryfikacji hipot.zer.że zmienna losowa X ma
rozkład normalny N(μ,σ). Jeżeli parametry tego rozkładu są znane,
to weryfikacji hip.zer.można stosować opisany wcześniej test
Kołmogorowa. Jeśli zaś parametry te nie są znane to należy
stosować zmodyfikowany test Koł.znany pod nazwą testu Lillieforsa.
Statystyka tego testu jest taka sama jak testu Koł., z tym, że do
wyznaczenia hipotetycznej dystrybuanty F(x) wykożystuje się oceny x i
s2 nieznanych parametrów roz.normal. Otrzymaną wart.satyst.testowej Dn
porównuje się ze zmodyfikowanymi wartościami krytyczn.testu Koł.

Test normalności Shapiro-Wilka

Drugim testem do weryfikacji hip.o normalności roz.zmiennej losowej w
przypadku gdy nie znane są parametry roz.hipotet. jest test S-W.
Pobraną próbę należy uporządkować niemalejąco i obliczyć
stat.testową

gdzie ai,n są specjalnymi współczyn oraz

W zależności od przyjętego poziomu istotności α i liczności
próbki n należy odczytać z tablic wart.kryt.testu S-W wart.kryt.
Wα,n. Jeżeli W< Wα,n to hipotezę o normalności rozkładu zmiennej
losowej X należy odrzucić.

Porównanie kształtów histogramów

Najprostszym sposobem oceny zgodności rozkładu obserwacji próby z
rozk. hipotet. jest wizualne porównanie histogramu częstości z funk.
Gęstości lub hist. skumulowanej częstości z dystrybuantą.
Porównanie wizualne pozwala na natychmiastowe oszacowanie bliskości
rozkładu danych zaobserwowanych z rozkładem hipotetycznym oraz
dostarcza cennych inf. o obszarach niezgodności.

Porównanie hist. częst. z fun. gęstości

Z powodu konieczności grupowania danych w klasach, potrzebnych dla
zbudow. hist, najczęściej istotne cechy prawdziwych końców rozkładu
nie są przedst. na wykresie i ulegają zatraceniu. Wybór węższych
przedziałów klasowych zwiększa czytelność wykresów, ale mniejsza
licz.oserwacji w klasach powoduje większe zmiany w wys.słupków.
Mając dany rzeczywisty rozkład zmiennej losowej i zbiór przedziałów
klasowych, obserwowane częstości w przedziałach klas.są zmiennymi
losowymi, wprost proporcjonal.do liczby obserwacji z próby należących
do tych przezdiałów. Liczby te są zmiennymi losowymi o łącznym
rozkładzie wielomianowym. Dla ustalonej liczby klas k, wzrost
liczebności n próby może uczynić zgodność histogr.częstości z
funkcją gęstości niemal pewną. Porównując kształt
hist.częst.danych z funkcją gęstości rozkł.hipopet.należy tak
wybrać liczbę klas histogramu aby wypośrodkować między większą
niejednoznaczn.a większą zmiennością.

Porównanie hist.skumulo.częst z dystryb

Porównanie kształtu hist.skumulowanej częstości z dystrybuantą ma
wyraźną przewagę nad porównaniem histogr.częst.z funkcją
gęstości. W tym przypadku znacznie zmniejsza się niejednoznaczność
i zmienność hist.związana z koniecznością grupowania danych.
Należy jednak pamiętać, że można oczekiwać zmienności
hist.skumul.częst.w stosunku do dystrybuanty nawet wtedy gdy dane mają
rozkład określony tą dystryb.oraz, że inne prawo probabilistyczne
może rządzić generowaniem danych nawet jeśli wydają się one zgodne
z proponowanym rozkład.

Test chi-kwadrat (χ2)zgodności



Porównując liczebności zaobserwowane z teoret otrzymuje się
statystykę testową



Statystyka ta posiada asymptotycznie (tzn. dla n→∞) rozkład χ2 z
liczbą stopni swobody k-1. W praktyce przyjmuje się, że jeśli
parametry rozkładu ocenia się na podstawie próby, to liczeb.próby
powinna wynosić co najmniej100, a liczba klas od10-25.Dla rozkładu
normaln., gdy parametry rozkładu są znane, liczba klas może być
zmniejszona, ale powinna wynosić od 5-10. Następnie wybiera się
poziom istotności α oblicza wartość statystyki i porównuje ją z
wartością krytyczną χ2α, k-r-l dla k-r-1 stopni swobody. Jeżeli
zachodzi nierówność χ2> χ2α, k-r-l to hipotezę zerową należy
odrzucić. W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy
zerowej.

Test zgodności Kołmogorowa

Przyjmuje się, że zmienna losowa X typu ciągłego ma rozkład
określony dystrybuantą F(x). Pobraną próbę porządkuje się w
ciągu niemalejącym i wyznacza dystrybuantę empiryczną Fn(x).
Statystyka testowa testu jest:



Statystyka ta przy prawdziwości hipotezy zerowej ma rozkład
Kołmogorowa, którego jednym parametrem jest liczebność próby.
Przyjmując wartość poziomu istotności α z tablic wartości
krytycznych rozkł.Kołm.odczytuje się wartość kryt. Dα,n. Jeżeli
Dn> Dα,n, to hipot.zer.odrzuca się na poziomie istotności α. Może
być on stosowany dla prób o małej liczebności (dla n>5), ale tylko
wtedy gdy hipotetyczny rozkład jest przyjmowany całkowicie
niezależnie od danych, tzn. nie zachodzi konieczność szacowania
parametrów rozkładu na podstawie próbki. W przypadku gdy wartości
parametrów rozkładu hipotetycznego są estymowane z próby.
Liczebność próbki powinna wynosić co najmniej 100 i wówczas można
stosować test graficzny λ-Kołmogorowa.

Test normalności Lillieforsa

Test ten służy do weryfikacji hipot.zer.że zmienna losowa X ma
rozkład normalny N(μ,σ). Jeżeli parametry tego rozkładu są znane,
to weryfikacji hip.zer.można stosować opisany wcześniej test
Kołmogorowa. Jeśli zaś parametry te nie są znane to należy
stosować zmodyfikowany test Koł.znany pod nazwą testu Lillieforsa.
Statystyka tego testu jest taka sama jak testu Koł., z tym, że do
wyznaczenia hipotetycznej dystrybuanty F(x) wykożystuje się oceny x i
s2 nieznanych parametrów roz.normal. Otrzymaną wart.satyst.testowej Dn
porównuje się ze zmodyfikowanymi wartościami krytyczn.testu Koł.

Test normalności Shapiro-Wilka

Drugim testem do weryfikacji hip.o normalności roz.zmiennej losowej w
przypadku gdy nie znane są parametry roz.hipotet. jest test S-W.
Pobraną próbę należy uporządkować niemalejąco i obliczyć
stat.testową

gdzie ai,n są specjalnymi współczyn oraz

W zależności od przyjętego poziomu istotności α i liczności
próbki n należy odczytać z tablic wart.kryt.testu S-W wart.kryt.
Wα,n. Jeżeli W< Wα,n to hipotezę o normalności rozkładu zmiennej
losowej X należy odrzucić.

Porównanie kształtów histogramów

Najprostszym sposobem oceny zgodności rozkładu obserwacji próby z
rozk. hipotet. jest wizualne porównanie histogramu częstości z funk.
Gęstości lub hist. skumulowanej częstości z dystrybuantą.
Porównanie wizualne pozwala na natychmiastowe oszacowanie bliskości
rozkładu danych zaobserwowanych z rozkładem hipotetycznym oraz
dostarcza cennych inf. o obszarach niezgodności.

Porównanie hist. częst. z fun. gęstości

Z powodu konieczności grupowania danych w klasach, potrzebnych dla
zbudow. hist, najczęściej istotne cechy prawdziwych końców rozkładu
nie są przedst. na wykresie i ulegają zatraceniu. Wybór węższych
przedziałów klasowych zwiększa czytelność wykresów, ale mniejsza
licz.oserwacji w klasach powoduje większe zmiany w wys.słupków.
Mając dany rzeczywisty rozkład zmiennej losowej i zbiór przedziałów
klasowych, obserwowane częstości w przedziałach klas.są zmiennymi
losowymi, wprost proporcjonal.do liczby obserwacji z próby należących
do tych przezdiałów. Liczby te są zmiennymi losowymi o łącznym
rozkładzie wielomianowym. Dla ustalonej liczby klas k, wzrost
liczebności n próby może uczynić zgodność histogr.częstości z
funkcją gęstości niemal pewną. Porównując kształt
hist.częst.danych z funkcją gęstości rozkł.hipopet.należy tak
wybrać liczbę klas histogramu aby wypośrodkować między większą
niejednoznaczn.a większą zmiennością.

Porównanie hist.skumulo.częst z dystryb

Porównanie kształtu hist.skumulowanej częstości z dystrybuantą ma
wyraźną przewagę nad porównaniem histogr.częst.z funkcją
gęstości. W tym przypadku znacznie zmniejsza się niejednoznaczność
i zmienność hist.związana z koniecznością grupowania danych.
Należy jednak pamiętać, że można oczekiwać zmienności
hist.skumul.częst.w stosunku do dystrybuanty nawet wtedy gdy dane mają
rozkład określony tą dystryb.oraz, że inne prawo probabilistyczne
może rządzić generowaniem danych nawet jeśli wydają się one zgodne
z proponowanym rozkład.

Test chi-kwadrat (χ2)zgodności



Porównując liczebności zaobserwowane z teoret otrzymuje się
statystykę testową



Statystyka ta posiada asymptotycznie (tzn. dla n→∞) rozkład χ2 z
liczbą stopni swobody k-1. W praktyce przyjmuje się, że jeśli
parametry rozkładu ocenia się na podstawie próby, to liczeb.próby
powinna wynosić co najmniej100, a liczba klas od10-25.Dla rozkładu
normaln., gdy parametry rozkładu są znane, liczba klas może być
zmniejszona, ale powinna wynosić od 5-10. Następnie wybiera się
poziom istotności α oblicza wartość statystyki i porównuje ją z
wartością krytyczną χ2α, k-r-l dla k-r-1 stopni swobody. Jeżeli
zachodzi nierówność χ2> χ2α, k-r-l to hipotezę zerową należy
odrzucić. W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy
zerowej.

Test zgodności Kołmogorowa

Przyjmuje się, że zmienna losowa X typu ciągłego ma rozkład
określony dystrybuantą F(x). Pobraną próbę porządkuje się w
ciągu niemalejącym i wyznacza dystrybuantę empiryczną Fn(x).
Statystyka testowa testu jest:



Statystyka ta przy prawdziwości hipotezy zerowej ma rozkład
Kołmogorowa, którego jednym parametrem jest liczebność próby.
Przyjmując wartość poziomu istotności α z tablic wartości
krytycznych rozkł.Kołm.odczytuje się wartość kryt. Dα,n. Jeżeli
Dn> Dα,n, to hipot.zer.odrzuca się na poziomie istotności α. Może
być on stosowany dla prób o małej liczebności (dla n>5), ale tylko
wtedy gdy hipotetyczny rozkład jest przyjmowany całkowicie
niezależnie od danych, tzn. nie zachodzi konieczność szacowania
parametrów rozkładu na podstawie próbki. W przypadku gdy wartości
parametrów rozkładu hipotetycznego są estymowane z próby.
Liczebność próbki powinna wynosić co najmniej 100 i wówczas można
stosować test graficzny λ-Kołmogorowa.

Test normalności Lillieforsa

Test ten służy do weryfikacji hipot.zer.że zmienna losowa X ma
rozkład normalny N(μ,σ). Jeżeli parametry tego rozkładu są znane,
to weryfikacji hip.zer.można stosować opisany wcześniej test
Kołmogorowa. Jeśli zaś parametry te nie są znane to należy
stosować zmodyfikowany test Koł.znany pod nazwą testu Lillieforsa.
Statystyka tego testu jest taka sama jak testu Koł., z tym, że do
wyznaczenia hipotetycznej dystrybuanty F(x) wykożystuje się oceny x i
s2 nieznanych parametrów roz.normal. Otrzymaną wart.satyst.testowej Dn
porównuje się ze zmodyfikowanymi wartościami krytyczn.testu Koł.

Test normalności Shapiro-Wilka

Drugim testem do weryfikacji hip.o normalności roz.zmiennej losowej w
przypadku gdy nie znane są parametry roz.hipotet. jest test S-W.
Pobraną próbę należy uporządkować niemalejąco i obliczyć
stat.testową

gdzie ai,n są specjalnymi współczyn oraz

W zależności od przyjętego poziomu istotności α i liczności
próbki n należy odczytać z tablic wart.kryt.testu S-W wart.kryt.
Wα,n. Jeżeli W< Wα,n to hipotezę o normalności rozkładu zmiennej
losowej X należy odrzucić.

Porównanie kształtów histogramów

Najprostszym sposobem oceny zgodności rozkładu obserwacji próby z
rozk. hipotet. jest wizualne porównanie histogramu częstości z funk.
Gęstości lub hist. skumulowanej częstości z dystrybuantą.
Porównanie wizualne pozwala na natychmiastowe oszacowanie bliskości
rozkładu danych zaobserwowanych z rozkładem hipotetycznym oraz
dostarcza cennych inf. o obszarach niezgodności.

Porównanie hist. częst. z fun. gęstości

Z powodu konieczności grupowania danych w klasach, potrzebnych dla
zbudow. hist, najczęściej istotne cechy prawdziwych końców rozkładu
nie są przedst. na wykresie i ulegają zatraceniu. Wybór węższych
przedziałów klasowych zwiększa czytelność wykresów, ale mniejsza
licz.oserwacji w klasach powoduje większe zmiany w wys.słupków.
Mając dany rzeczywisty rozkład zmiennej losowej i zbiór przedziałów
klasowych, obserwowane częstości w przedziałach klas.są zmiennymi
losowymi, wprost proporcjonal.do liczby obserwacji z próby należących
do tych przezdiałów. Liczby te są zmiennymi losowymi o łącznym
rozkładzie wielomianowym. Dla ustalonej liczby klas k, wzrost
liczebności n próby może uczynić zgodność histogr.częstości z
funkcją gęstości niemal pewną. Porównując kształt
hist.częst.danych z funkcją gęstości rozkł.hipopet.należy tak
wybrać liczbę klas histogramu aby wypośrodkować między większą
niejednoznaczn.a większą zmiennością.

Porównanie hist.skumulo.częst z dystryb

Porównanie kształtu hist.skumulowanej częstości z dystrybuantą ma
wyraźną przewagę nad porównaniem histogr.częst.z funkcją
gęstości. W tym przypadku znacznie zmniejsza się niejednoznaczność
i zmienność hist.związana z koniecznością grupowania danych.
Należy jednak pamiętać, że można oczekiwać zmienności
hist.skumul.częst.w stosunku do dystrybuanty nawet wtedy gdy dane mają
rozkład określony tą dystryb.oraz, że inne prawo probabilistyczne
może rządzić generowaniem danych nawet jeśli wydają się one zgodne
z proponowanym rozkład.

Test chi-kwadrat (χ2)zgodności



Porównując liczebności zaobserwowane z teoret otrzymuje się
statystykę testową



Statystyka ta posiada asymptotycznie (tzn. dla n→∞) rozkład χ2 z
liczbą stopni swobody k-1. W praktyce przyjmuje się, że jeśli
parametry rozkładu ocenia się na podstawie próby, to liczeb.próby
powinna wynosić co najmniej100, a liczba klas od10-25.Dla rozkładu
normaln., gdy parametry rozkładu są znane, liczba klas może być
zmniejszona, ale powinna wynosić od 5-10. Następnie wybiera się
poziom istotności α oblicza wartość statystyki i porównuje ją z
wartością krytyczną χ2α, k-r-l dla k-r-1 stopni swobody. Jeżeli
zachodzi nierówność χ2> χ2α, k-r-l to hipotezę zerową należy
odrzucić. W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy
zerowej.

Test zgodności Kołmogorowa

Przyjmuje się, że zmienna losowa X typu ciągłego ma rozkład
określony dystrybuantą F(x). Pobraną próbę porządkuje się w
ciągu niemalejącym i wyznacza dystrybuantę empiryczną Fn(x).
Statystyka testowa testu jest:



Statystyka ta przy prawdziwości hipotezy zerowej ma rozkład
Kołmogorowa, którego jednym parametrem jest liczebność próby.
Przyjmując wartość poziomu istotności α z tablic wartości
krytycznych rozkł.Kołm.odczytuje się wartość kryt. Dα,n. Jeżeli
Dn> Dα,n, to hipot.zer.odrzuca się na poziomie istotności α. Może
być on stosowany dla prób o małej liczebności (dla n>5), ale tylko
wtedy gdy hipotetyczny rozkład jest przyjmowany całkowicie
niezależnie od danych, tzn. nie zachodzi konieczność szacowania
parametrów rozkładu na podstawie próbki. W przypadku gdy wartości
parametrów rozkładu hipotetycznego są estymowane z próby.
Liczebność próbki powinna wynosić co najmniej 100 i wówczas można
stosować test graficzny λ-Kołmogorowa.

Test normalności Lillieforsa

Test ten służy do weryfikacji hipot.zer.że zmienna losowa X ma
rozkład normalny N(μ,σ). Jeżeli parametry tego rozkładu są znane,
to weryfikacji hip.zer.można stosować opisany wcześniej test
Kołmogorowa. Jeśli zaś parametry te nie są znane to należy
stosować zmodyfikowany test Koł.znany pod nazwą testu Lillieforsa.
Statystyka tego testu jest taka sama jak testu Koł., z tym, że do
wyznaczenia hipotetycznej dystrybuanty F(x) wykożystuje się oceny x i
s2 nieznanych parametrów roz.normal. Otrzymaną wart.satyst.testowej Dn
porównuje się ze zmodyfikowanymi wartościami krytyczn.testu Koł.

Test normalności Shapiro-Wilka

Drugim testem do weryfikacji hip.o normalności roz.zmiennej losowej w
przypadku gdy nie znane są parametry roz.hipotet. jest test S-W.
Pobraną próbę należy uporządkować niemalejąco i obliczyć
stat.testową

gdzie ai,n są specjalnymi współczyn oraz

W zależności od przyjętego poziomu istotności α i liczności
próbki n należy odczytać z tablic wart.kryt.testu S-W wart.kryt.
Wα,n. Jeżeli W< Wα,n to hipotezę o normalności rozkładu zmiennej
losowej X należy odrzucić.

Porównanie kształtów histogramów

Najprostszym sposobem oceny zgodności rozkładu obserwacji próby z
rozk. hipotet. jest wizualne porównanie histogramu częstości z funk.
Gęstości lub hist. skumulowanej częstości z dystrybuantą.
Porównanie wizualne pozwala na natychmiastowe oszacowanie bliskości
rozkładu danych zaobserwowanych z rozkładem hipotetycznym oraz
dostarcza cennych inf. o obszarach niezgodności.

Porównanie hist. częst. z fun. gęstości

Z powodu konieczności grupowania danych w klasach, potrzebnych dla
zbudow. hist, najczęściej istotne cechy prawdziwych końców rozkładu
nie są przedst. na wykresie i ulegają zatraceniu. Wybór węższych
przedziałów klasowych zwiększa czytelność wykresów, ale mniejsza
licz.oserwacji w klasach powoduje większe zmiany w wys.słupków.
Mając dany rzeczywisty rozkład zmiennej losowej i zbiór przedziałów
klasowych, obserwowane częstości w przedziałach klas.są zmiennymi
losowymi, wprost proporcjonal.do liczby obserwacji z próby należących
do tych przezdiałów. Liczby te są zmiennymi losowymi o łącznym
rozkładzie wielomianowym. Dla ustalonej liczby klas k, wzrost
liczebności n próby może uczynić zgodność histogr.częstości z
funkcją gęstości niemal pewną. Porównując kształt
hist.częst.danych z funkcją gęstości rozkł.hipopet.należy tak
wybrać liczbę klas histogramu aby wypośrodkować między większą
niejednoznaczn.a większą zmiennością.

Porównanie hist.skumulo.częst z dystryb

Porównanie kształtu hist.skumulowanej częstości z dystrybuantą ma
wyraźną przewagę nad porównaniem histogr.częst.z funkcją
gęstości. W tym przypadku znacznie zmniejsza się niejednoznaczność
i zmienność hist.związana z koniecznością grupowania danych.
Należy jednak pamiętać, że można oczekiwać zmienności
hist.skumul.częst.w stosunku do dystrybuanty nawet wtedy gdy dane mają
rozkład określony tą dystryb.oraz, że inne prawo probabilistyczne
może rządzić generowaniem danych nawet jeśli wydają się one zgodne
z proponowanym rozkład.

Test chi-kwadrat (χ2)zgodności



Porównując liczebności zaobserwowane z teoret otrzymuje się
statystykę testową



Statystyka ta posiada asymptotycznie (tzn. dla n→∞) rozkład χ2 z
liczbą stopni swobody k-1. W praktyce przyjmuje się, że jeśli
parametry rozkładu ocenia się na podstawie próby, to liczeb.próby
powinna wynosić co najmniej100, a liczba klas od10-25.Dla rozkładu
normaln., gdy parametry rozkładu są znane, liczba klas może być
zmniejszona, ale powinna wynosić od 5-10. Następnie wybiera się
poziom istotności α oblicza wartość statystyki i porównuje ją z
wartością krytyczną χ2α, k-r-l dla k-r-1 stopni swobody. Jeżeli
zachodzi nierówność χ2> χ2α, k-r-l to hipotezę zerową należy
odrzucić. W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy
zerowej.

Test zgodności Kołmogorowa

Przyjmuje się, że zmienna losowa X typu ciągłego ma rozkład
określony dystrybuantą F(x). Pobraną próbę porządkuje się w
ciągu niemalejącym i wyznacza dystrybuantę empiryczną Fn(x).
Statystyka testowa testu jest:



Statystyka ta przy prawdziwości hipotezy zerowej ma rozkład
Kołmogorowa, którego jednym parametrem jest liczebność próby.
Przyjmując wartość poziomu istotności α z tablic wartości
krytycznych rozkł.Kołm.odczytuje się wartość kryt. Dα,n. Jeżeli
Dn> Dα,n, to hipot.zer.odrzuca się na poziomie istotności α. Może
być on stosowany dla prób o małej liczebności (dla n>5), ale tylko
wtedy gdy hipotetyczny rozkład jest przyjmowany całkowicie
niezależnie od danych, tzn. nie zachodzi konieczność szacowania
parametrów rozkładu na podstawie próbki. W przypadku gdy wartości
parametrów rozkładu hipotetycznego są estymowane z próby.
Liczebność próbki powinna wynosić co najmniej 100 i wówczas można
stosować test graficzny λ-Kołmogorowa.

Test normalności Lillieforsa

Test ten służy do weryfikacji hipot.zer.że zmienna losowa X ma
rozkład normalny N(μ,σ). Jeżeli parametry tego rozkładu są znane,
to weryfikacji hip.zer.można stosować opisany wcześniej test
Kołmogorowa. Jeśli zaś parametry te nie są znane to należy
stosować zmodyfikowany test Koł.znany pod nazwą testu Lillieforsa.
Statystyka tego testu jest taka sama jak testu Koł., z tym, że do
wyznaczenia hipotetycznej dystrybuanty F(x) wykożystuje się oceny x i
s2 nieznanych parametrów roz.normal. Otrzymaną wart.satyst.testowej Dn
porównuje się ze zmodyfikowanymi wartościami krytyczn.testu Koł.

Test normalności Shapiro-Wilka

Drugim testem do weryfikacji hip.o normalności roz.zmiennej losowej w
przypadku gdy nie znane są parametry roz.hipotet. jest test S-W.
Pobraną próbę należy uporządkować niemalejąco i obliczyć
stat.testową

gdzie ai,n są specjalnymi współczyn oraz

W zależności od przyjętego poziomu istotności α i liczności
próbki n należy odczytać z tablic wart.kryt.testu S-W wart.kryt.
Wα,n. Jeżeli W< Wα,n to hipotezę o normalności rozkładu zmiennej
losowej X należy odrzucić.

 
statystyka