2. Co to jest próba?
Próbą jest każdy podzbiór pochodzący
z populacji.
Co to jest podzbiór?
Podzbiorem jest każdy układ elementów
należących do populacji, który nie
obejmuje wszystkich elementów
populacji.
Populacja
3. Kilka nieporozumień dotyczących wielkości próby…
• „Wielkość próby musi stanowić określoną proporcję populacji, np. 5%”
• „Próba powinna liczyć co najmniej 2000 elementów”
• „Wraz ze zwiększaniem wielkości próby rośnie precyzja wnioskowania
na podstawie danych z próby”
Powyższe przekonania są FAŁSZYWE!
4. Estymacja i estymatory
• Estymacja - proces, którego celem jest ocena wartości parametru na podstawie
badanej próby. Estymacji dokonuje się przy użyciu estymatora – funkcji, która w
najlepszy sposób pozwoli na oszacowanie wielkości parametru.
• Celem jest znalezienie takiej funkcji, która pozwolił na najbardziej precyzyjne
oszacowanie wartości parametru.
• Chcielibyśmy na estymator wybrać taką funkcję, gdzie różnica między T a t
będzie najmniejsza
• Gdy chcemy np. znać średnią dochodu w populacji możemy użyć do tego
średniej z próby. Średnia z próby będzie wtedy estymatorem wartości z
populacji. Wartość, którą uzyskamy to ocena parametru.
5. • Obciążenie
Estymator jest nieobciążony, jeśli średnia jego rozkładu z
próby jest równa wartości parametru
• Efektywność
Efektywność estymatora zależy od tego, jak bardzo
rozkład z próby skupia się wokół rzeczywistej wartości
parametru. Często to błąd standardowy średniej.
6. Błąd standardowy (błąd próby)
• Błąd standardowy estymacji to estymowane odchylenie
standardowe błędu tej metody.
• Prawdziwa wartość błędu standardowego jest zwykle nieznana, a
jako błąd standardowy przyjmuje się odchylenie standardowe dla
rozkładu średniej z próby.
Mówiąc prościej: błąd standardowy pozwala
nam na oszacowanie, na ile dokładnie wyniki
otrzymane na podstawie badania próby
odzwierciedlają rzeczywiste wartości
parametrów w populacji
7. Przykład i zadanie
Studentka Wielkość stypendium
Kinga 500 zł
Ida 650 zł
Wiola 400 zł
Monika 700 zł
Ada 600 zł
Średnia zarobków w populacji μ=570 zł
Powiedzmy, że dobieramy próbę
składającą się z dwóch elementów, aby
oszacować wielkość parametru μ.
Jeśli wybierzemy do próby Kingę (500 zł) i
Wiolę (400 zł), wówczas średnia z próby
( 𝑥) będzie wynosiła 450 zł. Jest to
oszacowanie populacyjnego parametru μ.
Oszacuj parametr μ dla wszystkich
możliwych dwuelementowych (n=2) prób
w tej populacji.
8. Przykład i zadanie
Studentka Wielkość stypendium
Kinga 500 zł
Ida 650 zł
Wiola 400 zł
Monika 700 zł
Ada 600 zł
Ile możliwych prób dwuelementowych
można stworzyć w tej populacji?
Czy któraś z wartości μ odpowiada
parametrowi średniej w populacji (570 zł)?
Zwróć uwagę, że w „normalnych”
badaniach wartość średniej w populacji nie
jest znana!
9. Wariancja, odchylenie standardowe i błąd standardowy
• Odchylenie standardowe (s) – miara rozproszenia wartości w próbie
• Błąd standardowy (SE) – rozkład wszystkich wartości średnich wokół średniej
tych wartości.
Wariancją (n) w populacji 𝑎1, 𝑎2, … , 𝑎 𝑛, o średniej arytmetycznej 𝑎 jest liczba
𝜎2 =
(𝑎1− 𝑎)2+(𝑎2− 𝑎)2+ ⋯+(𝑎 𝑛− 𝑎)2
𝑛
.
Odchylenie standardowe 𝜎 to po prostu pierwiastek kwadratowy z wariancji, t.j.:
𝜎 = 𝜎2
10. Przykład i zadanie
Studentka Wielkość stypendium
Kinga 500 zł
Ida 650 zł
Wiola 400 zł
Monika 700 zł
Ada 600 zł
Oblicz odchylenie standardowe rozkładu z
próby w przykładzie naszych studentek.
Wartość błędu standardowego (SE) obliczymy, dzieląc
odchylenie standardowe z próby przez pierwiastek
kwadratowy z wielkości próby (n), t.j.
𝑆𝐸 =
𝑠
𝑛
dla populacji nieskończonych, lub
𝑆𝐸 =
𝑠2
𝑛
1 −
𝑛
𝑁
dla populacji skończonych
(małych), gdzie
s – odchylenie standardowe
n – wielkość próby
N – wielkość populacji
11. Przykład i zadanie
Studentka Wielkość stypendium
Kinga 500 zł
Ida 650 zł
Wiola 400 zł
Monika 700 zł
Ada 600 zł
Oblicz standardowy błąd średniej z próby
1. Oblicz wariancję w próbie (pamiętaj, że populacja
jest mała!)
2. Oblicz standardowy błąd średniej z próby, według
wzoru:
𝑆𝐸 𝑥
𝑠2
𝑛
1 −
𝑛
𝑁
3. Jaki otrzymałeś(aś)wynik?
12. Przedziały ufności
• W przedziale między -1σ i 1σ
możemy oczekiwać 68% wartości
średnich z próby
• W przedziale między -1,96σ i
1,96σ możemy oczekiwać 95%
wartości średnich z próby
• W przedziale między -2,58σ i
2,58σ możemy oczekiwać 99%
wartości średnich z próby
• Jeżeli skonstruujemy przedział ufności
równy ±1,96σ, możemy się spodziewać, że
średnia populacyjna będzie leżała w tym
obszarze
• Prawdopodobieństwo popełnienia błędu,
polegającego na tym, że średnia populacyjna
nie wpada do tego przedziału, wynosi tylko
5%
13. Określanie wielkości próby
1. Przypomnijmy wzór na standardowy błąd średniej: 𝑆𝐸 =
𝑠
𝑛
, gdzie s – odchylenie
standardowe badanej zmiennej, n – wielkość próby
2. Dokonując przekształcenia, otrzymamy 𝑛 =
𝑠2
𝑆𝐸 2 .
3. Aby obliczyć wielkość próby, musimy mieć wyobrażenie o wielkości odchylenia
standardowego w populacji i musimy zdecydować, jak duży standardowy błąd
pomiaru możemy tolerować.
4. Jeśli, na przykład, mamy pobrać próbę z populacji liczącej 10000 elementów, a
s2=0,20 oraz wartość akceptowanego SE=0,016, to szacowana wielkość próby
wynosi 𝑛 =
0,20
0,000256
= 781,25
5. Jeżeli wielkość próby okaże się zbyt duża w stosunku do populacji, to należy
wprowadzić poprawkę dla populacji nieskończenie dużych. W tym przypadku do 1
dodajemy wartość ułamka n/N. W naszym przypadku:
6. 𝑛′
=
𝑛
1+
𝑛
𝑁
, to jest 𝑛′
=
781,25
1+
781,25
10000
≅ 725
15. Zadanie
Dostałeś/aś zlecenie zbadania warszawskich organizacji pozarządowych
pod kątem angażowania przez nie do pracy wolontariuszy. Badanie ma
być zrealizowane metodą sondażu telefonicznego.
1. Znajdź wiarygodny operat do badania
2. Określ wielkość próby (maksymalny błąd = 5%)
3. Dokonaj losowania warstwowego próby z operatu. Samodzielnie
wybierz kryterium wyodrębnienia warstw.
4. Wynikiem Twojej pracy powinna być wylosowana do badania próba –
lista organizacji z danymi teleadresowymi.