Standardfehler des Mittelwerts

Nachdem Sie diesen Artikel gelesen haben, lernen Sie den Standard des Mittelwerts kennen.

Die statistische Inferenz hilft uns auch, die Hypothese zu prüfen, dass „die auf der Stichprobe basierende Statistik sich nicht signifikant von dem Populationsparameter unterscheidet und dass der Unterschied, sofern angegeben, nur auf Zufallsvariationen zurückzuführen ist“ .

Standardfehler des Mittelwerts (SE M oder σ M )

Der Standardfehler des Mittelwerts (SE M ) ist ziemlich wichtig, um die Repräsentativität oder Vertrauenswürdigkeit oder die Signifikanz des Mittelwerts zu prüfen.

Nehmen wir an, wir hätten den Durchschnittswert von 200 Jungen der 10. Klasse von Delhi im Numerischen Fähigkeitstest mit 40 berechnet. Somit ist 40 der Mittelwert von nur einer Stichprobe aus der Bevölkerung (alle Jungen, die in der Klasse X in Delhi lesen).

Wir können auch verschiedene Stichproben von 200 Jungen aus der Bevölkerung ziehen. Angenommen, wir wählen zufällig 100 verschiedene Stichproben aus, wobei jede Stichprobe aus 200 Jungen derselben Population besteht, und berechnen den Mittelwert jeder Stichprobe.

Obwohl 'n' jeweils 200 beträgt, sind 200 Jungen, die zufällig ausgewählt wurden, um die verschiedenen Stichproben zu bilden, nicht identisch, und aufgrund von Schwankungen in der Stichprobe würden wir aus diesen 100 verschiedenen Stichproben 100 Mittelwerte erhalten.

Diese Mittelwerte unterscheiden sich tendenziell voneinander und bilden eine Reihe. Diese Werte bilden die Stichprobenverteilung der Mittel. Es kann mathematisch ausgedrückt werden, dass diese Mittelwerte normal verteilt sind.

Die 100 Mittelwerte (in unserem Beispiel) fallen in eine Normalverteilung um M Pop, wobei der M Pop der Mittelwert der Stichprobenverteilung der Mittelwerte ist. Die Standardabweichung dieser 100 Stichprobenmittelwerte wird als SE M oder Standardfehler des Mittelwerts bezeichnet und entspricht der Standardabweichung der Grundgesamtheit geteilt durch die Quadratwurzel von (Stichprobengröße).

Das SE M zeigt die Streuung der Probenmittel um M Pop . Somit ist SE M ein Maß für die Variabilität der Probenmittel. Es ist ein Maß für die Abweichung der Mittelwerte der Stichprobe von M pop . SE M wird auch als σ M geschrieben .

Der Standardfehler des Mittelwerts (SE M oder σ M ) wird unter Verwendung der Formel (für große Proben) berechnet.

(A) Berechnung von SE M in großen Proben :

wobei σ = Standardabweichung der Bevölkerung und

n = Anzahl der in die Stichprobe einbezogenen Fälle

(Da wir selten die SD einer Population haben können, verwenden wir für σ den Wert von SD des Stichprobenmittels).

Vertrauensintervall:

Die beiden Vertrauensbereiche 95% und 99% werden allgemein verwendet. RA Fisher nennt die Grenzen des Konfidenzintervalls, das den Parameter enthält, als "Treuhandgrenzen" und das Vertrauen, das in das Intervall gesetzt wird, als Treuhandwahrscheinlichkeit.

(a) 95% des Vertrauensintervalls:

Anhand der Tabelle der Fläche unter der Normalkurve finden wir, dass 95% der Fälle zwischen M ± 1.96 SE M liegen . Dass wir zu 95% zuversichtlich oder richtig sind zu sagen, dass M Pop im Intervall M + 1.96 SE M und M + 1.96 SE M liegt, und wir sind 5% falsch zu sagen, dass M Pop außerhalb dieses Intervalls liegen wird.

Mit anderen Worten, die Wahrscheinlichkeit, dass M Pop im Bereich M ± 1.96 SE M liegt, beträgt 95% (oder 0, 95) und die Wahrscheinlichkeit, dass M Pop außerhalb des Bereichs liegt, beträgt 5% (oder 0, 05). Der Wert 1, 96 ist der kritische Wert auf der Signifikanzstufe 0, 05.

(b) 99% des Vertrauensintervalls:

In der Tabelle der Fläche unter der Normalkurve finden wir, dass 99% der Fälle zwischen M ± 2, 58 SE M liegen . Dass wir zu 99% zuversichtlich oder richtig sind zu sagen, dass M Pop im Intervall M - 2, 58 SE M und M + 2, 58 SE M liegt, und wir sind 1% falsch zu sagen, dass M Pop außerhalb dieses Intervalls liegt.

Mit anderen Worten, die Wahrscheinlichkeit, dass M Pop im Bereich von M ± 2, 58 SE M liegt, beträgt 99% (oder 0, 99) und die Wahrscheinlichkeit, dass M Pop außerhalb des Bereichs liegt, beträgt 1% (oder 0, 01). Der Wert 2, 58 ist der kritische Wert auf der Signifikanzstufe 0, 01.

Hier stellen wir fest, dass das Signifikanzniveau umgekehrt proportional zum Genauigkeitsgrad ist. In der Signifikanzstufe 05 wären wir in 95% der Fälle genau und in der Signifikanzstufe .01 in 99% der Fälle.

Die untenstehende Tabelle wird Ihnen weiter vorangehen:

Beispiel 1:

Der Mittelwert und der SD von 225 Jungen der Klasse XII von Delhi in einem Test der numerischen Fähigkeiten waren 48 bzw. 6. Wie gut dieser Mittelwert den M- Pop oder den M- Pop darstellt . (n = 225, & sigma; = 6, Mittelwert = 48]

Wenn wir uns auf die Tabelle der Normalverteilung (Tabelle A) beziehen, stellen wir fest, dass alle (99, 7) aller Fälle mit in ± 3σ liegen. In unserem Beispiel liegen alle Abtastmittel zwischen M pop + 3σ m und M pop - 3σ M. Daher ist ein Mittelwert der Stichprobe am besten 3 σm weniger als M pop auf 3 σ M mehr als M pop .

Wenn wir also den Wert von σ M kennen, können wir aus unserem Stichprobenmittelwert auf den M Pop schließen. Hier ist 4 die Standardabweichung der Verteilung der Stichprobenmittelwerte, von denen unser Mittelwert eins ist. Alle Mustermittel, die normalerweise um M pop verteilt sind, liegen zwischen M pop + 3 SE M und M pop - 3 SE M.

3 SE M = 3 x .4 = 1.2

Obwohl wir den genauen Wert von M Pop nicht kennen, können wir zumindest mit Sicherheit sagen, dass M Pop dazwischen liegt

(48 -1, 2) und (48 + 1, 2) oder 46, 8 → 49, 2

Aus Tabelle A ergibt sich, dass 95% der Abgaben zwischen ± 1.96 σ liegen. In unserem Beispiel liegt das 95% -Konfidenzintervall für M pop zwischen M - 1.96 SE M und M + 1.96 SE M.

Jetzt sind 1, 96 SE M = 1, 96 × 0, 4 = 0, 78

. . . M - 1.96 SE M = 48 - .78 = 47.22 und M + 1.96 SE M = 48 + .78 = 48.78

. . . Das 95% -Konfidenzintervall reicht von 47, 22 bis 48, 78. Das 99% -Konfidenzintervall für M pop reicht von M - 2, 58 SE M bis M + 2, 58 SE M.

Jetzt 2, 58 SE M = 2, 58 X, 4 = 1, 03

. . . M - 2, 58 SE M = 48 -1, 03 = 46, 97 und M + 2, 58 SE M = 48 + 1, 03 = 49, 03

. . . Das 99% -Konfidenzintervall für M pop reicht von 46, 97 bis 49, 03.

Beispiel 2

Der Mittelwert und der SD von 400 Schülern in einem Test wurden mit 42 und 8 ermittelt. Können Sie den Durchschnittswert der Bevölkerung bei einem Konfidenzintervall von 99% und 95% schätzen?

Lösung:

(i) Das 95% -Konfidenzintervall für M pop reicht von M - 1.96 SE M bis M + 1.96 SE M.

Jetzt sind 1, 96 SE M = 1, 96 x, 4 = 0, 784

. . . M-1, 96 SE M = 42-.784 = 41, 22

und M + 1.96 SE M = 42 + .784 = 42.78 (bis zu zwei Dezimalstellen).

Das 95% -Konfidenzintervall reicht also von 41, 22 bis 42, 78. Wir sind zu 95% genau, dass M pop zwischen 41.22 und 42.78 liegt.

(ii) Das 99% -Konfidenzintervall für M pop reicht von M - 2, 58 SE M bis M + 2, 58 SE M

Jetzt 2, 58 SE M = 2, 58 × 4 = 1, 03

. . . M - 2, 58 SE M = 42 - 1, 03 = 40, 97

und M + 2, 58 SE M = 42 + 1, 03 = 43, 03

Somit liegt das Konfidenzintervall von 99% zwischen 40, 97 und 43, 03. Wir sind zu 99% zuversichtlich, dass M Pop zwischen 40, 97 und 43, 03 liegt.

Beispiel 3:

Der Mittelwert und der SD einer Stichprobe von 169 Jungen in einem Test der numerischen Fähigkeit sind 50 bzw. 6:

(i) Bestimmen Sie das 95% Intervall für den Populationsmittelwert und interpretieren Sie es.

(ii) Bestimmen Sie den akzeptablen Abtastfehler bei den Signifikanzniveaus 0, 05 und 0, 01.

(iii) Bestimmen Sie das 99% -Konfidenzintervall für M pop .

Lösung:

M = 50

(i) Das 95% -Konfidenzintervall für Mp 0p reicht von M - 1.96 SE M bis M + 1.96 SE M.

Jetzt sind 1, 96 SEm = 1, 96 x .46 = 0, 90

Somit ist M-1, 96 SE M = 50-.90 = 49, 10

und M + 1.96 SE M = 50 +.90 = 50.90

. . . Das 95% -Konfidenzintervall für M pop reicht von 49, 10 bis 50, 90. Aus dem Stichprobenmittelwert von 50 schätzen wir, dass der M- Pop zwischen 49, 10 und 50, 90 ein fester Wert ist. Wir sind also zu 95% zuversichtlich.

Mit anderen Worten, unser Stichprobenmittelwert von 50 wird den M- Pop nicht um mehr als 0, 90 verfehlen, und dies gilt für 95 Fälle bei 100. Alternativ können nur in 5 Fällen bei 100 unseren Stichproben-Mittelwert von 50 den M- Pop durchgehen mehr als .90.

(ii) Kritischer Wert bei 0, 05 Signifikanzniveau = 1, 96

Kritischer Wert bei 0, 01 Signifikanzniveau = 2, 58

"Stichprobenfehler = kritischer Wert x SE M "

Der Abtastfehler auf dem 0, 05-Signifikanzniveau beträgt also 1, 96 SEM und der auf 0, 01-Signifikanzniveau beträgt 2, 58 SEM

Zulässiger Abtastfehler bei 0, 05-Pegel = 1, 96 SE M = 1, 96 x .46 = 0, 90

Zulässiger Abtastfehler bei 0, 01-Pegel = 2, 58 SE M = 2, 58 X .46 = 1, 19

(iii) Das Konfidenzintervall von 99% reicht von M - 2, 58 SE M bis M + 2, 58 SE M

Jetzt 2, 58 SE M = 2, 58 X, 46 = 1, 19

Somit betrug M-2, 58 SE M = 50 bis 1, 19 = 48, 81

und M + 2, 58 SE M = 50 + 1, 19 = 51, 19

Das 99% -Konfidenzintervall reicht von 48, 81 bis 51, 19.

Beispiel 4:

Für eine bestimmte Gruppe von 500 Soldaten beträgt der mittlere AGCT-Score 95, 00 und der SD-Wert 25.

(ii) Bestimmen Sie das 0, 99-Konfidenzintervall für den wahren Mittelwert.

(ii) Es ist unwahrscheinlich, dass der wahre Mittelwert größer ist als welcher Wert?

Lösung:

(i) Das Konfidenzintervall von 99% reicht von M - 2, 58 SE M bis M + 2, 58 SE M.

Jetzt 2, 58 SE M = 2, 58 × 1, 12 = 2, 89

Somit betrug M-2, 58 SE M = 95, 0-2, 89 = 92, 11

und M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89

. . . Das 99% -Konfidenzintervall reicht von 92, 11 bis 97, 89.

Aus unserem Beispielmittelwert von 95, 0 schätzen wir den wahren Mittelwert auf einen festen Wert zwischen 92, 11 und 97, 89, und wir sind zu 99% zuversichtlich.

(ii) Unser Stichprobenmittelwert von 95, 0 wird den wahren Mittelwert nicht um mehr als 2, 89 verfehlen, dh der wahre Wert ist nicht größer als 97, 89.

(B) Berechnung von SE M in einer kleinen Probe:

Es ist üblich, Proben größer als 30 als große Proben zu bezeichnen. Wenn N groß ist, lohnt es sich nicht, die Korrektur vorzunehmen. Wenn N jedoch "klein" ist (weniger als 30), ist es ratsam, (N - 1) zu verwenden, und wenn N ziemlich klein ist, sagen wir weniger als 10.

Der Schüler muss sich daran erinnern, dass (i) theoretisch (N - 1) immer verwendet werden sollte, wenn SD eine Schätzung der Bevölkerung a sein soll; und (ii) die Unterscheidung zwischen "Stichprobenstatistiken" und "Stichprobenstatistiken" im Hinblick auf einen Schnittpunkt von N = 30 ist willkürlich und ist zum Teil eine Frage der Bequemlichkeit.

Wenn N weniger als etwa 30 ist, sollte die Formel für σ M oder SE M lauten:

Beispiel 5

Folgende fünf Schüler haben in einem Test Punkte erzielt:

Bestimmen Sie die Grenzen der 95% -Konfidenzgrenze für den Mittelwert der Bevölkerung.

Die Ergebnisse sind - 11, 13, 9, 12, 15:

Lösung:

M = 12

Hier ist df = n-1 = 5-1 = 4

Unter Bezugnahme auf Tabelle D mit df = 4 beträgt der t- Wert auf dem 0, 05-Signifikanzniveau (dh 95% Konfidenzniveau) 2, 78.

Das 95% -Konfidenzintervall definiert M ± 2, 78 SE M

2, 78 SE M = 2, 78 × 1, 0 = 2, 78

M - 2, 78 SE M = 12 - 2, 78 × 1, 0 = 9, 22 und

M + 2, 78 SE M = 12 + 2, 78 × 1, 0 = 14, 78

. . . Die Grenzen des 95% -Konfidenzintervalls liegen bei 9, 22 und 14, 78.

Dies bedeutet, dass P = .95, dass M Pop im Intervall 9.22 bis 14.78 liegt.

Beispiel 6:

Zehn Messungen der Reaktionszeit auf Licht werden einem geübten Beobachter entnommen. Der Mittelwert beträgt 175, 50 ms (Millisekunden) und das S beträgt 5, 82 ms. Bestimmen Sie das .95-Konfidenzintervall für den M- Pop ; das 99-Konfidenzintervall.

Lösung:

n = 10, S = 5, 82 ms, M = 175, 50 ms

Die zur Bestimmung von t verfügbaren df (Freiheitsgrade) sind (n - 1) oder (10 - 1) = 9

(i) Bestimmen des 95% (oder 95) Vertrauensintervalls:

Bei Eingabe von Tabelle D mit 9 df lesen wir am Punkt 0, 05 t = 2, 26.

Das 95% -Konfidenzintervall für M pop reicht von M - 2, 26 SE M bis M + 2, 26 SE M.

Jetzt 2, 26 SE M = 2, 26 x 1, 84 = 4, 16

Somit ist M - 2, 26 SE M = 175, 50 - 4, 16 = 171, 34

und M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66

. . . Das 95% -Konfidenzintervall für M pop reicht von 171, 34 bis 179, 66. Das P ist .95, dass der M- Pop nicht kleiner als 171.34 und nicht größer als 179.66 ist. Wenn wir daraus schließen, dass M Pop innerhalb dieses Intervalls liegt, sollten wir in einer langen Reihe von Experimenten 95% der Zeit und 5% falsch sein.

(ii) Bestimmen eines Konfidenzintervalls von 99% (oder 0, 99):

Bei Eingabe von Tabelle D mit 9 df lesen wir, dass t = 3, 25 am 0, 01-Punkt ist. Das 99% -Konfidenzintervall für M pop reicht von M - 3, 25 SE M bis M + 3, 25 SE M.

Jetzt 3, 25 SE M = 3, 25 x 1, 84 = 5, 98

Somit ist M - 3, 25 SE M = 175, 50 - 5, 98 = 169, 52

und M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48

. . . Das 99% -Konfidenzintervall für M pop reicht von 169, 52 bis 181, 48.

Das P ist 0, 99, dass der M Pop nicht weniger als 169, 52 oder nicht mehr als 181, 48 ist. Wenn wir daraus schließen, dass M Pop innerhalb dieses Intervalls liegt, sollten wir über eine lange Reihe von Experimenten mit -99% der Zeit und mit 1% falsch liegen.

Schlussfolgerungen zu anderen Statistiken:

Da alle Statistiken Stichprobenverteilungen und Standardfehler aufweisen, können die Signifikanz des Medians, der Quartilabweichung, der Standardabweichung, der Prozentsätze und anderer Statistiken als die des Mittelwerts interpretiert werden, und wir können den Parameter schätzen.

(i) Standardfehler des Medians (oder SE Mdn -):

In Bezug auf SD und Q können die SEs des Medians für große Stichproben anhand der folgenden Formeln berechnet werden:

wobei σ = SD der Probe, n = Größe der Probe und Q = Quartilabweichung der Probe.

Ein Beispiel veranschaulicht die Verwendung und Interpretation der Formeln:

Beispiel 7:

Auf der Trabue-Sprachskala A stellten 801-jährige Jungen 801 den folgenden Rekord auf:

Median = 21, 40 und Q = 4, 90. Wie gut repräsentiert dieser Median den Median der Bevölkerung, aus der diese Probe gezogen wird?

Lösung:

n = 801, Mdn = 21, 40, Q = 4, 90.

Durch Anwenden der zweiten Formel wird der

Da N groß ist, kann die Abtastverteilung als normal angenommen werden und das Konfidenzintervall aus der letzten Zeile in Tabelle D ermittelt werden. Das 0, 99-Konfidenzintervall für den Mdn- Popup beträgt 21, 40 ± 2, 58 × 0, 32 oder 21, 40 ± 0, 83.

Wir können sicher sein, dass der Median der Bevölkerung nicht weniger als 20, 57 und nicht mehr als 22, 23 beträgt. Dieser enge Bereich zeigt ein hohes Maß an Vertrauenswürdigkeit im Median der Stichprobe.

(ii) Standardfehler der Standardabweichung (SE σ ):

Der Standardfehler der Standardabweichung wie SE M wird ermittelt, indem die wahrscheinliche Abweichung der Probe SD aus ihrem Parameter (Population SD) berechnet wird. Die Formel für SE σ lautet

Beispiel 8:

n = 400, σ = 6

Wie gut repräsentiert dieser SD den SD der Bevölkerung, aus der die Stichprobe gezogen wird?

Lösung:

Wenn die Stichproben groß sind und nach dem Zufallsprinzip aus ihrer Grundgesamtheit gezogen werden, kann die obige Formel auf dieselbe Weise wie SE M angewendet und interpretiert werden.

Da N groß ist, kann das 0, 9-Konfidenzintervall für SD- Pop sicher an den Grenzen ± 2, 58 σ σ genommen werden . Anstelle von σ σ haben wir 6 ± 2, 58 x 0, 21, dh die Grenzen zwischen (6 - 0, 54) und (6 + 0, 54) oder 5, 46 und 6, 54.

Wenn wir davon ausgehen, dass der SD- Pop zwischen den Grenzwerten 5, 46 und 6, 54 liegt, sollten wir 99% der Fälle richtig liegen und 1% falsch.

(iii) Standardfehler der Quartilabweichung (oder SE Q oder σ q ):

SE Q kann aus den Formeln gefunden werden:

Beispiel 9:

n = 801, Q = 4, 90

Wie gut repräsentiert dieses Q die Quartilabweichung der Bevölkerung?

Lösung:

Durch Anwenden der Formel

Das 0, 99-Konfidenzintervall für den Q- Pop liegt zwischen 4, 90 ± 2, 58 x 0, 293, dh zwischen 4, 38 und 5, 42. Dieser Bereich zeigt, dass das Stichproben-Q eine äußerst zuverlässige Statistik ist.

(iv) Standardfehler des Prozentsatzes (oder SE% oder σ%):

Geben Sie das prozentuale Vorkommen eines Verhaltens an. Oft stellt sich die Frage, wie viel Vertrauen wir in die Abbildung setzen können. Wie verlässlich ist ein Index unser Prozentsatz der Inzidenz des Verhaltens, an dem wir interessiert sind? Um diese Frage zu beantworten,

Wir müssen die SE eines Prozentsatzes nach der Formel berechnen:

in welchem

p = das prozentuale Auftreten des Verhaltens, q = (1 - p)

n = Anzahl der Fälle

Beispiel 10:

In einer Studie über Betrug bei Grundschulkindern wurde festgestellt, dass 100 oder 25% der 400 Kinder aus Wohnungen mit hohem sozioökonomischem Status bei verschiedenen Tests geschummelt haben. Wie gut repräsentiert es den Bevölkerungsanteil?

Lösung:

p = 25% (prozentuales Auftreten)

q = 75% (100% - 25%)

Das 99% -Konfidenzintervall für den Bevölkerungsprozentsatz reicht von

25% ± 2, 58 × 2, 17%.

25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%

und 25% + 2, 58 × 2, 17% = 25% + 5, 60 = 30, 60%

Wir können mit 99% Vertrauen davon ausgehen, dass Grundschulkinder mit hohem sozioökonomischem Status mit mindestens 19, 4% betrügen und nicht größer als 30, 60% sein werden.

(v) Standardfehler des Korrelationskoeffizienten (SE r oder σ r ):

Die klassische Formel für die SE von a- ist

(SE eines Korrelationskoeffizienten r, wenn N groß ist)

Beispiel 11:

n = 120, r = 0, 60.

Was sind die Grenzen des Konfidenzintervalls von 99% für die Bevölkerung r

Lösung:

99% Konfidenzintervall

= r ± 2, 58 SEr = 0, 60 ± 2, 58 SEr

= 0, 60 ± 0, 15 oder 0, 45 bis 0, 75

Wichtige statistische Begriffe:

(i) Stufen:

.05:

Wahrscheinlichkeit, in 5 Proben von 100 Proben falsch zu laufen.

.01:

Wahrscheinlichkeit, dass in 1 von 100 Proben ein Fehler auftritt.

(ii) Vertrauen:

In der Signifikanz von 0, 05 ist der Experimentator zu 95% überzeugt, dass die Daten die Bevölkerung repräsentieren müssen.

In der Signifikanzstufe 0, 01 ist der Versuchsleiter zu 99% überzeugt, dass die Stichprobenstatistik die Bevölkerung repräsentieren muss.

(iii) Signifikanzniveaus:

Bevor wir die Hypothese testen, müssen wir die Kriterien festlegen, mit denen wir die Nullhypothese akzeptieren oder ablehnen möchten. Wir müssen das Signifikanzniveau vor dem Test festlegen. Zwei Bedeutungsebenen werden im Allgemeinen verwendet, nämlich 0, 05 und 0, 01.

(a) 0, 05 Signifikanzniveau:

Wir lesen aus Tabelle A, dass 95% der Fälle in einer Normalverteilung innerhalb der Grenzen von ± 1, 96 SE M liegen . Wenn wir die durch M ± 1.96 SE M festgelegten Grenzwerte annehmen, definieren wir ein Intervall, für das der Vertrauensgrad 0, 95 beträgt. Basierend auf unserer Einschätzung, dass die Größe von M pop auf diesen Grenzwerten basiert, stehen wir 95% der Zeit und 5% falsch.

Der Bereich zwischen - 1.96 SE M und + 1.96 SE M ist als Akzeptanzbereich von H o und der Bereich über - 1.96 SE M und + 1.96 SE M ist als Bereich der Ablehnung bekannt. Wenn ein Stichprobenmittel im Akzeptanzbereich liegt, akzeptieren wir das H o . Bei der Ablehnung des H o geben wir zu, dass der Mittelwert der Probe außerhalb von ± 1.96 SE M liegen kann .

Wenn wir also H o zurückweisen, machen wir einen Fehler von 5%, da in 5 von 100 Fällen ein solcher Mittelwert der Stichprobe auftreten kann. Wir sind bereit, ein Risiko von 5% einzugehen, wenn wir H o ablehnen, wenn es wahr ist. Somit ist das Kriterium für die Zurückweisung von H o das Signifikanzniveau.

(b) 0, 01 Signifikanzniveau:

Wir lesen aus Tabelle A, dass 99% der Erleichterungen in einer Normalverteilung innerhalb der Grenzen von ± 2, 58 SE M liegen . Wenn wir die durch M ± 2, 58 SE M festgelegten Grenzen einhalten, definieren wir ein Intervall, für das der Vertrauensgrad 0, 99 beträgt. Basierend auf unserer Einschätzung der Größe von M pop auf diesen Grenzwerten, stehen wir zu 99% der Zeit und falsch bei 1%.

Der Bereich zwischen - 2, 58 SE M und + 2, 58 SE M wäre der Akzeptanzbereich von H 0 und der Bereich dahinter wäre der Bereich der Ablehnung von H 0 . Wir sind bereit, ein Risiko von 1% einzugehen, wenn wir H o zurückweisen, wenn es wahr ist.

Das 0, 01-Signifikanzniveau ist genauer als das 0, 05-Niveau, da der Fehler beim Zurückweisen von H 0 im 0, 01-Niveau 1% beträgt, während im 0, 05-Niveau ein derartiger Fehler 5% beträgt.

(iv) t-Verteilung:

Wenn N weniger als etwa 30 ist, dh wenn die Stichprobe klein ist, wird die Stichprobenverteilung als " t- Verteilung" bezeichnet.

Die t-Verteilung unterscheidet sich nicht stark von der Normalen, es sei denn, N ist recht klein. Mit zunehmender Größe von N nähert sich die t- Verteilung immer mehr der Normalform an.

Eigenschaften der T-Verteilung:

1. Es sieht aus wie eine glockenförmige Kurve. Seine Verteilung ist jedoch variabler, bei Null-Schiefe und einem 'Ku' von mehr als 3.

2. Es ist symmetrisch um die Linie t = 0.

3. Es ist unimodal mit maximaler Ordinate bei t = 0.

4. Wenn N klein ist, liegt die t- Verteilung unter der Normalkurve, aber die Enden oder Enden der Kurve sind höher als die entsprechenden Teile der Normalkurve.

5. Die Einheiten entlang der Basislinie der t- Verteilung sind tatsächlich σ-Scores, dh

(v) Freiheitsgrade (df):

Das Konzept der Freiheitsgrade ist in der Stichprobenstatistik von großer Bedeutung. Dies ist auch bei der Varianzanalyse und bei anderen Verfahren von entscheidender Bedeutung. Freiheitsgrade bedeuten Freiheit zu variieren.

Wir wählen fünf Punkte, deren Mittelwert 15 sein soll. Nun nehmen wir an, die vier Punkte sind 18, 10, 20, 15. Für den Mittelwert gleich 15 muss die fünfte Punktzahl 12 sein. Wir haben natürlich Sie haben die Wahl zwischen vier Punkten.

Wir haben jedoch keine Freiheit, die fünfte Bewertung zu wählen, da die fünfte Bewertung Anpassungen in der Variation vornimmt, die durch die ersten vier Bewertungen hervorgerufen wird, und mit der Annahme, dass der Mittelwert 15 ist. Hier wird N = 5 und eine Einschränkung auferlegt, dh die Mittel muss 15 sein. Daher ist der Freiheitsgrad N - 1 oder 4.

Wenn wir 5 Punkte 5, 6, 7, 8 und 9 haben, ist der Mittelwert 7; und die Abweichungen unserer Bewertungen von 7 sind - 2, - 1, 0, 1 und 2. Die Summe dieser Abweichungen ist Null. Von den 5 Abweichungen können nur 4 (N - 1) "frei" ausgewählt werden, da die Summe gleich Null ist und den Wert der 5. Abweichung sofort einschränkt.

Die SD basiert natürlich auf den Quadraten der Abweichungen, die um den Mittelwert herum genommen werden. Es gibt N df für die Berechnung des Mittelwerts, aber nur (N - 1) steht für das 'S' (die SD) als df zur Verfügung, wenn ein df bei der Berechnung des Mittelwerts verloren geht.

In einem anderen Beispiel, in dem N = 10 ist, wurde die zur Schätzung des M- Pop zur Verfügung stehende df als 9 oder (N - 1) angegeben, dh um 1 weniger als die Anzahl der Beobachtungen, nämlich 10. Ein df geht bei der Berechnung des M und dementsprechend verloren Nur noch 9 stehen zur Verfügung, um den M- Pop mittels 'S' und die t-Verteilung abzuschätzen.

Immer wenn eine Statistik zur Schätzung eines Parameters verwendet wird, lautet die Regel, dass die verfügbare df gleich N minus der Anzahl der bereits aus der Stichprobe geschätzten Parameter ist. Das M ist eine Schätzung von M Pop und bei der Berechnung verlieren wir 1 df .

Bei der Schätzung der Zuverlässigkeit von beispielsweise r (die von den Abweichungen von zwei Mitteln abhängt) sind die df (N - 2). Im Falle von Chi-Quadrat-Tests und der Varianzanalyse werden getrennte Verfahren zur Bestimmung des df befolgt.

(vi) Nullhypothese:

Die Nullhypothese ist ein nützliches Werkzeug, um die Signifikanz von Unterschieden zu testen. Diese Hypothese besagt, dass es keinen echten Unterschied zwischen zwei Populationsmitteln gibt und dass der Unterschied zwischen den Stichprobenmitteln daher zufällig und unwichtig ist.

Die Nullhypothese bezieht sich auf das Rechtsprinzip, dass „ein Mann unschuldig ist, bis er als schuldig befunden wird“. Er stellt eine Herausforderung dar und die Aufgabe eines Experiments besteht darin, den Tatsachen eine Chance zu geben, diese Herausforderung zu widerlegen (oder nicht zu widerlegen).

Angenommen, es wird behauptet, dass "die Unterrichtsstandards von Einzelschichtschulen besser sind als die Doppelschichtschulen". Diese Hypothese ist vage formuliert und kann nicht genau geprüft werden.

Wenn wir behaupten, dass „Einschichtschulen keine besseren Unterrichtsstandards bieten als Doppelschichtschulen“ (der wahre Unterschied ist Null). Diese Nullhypothese ist genau und kann getestet werden. Wenn unsere Nullhypothese nicht steuerpflichtig ist, muss sie abgelehnt werden. Die Anweisung "keine Differenz" geht davon aus, dass die beiden Gruppen getestet und als gleich befunden werden.

Die Nullform wird von den meisten erfahrenen Forschern bevorzugt. Diese Form der Aussage definiert leichter das mathematische Modell, das im statistischen Test der Hypothese verwendet werden soll.

Eine Nullhypothese wird niemals bewiesen oder widerlegt. Es kann mit gewissem Vertrauen (oder mit einem bestimmten Signifikanzniveau) akzeptiert oder abgelehnt werden.

Bevor wir eine Hypothese testen, müssen wir Folgendes berücksichtigen:

1. Ob die Stichprobe groß oder klein ist.

2. Was ist das Signifikanzniveau?

3. Ob der Test ein zweiseitiger Test oder ein einseitiger Test ist.

(vii) Fehler bei der Schlussfolgerung:

Während die Nullhypothese akzeptiert oder abgelehnt wird, besteht die Möglichkeit, zwei Arten von Fehlern zu begehen, und die Forscher können damit rechnen.

Was als Fehler vom Typ I und Typ II bezeichnet wird, kann nachstehend erläutert werden:

Typ I Fehler:

Solche Fehler werden begangen, wenn wir eine Nullhypothese ablehnen, indem wir einen Unterschied als signifikant markieren, obwohl es keinen echten Unterschied gibt. Angenommen, der Unterschied zwischen zwei Populationsmitteln (M pop - M pop = 0) ist tatsächlich Null. (Zum Beispiel können Jungen und Mädchen in Bezug auf die meisten mentalen Tests als die gleiche Bevölkerung betrachtet werden). Wenn das Testen der Signifikanz von zwei Stichprobenmitteln eine Tatsache widerspiegelt, dass der Unterschied in der Bevölkerungszahl signifikant ist, legen wir einen Typ-I-Fehler fest.

Typ II Fehler:

Solche Fehler werden begangen, wenn wir eine Nullhypothese akzeptieren, indem wir einen Unterschied als nicht signifikant markieren, obwohl es einen echten Unterschied gibt. Angenommen, es gibt einen echten Unterschied zwischen den beiden Bevölkerungsmitteln.

Wenn unser Test der Signifikanz, der auf die beiden Stichprobenmittel angewendet wird, uns zu der Annahme führt, dass der Unterschied in den Bevölkerungsmitteln nicht signifikant ist, begehen wir einen Fehler vom Typ II.

Es können verschiedene Vorsichtsmaßnahmen getroffen werden, um beide Arten von Fehlern zu vermeiden. Wenn wir ein niedriges Signifikanzniveau einrichten (P ist größer als 0, 05), erhöhen wir die Wahrscheinlichkeit von Fehlern des Typs I; Wenn wir dagegen ein hohes Signifikanzniveau einstellen (P ist kleiner als 0, 05), sind die Fehler des Typs I geringer. Die Möglichkeit, irrtümliche Schlüsse der Sorte Typ II zu ziehen, wird verbessert, wenn wir einen sehr hohen Signifikanzgrad festlegen.

(viii) beidseitige und einseitige Tests der Signifikanz:

In der Nullhypothese können Unterschiede zwischen den erhaltenen Mitteln (dh M 1 - M 2 ) entweder plus oder minus sein. Bei der Bestimmung der Wahrscheinlichkeiten nehmen wir beide Enden der Stichprobenverteilung.

(ix) kritisches Verhältnis (CR):

Das kritische Verhältnis (CR) wird ermittelt, indem die Differenz zwischen den Abtastwerten durch ihren Standardfehler (CR = D / SE D ) dividiert wird. Wenn Ns der Stichproben groß sind (30 oder mehr ist "groß"), ist bekannt, dass die Verteilung der CRs um den wahren Unterschied zwischen dem Populationsmittel herum normal ist, wobei t ein kritisches Verhältnis ist, in dem eine genauere Abschätzung von σD möglich ist wird eingesetzt. Die Stichprobenverteilung von t ist nicht normal, wenn N klein ist (beispielsweise weniger als 30), t ein CR ist; aber alle CRs sind nicht ts.

Zweiseitiger Test:

1. Beim zweiseitigen Test berücksichtigen wir beide Endpunkte der Normalkurve.

2. Im Fall einer alternativen Alternativhypothese führen wir einen zweiseitigen Test durch.

3. Beispiel:

Bestimmte Jungen in einem Beruf werden einem Interessentest unterzogen. Trainingsunterricht und für bestimmte Jungen im Lateinunterricht. Ist der mittlere Unterschied zwischen den beiden Gruppen auf der 0, 05-Ebene signifikant?

4. Der Mittelwert der Stichprobe weicht in beiden Richtungen von M pop in die Richtung + oder - ab.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. Wert, um signifikant zu sein:

1, 96 bei 0, 05

2, 58 bei 0, 01

7. Der Bereich der Zurückweisung wird an beiden Enden (Endstücken) der Normalkurve aufgeteilt (dh 05 in 0, 025 und 0, 025, 01 in 0, 005 und 0, 005).

Einseitiger Test:

1. Wir müssen eine Größe berücksichtigen, dh links oder rechts der Normalkurve.

2. Bei direktionaler Alternativhypothese machen wir einen einseitigen Test, nämlich M 1 > M 2 . In einem solchen Fall ist die Richtung sehr einseitig.

3. Beispiel:

Zehn Probanden erhalten fünf aufeinanderfolgende Spuren nach einem Ziffernsymboltest, von dem nur die Bewertungen für die Spuren 1 und 5 angezeigt werden. Ist der mittlere Gewinn von der ersten bis zur abschließenden Studie signifikant?

4. Der Stichprobenmittelwert weicht in einer Richtung vom Populationsmittelwert ab.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 oder M 1 <m 2

6. Wert, um signifikant zu sein:

1, 62 bei 0, 05

2, 33 auf 0, 01

7. Es gibt einen Ablehnungsbereich am rechten Ende der Verteilung oder am linken Ende der Verteilung.