In der Statistik verwendete Techniken

In diesem Artikel werden wir einige Techniken der Statistik besprechen. Einige der Techniken sind: 1. Die Maße der zentralen Tendenz 2. Variabilität 3. Wahrscheinlichkeit 4. Häufigkeitsverteilung 5. Zeitreihe.

Die Maßnahmen der zentralen Tendenz:

Durchschnitte:

Jedes statistische Maß, das eine Vorstellung von der Position des Punktes gibt, um den sich andere Beobachtungen bündeln, wird als Maß für die zentrale Tendenz bezeichnet. Die am häufigsten verwendete Messung ist der Durchschnittswert oder der arithmetische Mittelwert.

Das tägliche Einkommen von zwei Arbeitern für eine Woche ist wie folgt:

1. Arbeiter Rs 70, 50, 100, 90, 50 Durchschnittseinkommen = Rs 76

2. Arbeiter 200, 250, 50, 300, 150 Durchschnittseinkommen = 190 Rupien

Aus dem obigen Beispiel können wir also schließen, dass der zweite Arbeitnehmer im Durchschnitt mehr verdient als der erste. Das Ziel der Berechnung eines Durchschnitts ist - wie man leicht sehen kann -, die Reihe der Beobachtungen durch einen einzigen Wert zu ersetzen, der als Repräsentant aller Beobachtungen angesehen wird. Aus dem oben angegebenen Beispiel kann man ersehen, dass das arithmetische Mittel ein Wert in der Nähe der Mitte ist und einige der Beobachtungen größer sind als andere, während einige kleiner sind.

Man kann also sagen, dass das arithmetische Mittel der Beobachtungen einer Variablen als Summe der Beobachtungen geteilt durch die Anzahl der Beobachtungen definiert ist.

Für den ersten Arbeiter wurde das arithmetische Mittel wie folgt berechnet:

(Rs 70 + 50 + 100 + 90 + 50) ÷ 5 = Rs 76

Geometrischer Mittelwert (GM) Der geometrische Mittelwert einer Gruppe von Beobachtungen wird als die n-te Wurzel des Produkts aller Beobachtungen definiert. Nehmen wir an, die Beobachtungen sind x 1, x 2, x 3, ..., x n .

GM kann wie folgt berechnet werden:

Dies kann mit Hilfe einer Log-Tabelle berechnet werden.

Modus:

Modus ist definiert als der Wert der Variablen oder Beobachtungen, der am häufigsten auftritt. Wenn beispielsweise die Beobachtungen –2, 9, 6, 2, 8, 2, 2, 7, 2 und 3 sind, wird der Modus als 2 angesehen, was für die maximale Anzahl von Malen, dh 5, aufgetreten ist mal.

Median:

Der Median ist der Wert der mittleren Variablen, wenn die Beobachtungen in aufsteigender oder absteigender Reihenfolge angeordnet sind. Es ist offensichtlich, dass die Hälfte der Werte unter dem Median liegt und die Hälfte der Werte größer ist. Wenn also die Beobachtungen 3, 9, 6, 4, 5, 7 und 10 sind und dann die Werte in aufsteigender Reihenfolge 3, 4, 5, 6, 7, 9 und 10 angeordnet werden, ist der Medianwert der 4. Beobachtung und ist gleich 6.

Wenn jedoch die Anzahl der Beobachtungen gerade ist, gibt es zwei Zwischenwerte, und es ist üblich, das arithmetische Mittel dieser beiden Werte zu verwenden. Wenn zum Beispiel die Beobachtung 10 in den obigen Variablen weggelassen wird, gibt es zwei Werte 5 und 6 mit dem mittleren Wert und der Medianwert ist 5 + 6 ÷ 2 = 5, 5.

Die anderen wichtigen statistischen Werkzeuge zum Messen und Analysieren von Daten und des darin enthaltenen Variabilitätselements umfassen die Berechnung von (i) Range, (ii) semi-inter-quartil-range, (iii) mittlere absolute Abweichung, (iv) Standardabweichung, (v ) Häufigkeitsverteilung (sowohl symmetrisch als auch asymmetrisch).

Symmetrische Verteilung ist durch das Vorhandensein einer Symmetrielinie gekennzeichnet, die das Histogramm in zwei Teile teilt und ein Teil das Spiegelbild des anderen ist. Die meisten Distributionen in Handel und Wirtschaft sind jedoch nicht von dieser Art. Asymmetrische Verteilungen werden auch als verteilte Verteilungen bezeichnet. Schiefe bedeutet mangelnde Symmetrie und schiefe Verteilungen sind durch einen längeren Schwanz auf einer Seite des Histogramms gekennzeichnet.

Messvariabilität:

Arithmetik und geometrische Mittel oder Medianwerte dienen als Grundlage für den Vergleich von zwei oder mehr Populationen oder Beobachtungen. Die anderen Messgrößen der Variabilität oder Abweichung sind jedoch auch wichtig, um den Grad der Abweichung der Beobachtungen auszudrücken. In der Statistik ist Streuung gleichbedeutend mit Variabilität oder Abweichung.

Nachfolgend sind die wichtigsten Messgrößen für die Variabilität aufgeführt:

Angebot:

Die Differenz zwischen den größten und kleinsten Werten einer Reihe von Beobachtungen wird als "Bereich" bezeichnet.

Semi-Inter Quartil Range :

Die Differenz zwischen dem Wert der Beobachtungen im 2. und 3. Quartil wird als Semi-Inter-Quartil-Bereich bezeichnet. Dies beseitigt den Einfluss von sehr niedrigen und sehr hohen Werten der Beobachtungen, von denen es nur wenige gibt.

Mittlere absolute Abweichung:

Mittlere absolute Abweichung bedeutet die Abweichung der Beobachtungen vom arithmetischen Mittel der Beobachtungen.

Beispiel: Beobachtungen sind x 1, x 2 … x n und der arithmetische Mittelwert ist x.

Die Formel lautet:

und daher ist der Durchschnitt

Aber 1 (x 1 - x̅) = 0, wie auch immer der Wert von x 1, x 2, … .x n ist

Daher kann die Formel x (x i - x measure) nicht als Maß für die Variabilität verwendet werden. Diese Schwierigkeit kann vermieden werden, wenn die Zeichen (+ oder -) ignoriert werden. Dies ist logisch, da das Vorzeichen einer bestimmten Abweichung x i - x̅ lediglich angibt, ob die Beobachtung x i links von x oder rechts davon liegt und dies für die Berechnung der Abweichungen vom Mittelpunkt (x) keine Bedeutung hat. von jeder Beobachtung.

Standardabweichung:

Abweichungen der Beobachtungen von ihrem arithmetischen Mittelwert (x̅) können positiv (+) oder negativ (-) sein. In der Statistik geben die Anzeichen für Abweichungen vom arithmetischen Mittel nur die Richtung der Beobachtung von der zentralen Tendenz (x̅) an und werden daher ignoriert. Die negativen Vorzeichen (-) der Abweichung von x können auch vermieden werden, wenn anstelle der absoluten Werte die Quadrate der Abweichungen wie folgt angenommen werden:

Da das Maß der Variabilität in der gleichen Einheit wie die ursprünglichen Beobachtungen liegen sollte, wird die Standardabweichung nach folgender Formel berechnet:

Für eine Häufigkeitsverteilung mit x 1 x 2, …, x n als Mittelwerten der Klassen und f 1 f 2, …, f n als Frequenzen wird die Standardabweichung (SD) durch die folgende Verbesserung der berechnet obige Formel:

Die Standardabweichung ist bei weitem das am häufigsten verwendete Maß für die Variabilität in Statistiken. Es hat viele Eigenschaften, die es zu den am meisten bevorzugten Maß für statistische Probleme machen.

Beispiel:

Die IQ-Stufen von fünf Business Management-Studenten sind wie folgt:

Daher beträgt die Standardabweichung: 13.22

13, 22 ist die Standardabweichung, die in denselben Einheiten wie die Beobachtungen selbst ausgedrückt wird. Der Wert 13.22 ist ein Punkt auf derselben numerischen Skala.

Die obige Standardabweichung wurde aus den Abweichungen einer Bevölkerung von 5 Studenten errechnet. In der Praxis kann die Standardabweichung jedoch häufig nicht aus der Grundgesamtheit berechnet werden, da die Grundgesamtheit die Grundgesamtheit so groß ist, dass normalerweise die Stichprobe zur Berechnung der Abweichung genommen wird.

Bei Probendaten wird die Variabilität anhand der Stichprobenvarianz gemessen und die Standardabweichung anhand der folgenden Formel berechnet:

Es ist zu beachten, dass, da die Probendaten verwendet wurden, 'n' die Stichprobengröße anstelle von 'N' bezeichnet, die die Populationsbeobachtung bezeichnet.

Wahrscheinlichkeitskonzept:

Oft sagen wir in unserem täglichen Leben bestimmte zukünftige Ereignisse mit solchen Worten voraus: "Dies wird wahrscheinlich passieren", "die Wahrscheinlichkeit ist sehr hoch" oder "dies wird aller Wahrscheinlichkeit nach eintreten", mit einer gewissen Ungenauigkeit Aussagen. Diese Aussagen sind weitgehend subjektiv und hängen größtenteils von unserer Fähigkeit ab, ähnliche Situationen in der Vergangenheit zu analysieren. Die Bedeutung des Begriffs der Wahrscheinlichkeit eines Ereignisses und einiger Mittel zur Messung mit statistischen Instrumenten ist für die Geschäftsbanken immens.

Bei der Kreditvergabe an einen Kunden möchte der Bankier die Ausfallwahrscheinlichkeit dieses Kunden erfahren, die anhand der Wahrscheinlichkeitsstudie anhand der statistischen Berechnungen gemessen wird. Obwohl es ziemlich schwierig ist, die Wahrscheinlichkeit auf elementarer Ebene genau zu definieren, kann versucht werden, diese unter Verwendung der Techniken des Zufallsexperiments und der Frequenzdefinition vorherzusagen.

Zufälliges Experiment bedeutet ein Experiment, bei dem alle möglichen Ergebnisse bekannt sind und das unter identischen Bedingungen wiederholt werden kann, eine exakte Vorhersage des Ergebnisses ist jedoch unmöglich. Der Preis einer Ware an verschiedenen Tagen kann als Ergebnis eines zufälligen Experiments betrachtet werden. Die Ergebnisse werden üblicherweise mit E 1, E 2, E 3 …, E n bezeichnet und es wird angenommen, dass sie endlich sind.

Häufigkeitsverteilung:

Wenn das Ergebnis E 1 r mal auftritt, wenn das Zufallsexperiment n-mal wiederholt wird, wird die Wahrscheinlichkeit von E 1 durch das Verhältnis 'r / n' definiert, da die Anzahl der Wiederholungen unendlich erhöht wird. Daher ist die Wahrscheinlichkeit als eine Grenze der relativen Häufigkeit definiert, wenn das Experiment unendlich oft wiederholt wird.

Zeitfolgen:

Eine Reihe von Beobachtungen zu verschiedenen Zeitpunkten einer Variablen - die zeitabhängig ist - bilden eine Zeitreihe. Daher geben solche Beobachtungsreihen die Änderungen oder Variationen einer Größe über einen bestimmten Zeitraum an und werden oft als historische oder chronologische Daten bezeichnet. Für diese Art von Daten ist eine der Variablen die Zeit, die durch 't' dargestellt wird, und die andere, die zeitabhängig ist, wird durch 'Yt' dargestellt.

Zum Beispiel Ernteertrag in verschiedenen Jahreszeiten, Produktion von Stahl in verschiedenen Monaten, vierteljährlicher Export von Tee, Verkauf von Speiseeis in verschiedenen Monaten des Jahres usw. Alle oben genannten Beispiele beziehen sich auf einige wirtschaftliche oder geschäftliche Aktivitäten und eine Reihe von Beobachtungen zu solchen Variablen werden üblicherweise als wirtschaftliche Zeitreihendaten bezeichnet. Ein anderes Beispiel für Zeitreihendaten ist der Niederschlag in Zoll an verschiedenen Tagen des Jahres.

Somit ist klar, dass jede Variable, die zeitabhängig ist, die Zeitreihendaten bildet. Wertvolle Schlussfolgerungen, die von interessierten Kreisen wie Wirtschaft, Bankiers, Industriellen usw. aus den Zeitreihen gezogen werden, führen zur Trendmessung aus den Daten, die ihre Entscheidungen erheblich beeinflussen.