Empirische Regel - Definition, Formel, Verwendung in der Statistik?

Was ist die empirische Regel in der Statistik?

Die empirische Regel in der Statistik besagt, dass fast alle (95%) der Beobachtungen in einer Normalverteilung innerhalb von 3 Standardabweichungen vom Mittelwert liegen. Dies ist eine sehr wichtige Regel und hilft bei der Prognose.

Formel

Die Formel zeigt den vorhergesagten Prozentsatz der Beobachtungen, die innerhalb jeder Standardabweichung vom Mittelwert liegen.

Die Regel besagt, dass:

  • 68% der Beobachtungen liegen innerhalb von +/- 1 Standardabweichung vom Mittelwert
  • 95% der Beobachtungen liegen innerhalb von +/- 2 Standardabweichungen vom Mittelwert
  • 7% der Beobachtungen liegen innerhalb von +/- 3 Standardabweichungen vom Mittelwert

Wie benutzt man?

Dies wird im Prognosetrend eines Datensatzes verwendet. Wenn der Datensatz umfangreich ist und es schwierig wird, die gesamte Bevölkerung zu untersuchen, kann die empirische Regel auf die Stichprobe angewendet werden, um eine Schätzung der Reaktion der Daten in der Bevölkerung zu erhalten, wenn Sie aufgefordert werden, das Durchschnittsgehalt aller zu ermitteln die Buchhalter in den USA. Dann ist das eine schwierige Aufgabe, da die Bevölkerungszahl enorm ist. In diesem Fall können Sie beispielsweise 90 Beobachtungen zufällig aus der gesamten Population auswählen.

Jetzt haben Sie also 90 Gehälter. Sie müssen den Mittelwert und die Standardabweichung der Beobachtungen ermitteln. Wenn die Beobachtung einer Normalverteilung folgt, kann dies angewendet werden, und es kann eine Schätzung des Gehalts aller Buchhalter in den USA vorgenommen werden.

Angenommen, das Durchschnittsgehalt der Stichprobe beträgt 90.000 US-Dollar. Die Standardabweichung beträgt 5.000 US-Dollar. Von der Gesamtbevölkerung beziehen 68% der Buchhalter ein Gehalt zwischen +/- 1 Standardabweichungen vom Mittelwert. Der Mittelwert beträgt 90.000 USD und die Standardabweichung 5.000 USD. So werden 68% aller Buchhalter in den USA im Bereich von 90.000 USD +/- (1 * 5.000 USD) bezahlt. Das liegt zwischen 85.000 und 95.000 US-Dollar

Wenn wir etwas mehr streuen, werden 95% aller Buchhalter in den USA im Bereich der mittleren +/- 2 Standardabweichungen bezahlt. 90.000 USD +/- (2 * 5000). Der Bereich liegt also zwischen 80.000 und 100.000 US-Dollar.

In einem breiteren Bereich beziehen 99,7% aller Buchhalter Gehälter im Bereich von mittleren +/- 3 Standardabweichungen. Das sind 90.000 +/- (3 * 5000). Der Bereich liegt zwischen 75.000 und 105.000 US-Dollar

Sie können deutlich sehen, dass ohne Untersuchung der gesamten Bevölkerung eine Schätzung der Bevölkerung vorgenommen werden könnte. Wenn jemand plant, als Buchhalter in den USA zu arbeiten, kann er leicht erwarten, dass sein Gehalt zwischen 75.000 und 105.000 US-Dollar liegt

Diese Art der Schätzung erleichtert die Arbeit und macht Prognosen für die Zukunft.

Beispiele für empirische Regeln

Herr X versucht, die durchschnittliche Anzahl der Jahre zu ermitteln, die eine Person nach der Pensionierung überlebt, wobei das Rentenalter 60 Jahre beträgt. Wenn die mittleren Überlebensjahre von 50 zufälligen Beobachtungen 20 Jahre und SD 3 betragen, ermitteln Sie die Wahrscheinlichkeit, dass a Person wird eine Rente für mehr als 23 Jahre beziehen

Lösung

Die empirische Regel besagt, dass 68% der Beobachtungen innerhalb einer Standardabweichung vom Mittelwert liegen. Hier beträgt der Mittelwert der Beobachtungen 20.

68% der Beobachtungen liegen innerhalb von 20 +/- 1 (Standardabweichung), was 20 +/- 3 entspricht. Der Bereich liegt also zwischen 17 und 23.

Es besteht eine Wahrscheinlichkeit von 68%, dass das Mindestalter, das eine Person nach der Pensionierung überlebt, zwischen 17 und 23 liegt. Jetzt liegt der Prozentsatz, der außerhalb dieses Bereichs liegt, bei (100 - 68) = 32%. 32 ist auf beiden Seiten gleichmäßig verteilt, was eine Wahrscheinlichkeit von 16% bedeutet, dass die Mindestjahre unter 17 liegen, und eine Wahrscheinlichkeit von 16%, dass die Mindestjahre größer als 23 sind.

Die Wahrscheinlichkeit, dass die Person mehr als 23 Jahre Rente bezieht, beträgt also 16%.

Empirische Regel gegen Chebyshevs Theorem

Die empirische Regel wird auf Datensätze angewendet, die einer Normalverteilung folgen, dh glockenförmig. Bei einer Normalverteilung haben beide Seiten der Verteilung jeweils eine Wahrscheinlichkeit von 50%.

Wenn der Datensatz nicht normal verteilt ist, gibt es eine andere Annäherung oder Regel, die für alle Arten von Datensätzen gilt, nämlich den Satz von Chebyshev. Es sagt drei Dinge:

  • Mindestens 3/4 th aller Beobachtungen liegen innerhalb 2Standard Abweichungen vom Mittelwert. Es ist eine starke Annäherung. Es bedeutet , wenn es 100 Beobachtungen sind, dann 3/4 th der Beobachtungen , die 75 Beobachtungen sind , wird aus dem Mittelwert innerhalb +/- 2 Standardabweichungen liegen.
  • Mindestens 8/9 th aller Beobachtungen liegen innerhalb 3Standard Abweichungen vom Mittelwert.
  • Mindestens 1 - 1 / k 2 aller Beobachtungen liegen innerhalb der K Standardabweichungen vom Mittelwert. Hier wird K als eine beliebige ganze Zahl bezeichnet.

Wann verwenden?

Daten sind wie Gold in der modernen Welt. Es fließen riesige Daten aus verschiedenen Quellen und werden für unterschiedliche Annäherungen oder Prognosen verwendet. Wenn ein Datensatz einer Normalverteilung folgt, zeigt er eine glockenförmige Kurve. dann kann die empirische Regel verwendet werden. Es wird auf Beobachtungen angewendet, um eine Annäherung für die Bevölkerung zu erstellen.

Sobald sich herausstellt, dass die Beobachtungen eine Normalverteilungsstruktur aufweisen, wird die empirische Regel befolgt, um mehrere Wahrscheinlichkeiten der Beobachtungen zu ermitteln. Die Regel ist für viele statistische Prognosen äußerst nützlich.

Fazit

Empirische Regel ist ein statistisches Konzept, das die Wahrscheinlichkeit von Beobachtungen darstellt und sehr nützlich ist, um eine Annäherung an eine große Population zu finden. Es ist immer zu beachten, dass dies Annäherungen sind. Es besteht immer die Möglichkeit, dass Ausreißer nicht in die Verteilung fallen. Die Ergebnisse sind daher nicht korrekt und es sollten Vorsichtsmaßnahmen getroffen werden, wenn gemäß der Prognose gehandelt wird.

Interessante Beiträge...