Probleme und Verfahren bei der Jobauswahl

Bevor mit einer Untersuchung der grundlegenden Auswahlmodelle begonnen wird, die dem Psychologen zur Verfügung stehen, muss ein kurzer Blick auf das allgemeine Multiple-Prediction-Modell erfolgen. Dieses Modell wird normalerweise als multiples Regressionsmodell bezeichnet. Im allgemeinen Vorhersagemodell entwickeln wir eine Regressionslinie, um die Menge der Datenpunkte, die durch die Punktzahlen der Personen definiert werden, auf einen Prädiktor (die x-Achse oder die Abszisse) und das Kriterium (das y-Achse oder Ordinate).

Abbildung 3.1 zeigt eine solche Situation. Die Regressionsgerade in Abbildung 3.1 ist eine gerade Linie und befindet sich so, dass die Summe der 'quared Abstände von jedem Punkt zur Linie (die parallel zur y-Achse verläuft) so klein wie möglich ist. Wir verwenden eine am besten passende gerade Linie, da wir eine lineare Beziehung zwischen x und y angenommen haben.

Die Grundformel für eine gerade Linie lautet

y = a + bx

Wobei y = vorhergesagte Punktzahl nach Kriterium ist

a = eine Konstante, die den Punkt angibt, an dem die Regressionslinie die y-Achse kreuzt

b = Steigung der Linie, dargestellt durch ∆y / ∆x oder die für eine entsprechende Änderung von x beobachtete Änderung von y

x = beobachtete Punktzahl am Prädiktor

Daher erscheint das grundlegende Regressionslinienmodell wie in Abbildung 3.2 gezeigt.

Beachten Sie, dass in Abbildung 3.2 die Regressionsgerade die y-Achse mit einem Wert von 2 kreuzt. Daher ist a = 2. Beachten Sie außerdem, dass für jede 2-Einheiten-Erhöhung in x eine entsprechende 1-Einheiten-Erhöhung in y vorliegt. Also ist ∆y / ∆x = 1/2 = 0, 5 = b. Die Regressionsgleichung wird dann

y = 2 + 0, 5x

Bei einem beliebigen x-Wert haben wir eine Regressionsgerade, mit der wir die ay-Punktzahl entsprechend vorhersagen können. Wenn x beispielsweise 8 wäre, dann

y = 2 + 0, 5 (8)

= 2 + 4

= 6

Zusammenfassend lässt sich sagen: Im Fall eines einzelnen Prädiktors berechnet man zu den beobachteten Punkten eine am besten passende gerade Linie, wobei der Ausdruck "beste Anpassung" bedeutet, dass die Summe der quadrierten Abweichungen der beobachteten Werte um die Linie ein Minimum darstellt.

Die Formeln, die zur Berechnung der Konstanten a und b erforderlich sind, die diese am besten passende Linie definieren, werden als Formeln der kleinsten Quadrate bezeichnet und lauten wie folgt:

Die Formel für b ist ein Verhältnis der Kovarianz zwischen Prädiktor und Kriterium und der Gesamtvariation im Prädiktor. Wenn die Kriteriumsvarianz und die Prädiktorvarianz gleich sind, dann ist b = r oder die Steigung der Regressionsgerade ist gleich dem Korrelationskoeffizienten.

Zwei Prädiktoren:

Es ist logisch anzunehmen, dass, wenn der Prädiktor X 1 zur erfolgreichen Vorhersage von Kriteriumscores beitragen kann, und falls Prädiktor X 2 auch zur erfolgreichen Vorhersage von Kriteriumscores beitragen kann, die Verwendung beider Prädiktoren eine bessere Gesamtvorhersage als die Verwendung von beidem zulassen sollte Prädiktor individuell. Das Ausmaß, in dem die beiden Prädiktoren (in Kombination) die Vorhersagbarkeit verbessern, hängt jedoch von mehreren Faktoren ab, von denen der wichtigste die Korrelation zwischen den beiden Prädiktoren selbst ist.

Betrachten Sie zum Beispiel die Situation, in der zwei Prädiktoren im Wesentlichen mit einem Kriterium korrelieren, jedoch nicht miteinander korrelieren, wie folgt:

Offensichtlich kann eine große Menge zusätzlicher Kriteriumsvarianz erklärt werden, indem Prädiktor 2 zusammen mit Prädiktor 1 verwendet wird. Die kombinierte Beziehung zwischen zwei oder mehr Prädiktoren und einem Kriterium wird als Mehrfachkorrelation bezeichnet und hat das Symbol R. Wie im Fall von r & sub2; der Wert von R ”stellt die Gesamtmenge der Kriteriumsvarianz dar, die durch Verwendung mehrerer Prädiktoren erklärt werden kann. Wenn die Prädiktoren 1 und 2 nicht miteinander korreliert sind, kann gezeigt werden, dass der quadrierte Mehrfachkorrelationskoeffizient eine additive Funktion der einzelnen quadrierten Korrelationskoeffizienten ist

R 2 c . 12 = r 2 1c + r 2 2c (3.1)

Wenn also (die Interkorrelation der Prädiktoren) Null ist, dann ist die Mehrfachvalidität im Quadrat die Summe der Einzelgültigkeiten im Quadrat.

Wenn zwei Prädiktoren miteinander korrelieren, werden die Dinge etwas komplexer. Stellen Sie sich eine Situation vor (wie im folgenden Diagramm), in der jeder Prädiktor eine erhebliche individuelle Gültigkeit hat, aber auch r 12 ziemlich groß ist.

Aufgrund der gegenseitigen Korrelation zwischen diesen Prädiktoren zeigt das Diagramm, dass der Überlappungsbetrag zwischen Prädiktor 2 und dem Kriterium in zwei Teile unterteilt werden kann: den für Prädiktor 2 eindeutigen Bereich und den mit Prädiktor 1 gemeinsam genutzten Bereich Ein zweiter Prädiktor in dieser Situation erlaubt es, mehr Kriteriumsvarianz zu berücksichtigen, als dies mit dem Prädiktor 1 allein möglich wäre, aber die gesamte von 2 vorhergesagte Kriteriumsvarianz ist keine neue Varianz. Daher kann eine allgemeine Regel für mehrere Prädiktoren angegeben werden.

Wenn alle anderen Dinge gleich sind, wird die Gesamtvorhersage durch die gleichzeitige Verwendung beider Prädiktoren umso weniger verbessert, je höher die Korrelation zwischen den Prädiktoren ist. Der Extremfall wäre natürlich die Situation, in der die Prädiktoren perfekt korreliert waren, und wir hätten keine zusätzlichen Kriteriumsabweichungen, die durch das Hinzufügen von Prädiktor 2 zu unserer Auswahlbatterie erklärt werden.

Bei zwei Prädiktoren, die miteinander korrelieren, können wir R 2 als Funktion der separaten Gültigkeiten und der Größe der Wechselbeziehung zwischen Prädiktoren mit der Formel 2 ausdrücken

R 2 c . 12 = r 2 1c + r 2 2c - 2r 12 r 1c r 2c / 1 - r 2 12 (3.2)

Wenn r 12 = 0 ist, reduziert sich die Formel 3.2 auf

R 2 c . 12 = r 2 1c + r 2 2c

Welches ist Formel 3.1.

Eine ausführlichere Darstellung des Einflusses der Prädiktor-Interkorrelation auf die Größe der mehreren Korrelationskoeffizienten kann aus Tabelle 3.1 erhalten werden, wo Beispiele für R- und R 2 -Werte für Paare von Prädiktoren mit Gültigkeiten von 0, 30, 0, 50 und 0, 70 angegeben sind unter hypothetischen Bedingungen von 0, 00, 0, 30 und 0, 60 Interkorrelation. Abbildung 3.3 zeigt den allgemeinen Trend anhand der Daten in Tabelle 3.1. Die Moral für den Psychologen ist offensichtlich - vermeiden Sie es, Prädiktoren zu verwenden, die dazu neigen, stark miteinander in Beziehung zu stehen.

Vorhersagegleichungen:

Die Prädiktionsgleichung in einer Zwei-Prädiktorsituation ist eine Erweiterung des Ein-Prädiktormodells. Die allgemeine Form der Gleichung lautet

y = a + b 1 x 1 + b 2 x 2 (3, 3)

Dies ist die Gleichung für eine Ebene anstelle einer geraden Linie. Für den mit der Geometrie vertrauten Leser zeigt Abbildung 3.4 eine dreidimensionale Zeichnung der Beziehungen zwischen den Variablen x 1, x 2 und y entsprechend Gleichung 3.3. Es stehen Formeln zur Verfügung, mit denen die Konstanten a, b berechnet werden können und die die am besten passende Regressionsebene ergeben. Sobald diese Konstanten bestimmt wurden, kann die resultierende Gleichung verwendet werden, um Leistungsvorhersagen für neue Bewerber zu treffen, wenn ihre Bewertung anhand der einzelnen Prädiktoren erfolgt.

Angenommen, es liegen Daten zu 100 Männern vor, die während eines bestimmten Monats für Job X eingestellt wurden. Dazu gehören Ergebnisse in zwei Tests sowie Kriteriendaten nach einem Zeitraum von sechs Monaten. Diese Daten können analysiert werden, um die Werte für a, b 1 und bi zu bestimmen, die die Beziehungen zwischen den Variablen am besten beschreiben.

Angenommen, die folgende Gleichung war das Endergebnis:

y = 2 + 0, 5 × 1 + 0, 9 × 2 (3, 4)

Diese Gleichung besagt, dass das wahrscheinlichste Kriterium für jede Neueinstellung der Hälfte seiner Punktzahl in Test 1 plus neun Zehntel seiner Punktzahl in Test 2 plus zwei entspricht. Wenn also ein neuer Bewerber in Test 1 20 und in Test 2 30 Punkte erzielt, wäre seine voraussichtliche Leistung nach Ablauf von sechs Monaten ab dem Zeitpunkt der Einstellung der Fall

= 2 + 0, 5 (20) + 0, 9 (30)

= 2-t-10 + 27

= 39

Die Erweiterung des Zwei-Prädiktor-Modells auf ein k-Prädiktor-Modell, bei dem k eine große Anzahl möglicher Voraussagen des Berufserfolgs ist, ist konzeptionell nicht allzu schwierig. Unser Modell erweitert sich zur Form

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 +… + b k x k (3, 5)

Die Berechnungsprozeduren zum Lösen der Werte der kleinsten Quadrate aller Konstanten in einer solchen Gleichung werden jedoch ziemlich komplex, es sei denn, man verfügt über Computereinrichtungen. Der Leser wird auch darauf hingewiesen, dass in allen vorangegangenen Diskussionen implizit die Annahme einer linearen Welt vorlag, dh alle Beziehungen zwischen Variablenpaaren sind lineare. Es ist möglich, das multiple Regressionsmodell zu ändern, um diese Annahme zu vermeiden. Dies würde jedoch den Rahmen dieses Buches sprengen.

Moderatoren:

Eines der wichtigeren Konzepte in der Auswahl- und Platzierungstheorie ist das Konzept der Moderatorvariablen. Mitunter als Bevölkerungssteuervariable bezeichnet, kann eine Moderatorvariable als eine beliebige Variable angesehen werden, die bei systematischer Variation einen Einfluss auf die Größe der Beziehung zwischen zwei oder mehreren anderen Variablen hat.

Vielleicht wird ein hypothetisches Beispiel (Abbildung 3.15), wie ein Moderator funktionieren könnte, dazu dienen, seinen Einfluss auf den Auswahlprozess zu veranschaulichen. Das obere Streudiagramm zeigt eine allgemeine Gültigkeit von 0, 50 zwischen dem Prädiktor und einem Kriterium. Die im Streudiagramm dargestellte „Bevölkerung“ umfasst jedoch beide Geschlechter, dh Männer und Frauen werden zur Bestimmung der Gültigkeit in Gruppen zusammengefasst. Sogar eine zufällige Untersuchung des oberen Streudiagramms zeigt an (wenn Männer und Frauen anders codiert sind als hier), dass sich das für Männer beobachtete Ergebnismuster von dem für Frauen beobachteten unterscheidet.

Um ein klareres Bild davon zu erhalten, wie sie sich unterscheiden, zeigen die beiden unteren Streudiagramme in Abbildung 3.15 die Prädiktor-Kriteriumsbeziehungen getrennt für Männer und für Frauen. Jetzt ist der Unterschied auffällig. Für die Männer beobachten wir eine hohe positive Beziehung, die eine Gültigkeit von 0, 80 ergibt. Für die Frauen hingegen sehen wir, dass es praktisch keinen Zusammenhang zwischen Prädiktor und Kriterium gibt. Die Gültigkeit für Frauen beträgt 0, 05.

Die Moderatorvariable im obigen Beispiel ist natürlich die Variable des Geschlechts. Die Beziehung zwischen Prädiktor und Kriterium wird durch Variation des Moderators drastisch beeinflusst. Die Frage "Was ist die Gültigkeit meines Prädiktors" wird deutlich komplexer. Was zunächst als mäßig respektable Gültigkeit erschienen ist, hat sich in zwei recht unterschiedliche und voneinander getrennte Gültigkeiten verwandelt - eine sehr hohe und eine sehr niedrige.

Ein Name für diese letzteren Gültigkeiten kann bedingte Gültigkeiten sein, d. H. Die Gültigkeit des Prädiktors, vorausgesetzt, dass die Bevölkerung aus Frauen besteht oder wenn die Bevölkerung aus Männern besteht. Ein interessantes Merkmal von Moderatorvariablen besteht darin, dass ein Moderator keine direkte Beziehung zu entweder dem Prädiktor oder der Kriteriumvariablen (d. H. R ym und r im = 0) haben muss.

Beispiele für Moderatoren:

Tatsächliche Beispiele für Moderatoren wurden in einer Reihe von Forschungsuntersuchungen gefunden. Vroom (1960) fand zum Beispiel ziemlich ausgeprägte Moderatoreffekte, wobei der Motivationsgrad von Managern und Vorgesetzten als moderierende Variable verwendet wurde. Alle untersuchten Männer waren entweder Mitarbeiter des Chicagoer oder New Yorker Werks eines nationalen Zustelldienstunternehmens, das sich auf die Lieferung von Kleinpaketen und Paketen von Kaufhäusern und anderen Einzelhandelsgeschäften in private Wohnhäuser spezialisierte. Daten aus der Studie, die das Moderatorenkonzept am besten veranschaulichen, sind in Tabelle 3.4 angegeben.

Alle Supervisoren wurden in drei Gruppen eingeteilt, basierend auf ihrem bewerteten Motivationsgrad, wobei eine Kombination aus mehreren in der Untersuchung ermittelten Motivationsindizes verwendet wurde. Die Gültigkeit eines Tests der Fähigkeit zum nonverbalen Denken wurde dann für jede der vier verschiedenen Arten von Aufsichtsbewertungen dieser Männer erhalten.

Dies wurde auf jeder Motivationsebene separat durchgeführt. Wie Tabelle 3.4 zeigt, war der Test anscheinend ein durchaus gültiger Prädiktor dafür, wie hoch ein Mann von seinem Vorgesetzten bewertet würde, wenn nur Männer mit hoher Motivation in Betracht gezogen würden. Wenn wir die Motivation systematisch variieren, indem wir zu den Gruppen mit nur moderaten oder niedrigen Motivationsebenen wechseln, sehen wir eine entsprechende systematische Veränderung der Beziehung zwischen Test und Kriterium. Je niedriger die Motivation des Mitarbeiters ist, desto geringer ist die Gültigkeit des Prädiktors. Die Gültigkeit wird für die Gruppen mit niedriger Motivation sogar negativ.

Weitere Beispiele für Moderatoren finden sich in Studien von Dunnette und Kirchner (1960) und Ghiselli und seinen Mitarbeitern (1956, 1960). Die Arbeit von Dunnette und Kirchner war in erster Linie darauf ausgerichtet, auf Job bezogene Moderatoren zu identifizieren, bei denen Personen zu Jobs zusammengefasst werden, die hinsichtlich ihrer Verantwortlichkeiten ähnlich sind, um eine maximale Vorhersage innerhalb jeder Jobgruppe zu erhalten.

Die Methode von Ghiselli kann als "variablenfreies" Moderatorsystem bezeichnet werden. Die Personen werden einfach danach gruppiert, wie gut ihr Erfolg ohne direkten Bezug auf eine externe Variable vorhergesagt werden kann. Fredericksen und Gilbert (I960) haben auch an Moderatoren geforscht, um zu bestimmen, inwieweit die Wirkung eines Moderators im Laufe der Zeit wahrscheinlich konsistent ist. Sie fanden heraus, dass ein in einer Studie von 1954 identifizierter Moderator (Fredericksen und Melville, 1954) noch in einem Follow-up von 1960 tätig war.

Moderne versus traditionelle Selektionstheorie:

Das Konzept der Moderatorvariablen verdeutlicht den Modem-Trend bei der Auswahl und Platzierung. Traditionell waren Auswahl und Validierung Probleme, die als am besten gelöst angesehen wurden, indem einfach ein Kriterium erstellt wurde, das sich als zuverlässig erwies, und ein Prädiktor, der dieses Kriterium am besten vorhersagen konnte.

Die Betonung lag fast vollständig auf der Etablierung einer hohen Gültigkeit, wobei wenig oder gar nicht daran gedacht wurde, die vielen zusätzlichen Variablen zu untersuchen, die bei Variation zu der erhaltenen Korrelation beitragen oder sich davon entfernen könnten. Das allgemeine Motto, das allzu oft für die Auswahlmethodik typisch war, war der Slogan "Wenn es funktioniert, benutzen Sie es!"

Ohne Frage war diese Politik für ganz andere Entwicklungen in der Arbeitspsychologie verantwortlich. Erstens hat es wahrscheinlich dazu beigetragen, dass Psychologen in die Industrie aufgenommen wurden. Das Management ist im Allgemeinen auf positive Ergebnisse ausgerichtet, die durch eine verbesserte Auswahl dargestellt werden.

Leider ist diese Orientierung jedoch wahrscheinlich auch dafür verantwortlich, dass die Gültigkeit der Vorhersage in den letzten 50 Jahren (wenn überhaupt) nicht wesentlich zugenommen hat - ein ziemlich beunruhigender Kommentar zu den Bemühungen von Psychologen, die sich mit dieser Art von Arbeit befassen.

Ghiselli (1955) gab 1955 in einer Übersicht über eine Vielzahl von Validitätsstudien an, dass es tatsächlich ein ungewöhnliches Ereignis ist, einen Validitätskoeffizienten von 0, 50 oder besser zu erhalten. Abbildung 3.16 zeigt die von Ghiselli vorgestellten Häufigkeitsverteilungen von Gültigkeitskoeffizienten unterschiedlicher Größen für verschiedene Arten von Jobs. Beachten Sie, dass nur bei der Verteilung von Gültigkeiten für Büroangestellte, die Intelligenztests als Prädiktoren und Leistungsindikatoren als Kriterien verwenden, eine große Anzahl von Gültigkeiten über 0, 50 liegt.

Das derzeitige Interesse an Moderatoren ist repräsentativ für einen breiteren und etwas raffinierteren Ansatz bei der Auswahl. Es lässt sich darauf zurückführen, dass Toops (1948) die Psychologen aufforderte, die Möglichkeit in Betracht zu ziehen, dass durch systematische Stratifizierung von Personen (z. B. ArbeiterInnen) nach persönlichen Variablen die Vorhersage verbessert werden kann. Seine Klassifizierungsmethode, die er als Zusatzverfahren bezeichnet, ist der Vorläufer der Moderatoren.

Dunnette's Auswahlmodell:

Vielleicht lässt sich die derzeitige Sicht auf die Auswahlmethodik am besten durch das von Dunnette (1963) vorgeschlagene Auswahlmodell darstellen. Dieses Modell ist in dem in Abbildung 3.17 dargestellten Diagramm dargestellt und soll das in der Auswahlsituation vorhandene Labyrinth von Komplexitäten und Zusammenhängen aufzeigen. Das Modell kann als mehr als ein Versuch angesehen werden, lediglich auf die dynamische Natur der Auswahl hinzuweisen - es ist auch ein Anlass für Psychologen, diese Dynamik zu nutzen und sie optimal zu nutzen, um die Vorhersagbarkeit zu verbessern.

Man kann wahrscheinlich den Standpunkt des Modells anhand der genauen Beschreibung verstehen, die Dunnette (1963, S. 318) verwendet:

Beachten Sie, dass das modifizierte Vorhersagemodell die komplexen Interaktionen berücksichtigt, die zwischen Prädiktoren und verschiedenen Prädiktorkombinationen, unterschiedlichen Gruppen (oder Typen) von Individuen, unterschiedlichen Verhaltensweisen am Arbeitsplatz und den Konsequenzen dieser Verhaltensweisen in Bezug auf die Ziele der Organisation auftreten können . Das Modell erlaubt die Möglichkeit, dass Prädiktoren für die Vorhersage des Verhaltens verschiedener Untergruppen von Individuen differenziell nützlich sind.

Darüber hinaus zeigt sich, dass ein ähnliches Arbeitsverhalten durch recht unterschiedliche Interaktionsmuster zwischen Gruppierungen von Prädiktoren und Individuen vorhersagbar sein kann oder sogar, dass das gleiche Leistungsniveau der Prädiktoren zu unterschiedlichen Mustern des Arbeitsverhaltens für verschiedene Individuen führen kann. Schließlich erkennt das Modell die lästige Realität, dass dasselbe oder ähnliche Arbeitsverhalten nach Durchlaufen des Situationsfilters zu recht unterschiedlichen organisatorischen Konsequenzen führen kann.

Der aktuelle Trend bei der Auswahl, der durch das Bewusstsein der Moderatoren und des Auswahlmodells von Dunnette dargestellt wird, sollte sowohl hinsichtlich der Effizienz der Auswahl als auch hinsichtlich des Verständnisses der Dynamik der genauen Vorhersage Fortschritte erzielen.

Unterdrücker-Variablen:

Keine Erörterung der Auswahl wäre ohne die Erwähnung von Unterdrückervariablen vollständig. In gewissem Sinne ist eine Suppressor-Variable einer Moderator-Variablen ähnlich, da sie als „eine Variable definiert ist, die sich auf die Größe einer gegebenen Prädiktor-Kriterium-Beziehung auswirken kann, selbst wenn sie wenig oder keine Beziehung zu der Kriterium-Variable selbst hat. ”

Die Dynamik einer Unterdrückungsvariablen in der Vorhersage lässt sich am besten durch eine erneute Betrachtung des Konzepts einer partiellen Korrelation und des zugehörigen Teils, der semi-partiellen Korrelation, verstehen. Wenn man zwei Prädiktoren und ein Kriterium hatte, die wie hier gezeigt miteinander korreliert wurden partielle Korrelation zwischen dem Kriterium und dem Prädiktor x, der r 1c ist. 2, wurde als die Korrelation zwischen x 1 und C definiert, nachdem die Wirkungen von x 2 von beiden getrennt wurden, so

Angenommen, wir möchten nur die Auswirkungen von X2 aus dem Kriterium entfernen, bevor die Korrelation berechnet wird. Eine solche Korrelation wird als semi-partielle oder teilweise Korrelation bezeichnet. Zum Beispiel könnten wir an der Korrelation zwischen Intelligenztestwerten (unser Prädiktor x 1 ) und dem endgültigen Qualifikationsniveau am Ende eines Typisierungs-Trainingsprogramms (Kriterium) interessiert sein, wobei x 2 das anfängliche Qualifikationsniveau aller Mitarbeiter in Bezug auf angeben könnte ihre Schreibgeschwindigkeit vor dem Training. Daher möchten wir die Auswirkungen der anfänglichen Fertigkeitsstufe auf die endgültige Leistung beseitigen, bevor die Gültigkeit unseres Intelligenztests berechnet wird.

Unsere semi-partielle Korrelation wird jetzt zu:

Der Mechanismus einer Suppressor-Variablen ist identisch mit dem oben gezeigten, mit Ausnahme von (1). Im Allgemeinen hat die Variable x 2 (wenn überhaupt) nur eine geringfügige. Die Beziehung zu dem Kriterium und (2) man ist daran interessiert, die Auswirkungen des Prädiktors x 1 zu entfernen.

Die allgemeine Situation kann daher dargestellt werden als:

Man kann nicht mit vollständiger Sicherheit vorhersagen, ob partielle oder semi-partielle Korrelationen größer oder kleiner als die zwischen den Variablen bestehende einfache Korrelation sein werden, da die Größe sowohl des Zählers als auch des Nenners durch den Partizipationsprozess beeinflusst wird. Dies ist nur dann der Fall, wenn die herausgetrennte Variable nur mit einer der beiden anderen Variablen zusammenhängt, wie im Fall des Suppressors. In einer solchen Situation wird anschließend nur der Nenner beeinflusst (die Varianz wird entfernt), und die resultierende semi-partielle Korrelation ist größer als die einfache unparteiische Korrelation zwischen Variablen.

Kreuzvalidierung:

Ein Merkmal der meisten Mehrfachvorhersageauswahlsysteme besteht darin, dass man bei ihrer Entwicklung in der Regel von der zufälligen Variation profitiert, die in der Stichprobe von Mitarbeitern besteht, die für Validierungszwecke verwendet werden. Dies gilt insbesondere für das Multiple-Regressionsmodell, gilt aber auch für das Multiple-Cut-Off-Verfahren. Da das multiple Regressionsmodell die Eigenschaften der kleinsten Quadrate aufweist, dh wir minimieren absichtlich die Fehler bei der Vorhersage unserer speziellen Stichprobe. Wenn wir nun unsere Gleichung auf eine neue Stichprobe (aus derselben Population) anwenden, werden wir unsere Vorhersage wahrscheinlich nicht finden so effizient wie vorher.

Somit ist unser berechneter R 2 ein zu hoher Wert für die zukünftige Gültigkeit unseres Vorhersagesystems, da die Verwendung unserer Gleichung für Zwecke der Vorhersage automatisch die Anwendung auf neue Stichproben von Arbeitern impliziert. Dieser erwartete Abfall von R 2 ist in der Statistik als Schrumpfungsproblem bekannt und kann am besten durch Untersuchen von Abbildung 3.18 veranschaulicht werden.

In Abbildung 3.18 haben wir zwei Beispiele von Individuen. Jede repräsentiert eine Zufallsstichprobe aus derselben Population. Zum Beispiel könnte Probe A alle Bewerber für Job X während der ungeradzahligen Monate darstellen, und Probe B könnte alle Bewerber während der geraden Monate eines bestimmten Jahres darstellen.

Es wäre höchst ungewöhnlich, selbst bei einer sehr großen Anzahl von Antragstellern in jeder Probe, dass die beiden Proben hinsichtlich ihrer Streudiagramme identisch sind. Da zu erwarten ist, dass ihre Streudiagramme aufgrund eines Abtastfehlers variieren, kann auch erwartet werden, dass die Korrelation zwischen Prädiktor und Kriterium (Gültigkeit) etwas variiert, ebenso wie die Regressionsgleichung, die für jede Probe berechnet wird.

Nehmen wir an, wir haben die für die Probe A berechnete Regressionsgleichung verwendet und zur Vorhersage der Ergebnisse aus Probe B herangezogen. Bei der Minimierung der Verwendung der A-Linie mit der Probe B konnten wir offensichtlich nicht so gut arbeiten wie bei der B-Regressionslinie. Die B-Linie minimiert per Definition Σd 2 für diese Probe. Jede andere Zeile hat daher einen größeren Fehler. Daher muss R 2 entsprechend reduziert werden.

Es gibt Formeln, mit denen Sie das Ausmaß der Schrumpfung schätzen können, das Sie erwarten können, wenn Sie diese Gleichung für eine neue Probe verwenden. Eine solche Formel ist

R 2 = 1 - [(1 - R2) n-1 / n - k - 1]

Woher

R2 = geschrumpfte multiple Korrelation im Quadrat

R 2 = Mehrfaches Korrelationsquadrat, erhalten aus Validierungsstichprobe

n = Anzahl der Personen in der Validierungsstichprobe

k = Anzahl der Prädiktoren in der Regressionsgleichung

Es ist jedoch am besten, die Gleichung gegenseitig zu validieren, indem Sie eine zweite Probe erhalten und ausprobieren, wie gut sie vorhersagt. Wenn es so aussieht, als würde ein sehr großer Tropfen erscheinen, möchte man vielleicht die Gleichung überarbeiten (vielleicht indem man beide Samples in einer Gruppe zusammenfasst). Eine große Schrumpfung wird am häufigsten festgestellt, wenn die Probengrößen klein sind und / oder die Anzahl der Prädiktoren relativ zur Probengröße groß ist.

Mosier (1951) hat eine Reihe von Arten der Kreuzvalidierung diskutiert, die in Abhängigkeit vom Design der Studie und davon, ob man nur auf eine neue Probe verallgemeinern will, oder ob breitere Verallgemeinerungen der Vorhersagegleichung gewünscht werden (z. B.), diskutiert werden kann nach verschiedenen Geschlechtern, unterschiedlichen Kriterien usw.). Ersteres wird als Fall der Gültigkeitsverallgemeinerung bezeichnet. Letzteres ist ein Fall der Verlängerung der Gültigkeit. Im letzteren Fall wäre natürlich ein größerer Schrumpf zu erwarten, und für Fälle der Gültigkeitsverallgemeinerung gilt die Formel 3.9 auf%.