Psychologischer Test

Als psychologischer Test oder psychologisches Testverfahren wird ein Instrument bezeichnet, welches psychische Merkmale (z. B. aktuelle Zustände oder überdauernde Eigenschaften/Dispositionen, Interessen, Einstellungen) von Personen, Personengruppen oder Organisationen erfassen soll.^[1] Der Einsatz von Testverfahren erfolgt in der Regel zur Beantwortung einer Fragestellung im Rahmen eines diagnostischen Prozesses der Psychologischen Diagnostik. Darüber hinaus ist ein Einsatz zur Aufklärung individueller Unterschiede im Rahmen der Differentiellen Psychologie üblich (hierbei überwiegt der Forschungsaspekt).

Der Einsatz kann zur Aufklärung eines zeitlichen Verlaufes (intraindividuelle Unterschiede, z. B. Therapieverlauf) oder eines Vergleiches zwischen Personen (interindividuelle Unterschiede, z. B. Eignung von Personen für Berufe) erfolgen.

Was sind psychologische Tests?

Schmidt-Atzert und Amelang definieren einen psychologischen Test unter Zusammenfassung verschiedener anderer vorliegender Definitionen folgendermaßen:

Es handelt sich um eine Messmethode, vgl. Operationalisierung
mit der ein psychologisches Merkmal (oder mehrere) erfasst werden soll(en), welche Latente Variablen sind.
Das Vorgehen ist standardisiert
und schließt die Erhebung einer Verhaltensstichprobe mit ein.
Das Verhalten wird durch die spezifischen im Test realisierten Bedingungen hervorgerufen.
Die Variation soll weitgehend auf der Variation des zu messenden Merkmales zurückzuführen sein.
Ziel ist eine quantitative Aussage zur Ausprägung des Merkmals oder qualitative Aussage zum Vorhandensein oder der Art eines Merkmals^[2]

Die Grundlagendisziplin für psychologische Tests und ihre Anwendung ist die Psychologische Diagnostik als Teilgebiet der Psychologie. Bei der Beschreibung von Tests sind drei Aspekte zu unterscheiden:

Durchführung (Art des Materials, Test-Anforderung, Protokollierung und Registrierung der Beantwortung)
Auswertung (Berechnung von Rohwerten und Normwerten)
Interpretation (Verarbeitung der Ergebnisse, diagnostisches Urteil, Beitrag zur Entscheidungsfindung)

Bei der Anwendung von Tests sind weiterhin bedeutsam

Auswahlkriterien, für welche Fragestellungen und Messgegenstände ein Verfahren anwendbar ist und welche Voraussetzungen gelten
Leitlinien für die Kommunikation der Ergebnisse (an Diagnostizierte und/oder Auftraggeber)

Elemente der Tests sind die Items als einzelne Aufgaben oder Fragen, die Personen dargeboten werden und auf die reagiert werden muss. Aus den Bewertungen der Reaktionen (z. B. Antworten auf Fragen) wird zumeist durch Generalisierung über verschiedene Items auf die Ausprägung eines Merkmals geschlossen.

Zahlreiche Verfahren werden als psychometrische Tests bezeichnet, d. h., es erfolgt basierend auf einer Theorie eine Messung. Das über die Items generalisierte Ergebnis (Rohwert) wird im einfachsten Fall durch Summenbildung bestimmter Antworten ermittelt (z. B. Richtige oder Antworten einer bestimmten Tendenz). Unterschiede ergeben sich dann hinsichtlich der Art der Interpretation:

Normorientierte Tests: Um das Ergebnis interpretieren (bewerten) zu können, wird die Vergleichbarkeit mit anderen Ergebnissen hergestellt (Position einer Person in einer Vergleichsgruppe bzw. Vergleichsnorm). Dies geschieht durch Umwandlung in einen Normwert, welcher einen Vergleich mit einer Referenzgruppe erlaubt (z. B. mit der Gesamtbevölkerung, einer Altersgruppe, erfolgreich Studierenden oder einer Diagnosegruppe). Dieser Vergleich trägt zur Beantwortung der Fragestellung bei, weshalb der Test angewendet wurde (Ist die Entwicklung altersgerecht? – Wie sind die Chancen, ein Studium erfolgreich zu absolvieren? – Ist ein Ergebnis auffällig/typisch für eine bestimmte Diagnosegruppe?). Die Entwicklung dieser Normen für einen Test wird Normierung oder Eichung genannt.^[3]

Kriteriumsorientierte Tests bestimmen nicht die Position der Person in Relation zu einer Vergleichsnorm, sondern das Erreichen/Verfehlen eines konkreten Kriteriums. Sie müssen ebenfalls inhaltsvalide ein, das Kriterium ergibt sich aber aus der Erreichung bestimmter Ziele (z. B. Lehrziele, Therapieziele). Die Festlegung des zu erreichenden Wertes (Trennwert oder Cut-Off) bzw. die Bedeutsamkeit des Kriteriums bedarf empirischer Kriterien (z. B. Vergleich von Gruppen nach der Zielerreichung hinsichtlich des Erfolges).^[4]

Tests unterscheiden sich nach dem Grad der Standardisierung (Vereinheitlichung) der Informationsgewinnung. Bei vollstandardisierten Verfahren sind folgende Elemente vereinheitlicht:

Instruktionen (Hinweise, die vor und während der Testanwendung gegeben werden)
die Items (Menge, Reihenfolge, Gestaltung)
die Antwortmöglichkeiten und die Abgabe der Antworten
die Auswertung (Berechnung von Rohwerten und Normwerten)
die Interpretation und Beantwortung der Fragestellung

Die Standardisierung, die Anwendung unter vergleichbaren Bedingungen, gilt als Voraussetzung, dass Ergebnisse überhaupt miteinander verglichen werden können. Sie gewährleistet eine ausreichende Objektivität als eins der drei Hauptgütekriterien von Tests.^[5]

Sind einige Elemente variabel, spricht man von teil- oder halbstandardisierten Instrumenten (z. B. teilstandardisierte Befragungen, wo Fragenauswahl und Antwortbewertung durch eine Fachperson erfolgen kann oder Fragen frei beantwortet werden und ebenfalls ein Urteiler die Bewertungen vornimmt. Hier wird die Standardisierung durch klare Beurteilungskriterien und Schulung der Beurteiler erreicht).

Darüber hinaus gibt es auch „qualitative Tests“, die Verhalten standardisiert „provozieren“, welches dann aber durch eine Fachperson qualitativ bewertet oder gedeutet wird. Dazu gehören klassisch bewertete Projektive oder Deutungstests (für einige dieser Tests, wie z. B. den Rorschach-Test, hat man auch standardisierte Auswerteverfahren entwickelt).

Qualität: Gütekriterien von Tests

Gemäß der Definition von Lienert und Raatz muss ein psychologisches Testverfahren die folgenden Kriterien erfüllen: Es muss…

… wissenschaftlich fundiert sein.
… unter Standardbedingungen routinemäßig durchführbar sein.
… eine relative Positionsbestimmung eines Individuums bzgl. Gruppe oder Kriteriums ermöglichen.
… empirisch abgrenzbar sein, d. h. keine versteckten Merkmale und Phänomene erfassen wie z. B. das Unbewusste in der Psychoanalyse, sondern beobachtbare und messbare Eigenschaften (Konstrukte), also erlebnis- und verhaltensanalytisch, phänomenologisch und nicht nur rein begrifflich abgrenzbare Eigenschaften.
… ein zu untersuchendes Merkmal eindimensional und metrisch abbilden (man beachte aber Testbatterien).

Wissenschaftlich fundierte Tests müssen bestimmte Testgütekriterien erfüllen. Für Tests im Bereich der Eignungsdiagnostik gibt es die DIN-Norm 33430, die allerdings zu den freiwilligen Normen gehört und nicht rechtsverbindlich ist.

In Deutschland existiert mit dem Testkuratorium der Föderation Deutscher Psychologenvereinigungen eine Einrichtung zur Überwachung der Qualität psychologischer Verfahren.^[6] Es wurden Qualitätsrichtlinien als Checklisten (TBS-TK)^[7] entwickelt, nach denen die Qualität von Tests beurteilt und in Form von Rezensionen publiziert wird.^[8]

Missbräuchliche Benutzungen von Tests sind nicht selten. Es gibt im Einsatz befindliche Testverfahren, die nicht ausreichend wissenschaftlich überprüft sind. Tests können für Fragestellungen eingesetzt werden, für die sie nicht entwickelt worden sind. Ergebnisse können ungerechtfertigt verabsolutiert werden. Personen können Tests einsetzen, die über keine oder nicht ausreichende Qualifikation verfügen (siehe dazu Psychomarkt).

Arten psychologischer Tests

Die Zahl der vorhandenen psychologischen Tests allein im deutschen Sprachraum kann auf mehrere Tausend geschätzt werden. Qualität und Stand der Entwicklung kann dabei sehr unterschiedlich sein. Bezüglich der Einteilung von Tests sind verschiedene Systeme üblich, in einigen werden die Kategorien vermischt.

Bei Urteilstests werden individuelle Eigenarten durch Beurteilung von Sachverhalten gewonnen. Hier gibt es keine richtigen oder falschen Antworten – ein Problem kann die Abgabe von Urteilen nach der sozialen Erwünschtheit des Urteiles sein („einen guten Eindruck machen“). Begriffliche Überschneidungen gibt es
- mit Persönlichkeitstests (Deutungstests sind auch Persönlichkeitstests; Leistungstests können auch Persönlichkeitsmerkmale erfassen – Intelligenz als Persönlichkeitsmerkmal; objektive Persönlichkeitstests sind Leistungstests, die hinsichtlich von „klassischen“ Persönlichkeitseigenschaften ausgewertet werden);
- und mit Fragebögen (Urteilstests sind nur jeweils ein Teil davon, es gibt zahlreiche weitere Typen von Fragebögen auch außerhalb der Psychologie, z. B. Personalfragebögen).
Als Leistungstests werden solche Tests zusammengefasst, wo eine qualitative oder quantitative Bewertung der Güte der Antworten möglich ist (Lösungsmenge, Lösungsgüte, Zeit bis zur Lösung). Bei diesen Tests gibt es richtige und falsche Lösungen.
Deutungstests oder projektive Tests bilden eine weitere Art von Tests. Während im Fragebogen der Proband sein eigenes gewohnheitsmäßiges Verhalten und Erleben beschreibt (Selbstbeurteilung), wird er im projektiven Verfahren um eine gestaltende Deutung der Testvorlage gebeten.

Eine weitere Einteilung kann danach erfolgen, ob Hard Skills/Fachkompetenz (vorwiegend Leistungsmerkmale) oder Soft Skills (soziale Kompetenzen, Neigungen, Interessen, Persönlichkeitsmerkmale im engeren Sinne) erfasst werden.

Man kann jeden Test grundsätzlich in folgenden drei Dimensionen beschreiben und ihn entsprechend klassifizieren:

welche Merkmale gemessen werden (Intelligenz, Gedächtnis, Aufmerksamkeit, Konzentration, Lernfähigkeit, Persönlichkeit, Einstellungen, Motivation, Beschwerden, Befindlichkeit u. a.),
auf welche Art die Merkmale gemessen werden (Urteilstests, Leistungstests, Deutungstests) oder
für welche Fragestellungen die Tests einsetzbar sind (Eignungstests, Fahrtauglichkeit, Tests zur Identifikation psychischer Störungen, Schultests u. a.).

Multimodale Diagnostik oder multimethodale Diagnostik ist ein Konzept, welches die Dimensionen systematisch variiert, um genauere Informationen zu erhalten.

Die vorhandenen Testklassifikationen vermengen aus Gründen der Vereinfachung diese drei Aspekte.

Die Testklassifikation von PSYNDEX

PSYNDEX, das verbreitetste Recherche- und Dokumentationssystem deutschsprachiger psychologischer Literatur und Tests verwendet die folgende Test-Klassifikation (in Klammern die im Dezember 2018 vorhandene Zahl an Verfahren):^[9]

Entwicklungstests inklusive Schulreifetests und gerontologische Verfahren (710)
Intelligenztests mit Lernfähigkeitstests und Gedächtnistests (445)
Kreativitätstests (29)
Leistungs-, Fähigkeits- und Eignungstests mit Musikalitätstests und Sporttests (671)
Verfahren zur Erfassung sensomotorischer Fähigkeiten (251)
Schulleistungstests (513)
Einstellungstests inklusive verkehrspsychologischer Tests, berufsbezogener Einstellungstests sowie arbeitspsychologischen Verfahren (1883)
Interessentests (79)
Persönlichkeitstests (1469)
Projektive Verfahren (158)
Klinische Verfahren (3124)
Verhaltensskalen (257)
Sonstige Verfahren inklusive Verfahren zur Erfassung soziographischer Daten sowie Explorations- und Anamneseschemata (179)

An der angegebenen Quelle finden sich weitere Unterkategorien für die hier genannten Kategorien.

Klassifikation der Testzentrale

Die Testzentrale des Hogrefe Verlages, die zugleich den kontrollierten Testvertrieb für akademisch qualifizierte Psychologen abwickelt, ordnet Tests nach folgenden Kategorien:^[10] (In Klammern wiederum die Zahl verfügbarer Verfahren, im Unterschied zu PSYNDEX beinhaltet dies nur Verfahren, die in einem entsprechenden Verlag anwendungsbereit erschienen sind.)

Berufsbezogene Verfahren (103)
Entwicklungstests (105)
Intelligenztest (189)
Klinische Verfahren – Erwachsene (142)
Klinische Verfahren – Kinder und Jugendliche (145)
Leistungstests (31)
Medizinpsychologische Verfahren (63)
Neuropsychologische Verfahren (108)
Persönlichkeitstests (101)
Schultests (124)

Weitere Unterschiede

Tests sind entweder für alle Personen im Ablauf der Durchführung gleich oder adaptiv, d. h., der Ablauf des Tests wird durch die vorher gegebenen Antworten beeinflusst.
Bei einer Testbatterie werden mehrere Tests, die für einen Sachverhalt von Bedeutung sind, durchgeführt. Diese können auch unterschiedlichen Kategorien angehören.
Neben den Tests für Personen gibt es auch Tests für Personengruppen und Organisationen^[11]
Verlaufstests/Paralleltests: Viele Tests sind nicht wiederholbar, weil die Bekanntheit des Tests die Ergebnisse verfälschen würde. Für einige Tests werden äquivalente Parallelversionen (gleicher Messgegenstand, unterschiedliche Items) angeboten, die wiederholt oder alternativ eingesetzt werden können, wenn z. B. in Leistungstests beim zweiten Mal die Lösungen leichter zu finden wären oder in Gruppentestungen Nachbarn nicht voneinander abschreiben oder auffällige Befunde noch einmal überprüft werden sollen. Andere Tests sind als Verlaufstests für die mehrfache Anwendung konzipiert (z. B. Befindlichkeitsfragebögen).

Erhebungsmethoden

Bezüglich der Erhebungsmethode sind mindestens zwei Arten zu unterscheiden, die sich mit dem Fortschreiten der Technik entwickelt haben.

Papier-Bleistift-Tests

Wenn der Diagnostizierte alle Unterlagen auf Papier erhält und dort auch antwortet bzw. Arbeitsblätter ausfüllt, spricht man von Papier und Bleistift-Diagnostik bzw. -Tests (engl. P & P, paper and pencil). Dieser Begriff entstand, als zunehmend für Tests computerisierte Versionen verfügbar wurden und die in Papierform verbleibenden Verfahren eine eigene Bezeichnung benötigten. Viele ältere Testverfahren sind Papier und Bleistift, allerdings werden auch moderne Tests oft noch in einer solchen Version konzipiert und normiert, z. B. wenn sie sich an Klienten richten, die mit dem Computer nicht umgehen können oder praktische Überlegungen im klinischen Alltag nicht für eine Rechnerstützung sprechen. Auch qualitative Tests sind heute oft P & P. Diese Tests gelten allgemein als arbeitsaufwendiger in der Auswertung. Es existieren allerdings oft hybride Lösungen, bei denen der Proband auf Papier arbeitet, die Ergebnisse aber vom Testleiter in ein Programm eingegeben werden, damit die Werte berechnet werden können. Manche Tests können generell nur in Papierform absolviert werden, wie beispielsweise Zeichenaufgaben in der Diagnostik bei Schlaganfalls-Patienten. („Malen Sie bitte ein Haus mit Fenstern, Tür, Schornstein und Dach.“) Auch strukturierte Interviews werden oft als Papier und Bleistift-Tests durchgeführt.

Computerunterstützte Tests

Computerunterstützte Tests liegen vor, wenn der Proband selbstständig am Bildschirm, der Tastatur oder einer eigens entwickelten Eingabeeinheit arbeitet. Diese Tests gelten als weitaus ökonomischer, sind aber nicht für jeden Zweck verwendbar. Eingabe-Einheiten können vereinfachte Tastaturen sein, aber auch mechanische Geräte wie Pedale, Joystick oder große Knöpfe oder Regler. Komplexere Programme, die mehrere Tests computerunterstützt durchführen und auswerten werden Testsysteme genannt. Für computergestützte Tests gibt es zusätzlich zu den grundlegenden Gütekriterien psychodiagnostischer Verfahren noch weitere, speziell für diese Art des Testens; sie sollten verfälschungssicher, selbsterklärend, Hardware-unabhängig und barrierefrei sein sowie Testfairness garantieren.

Ebenfalls als Computerunterstützte Tests bezeichnet man Verfahren, bei denen die Antworten dem Protokoll führenden Testleiter mündlich mitgeteilt werden, der sie darauf hin in ein Registrierungsprogramm eingibt, welches die Auswertung vornimmt. Schließlich können Antwortblätter von Papier-Bleistift-Tests gescannt und per Computer ausgewertet werden, insbesondere wenn die Auswertung sehr aufwändig ist (z. B. MMPI).

Mit der Entwicklung des Internets haben sich weitreichende Möglichkeiten zu Testverfahren ergeben. Diese Verfahren werden teilweise auch als Online Assessment bezeichnet.^[12] Zu unterscheiden ist dabei, inwieweit die getestete Person das Ergebnis nach der Durchführung erhält. Die Ergebnisse müssen verständlich aufbereitet sein, weil meist keine psychodiagnostisch geschulte Fachperson die Ergebnisse interpretiert. Anwendungen finden sich im Rahmen der Studienberatung oder anderen Formen der „Selbstselektion“, um Eignung und Neigung für bestimmte Ausbildungen, Berufe oder Karrieren zu erkunden. Zunehmend werden solche Tests bei Bewerbern als Berufliches Profiling eingesetzt, aber auch vielfach für statistische Untersuchungen eingesetzt, ohne dass die getestete Person eine vollständige Auswertung erhält.

Testkonstruktion/Testentwicklung

Psychologische Tests sind Messinstrumente, die nach wissenschaftlichen Kriterien konzipiert, evaluiert und geeicht werden. Die Entwicklung eines wissenschaftlich fundierten Tests ist aufwendig und erfordert sowohl theoretische Vorarbeiten zur Definition von Gegenstand, zu erfassenden Merkmalen und Items als auch empirische Erprobungen an ausreichend großen und für den zukünftigen Anwendungsbereich repräsentativen Stichproben. Normen eines Tests als Vergleichsmaßstäbe müssen regelmäßig überprüft werden, ob sie noch gültig sind.

Tests können grundsätzlich nach zwei Konzepten entwickelt werden:

Klassische Testtheorie (KTT) oder
Probabilistische Testtheorie (PTT) bzw. Item Response Theorie (IRT). Diese Konstruktion ist in der Regel sehr aufwändig und es gibt weniger Tests dieser Art.

Für die Abfolge der Arbeitsschritte gibt es mehrere Möglichkeiten. Einmal kann eine dezidierte Theorie über menschliches Verhalten vorliegen (z. B. Persönlichkeitstheorie oder Intelligenztheorie). Davon ausgehend werden dann Fragen (Items) generiert, die mittels mehr oder weniger aufwendiger statistischer Verfahren auf ihre Güte geprüft werden (Messgenauigkeit, Objektivität und Validität). Man bildet hypothetische Klassen oder Gruppen, die man mit Namen belegt oder ermittelt diese Klassen mittels statistischer Verfahren (z. B. Faktorenanalyse). Diese kann man dann nach Intensität oder Häufigkeit kontinuierlich oder diskret abstufen (z. B. sehr, etwas, wenig). Die resultierenden Messwerte stehen dann für die Ausprägung des Merkmals.

Ein weiteres Verfahren nennt sich externale Konstruktion. Dieses nur auf den zweiten Blick einleuchtende Verfahren funktioniert so: Man betrachtet zwei unterscheidbare soziale Gruppen (z. B. Alkoholabhängige vs. nicht Abhängige). Diesen Gruppen werden inhaltlich breit gefächerte (heterogene) Items vorgelegt. Diese werden beantwortet. Schließlich werden diejenigen Items ausgewählt, die beide Gruppen statistisch abgesichert voneinander trennen. Davon ausgehend wird dann der Test zusammengestellt. Nun kann (mit einer gewissen Irrtumswahrscheinlichkeit) eine korrekte Einordnung in die eine oder andere Gruppe (an anderen Personen) vorgenommen werden. Mitunter werden durch dieses Verfahren Items generiert, die mit dem, was der Test untersuchen soll, inhaltlich wenig gemein haben. Andererseits soll der Test für die Testpersonen auch möglichst „undurchschaubar“ sein. Ein Beispiel wäre das Minnesota Multiphasic Personality Inventory (MMPI, Hathaway und McKinley, 1951), wo einzelne der 566 Fragen nicht auf die Art der Auswertung schließen lassen.

Die induktive Konstruktion ist an sich keiner Theorie verpflichtet. Hier stellt man „blind“ Items zusammen, die inhaltlich zueinander passen. Diese Items sollten möglichst zusammenhängen (korrelieren). Mit Hilfe von weiteren Zusammenhangsüberprüfungen kann dann entschieden werden, ob die so entwickelte Skala valide ist.

Ausbildung der Anwender

Tests müssen für die Anwender ausreichend dokumentiert sein (in der Regel in einem Handbuch). Dieses Handbuch muss nach DIN 33430 die wesentlichen Konstruktionsschritte und Untersuchungen zu den Gütekriterien darstellen, sowie genau Anweisungen für Durchführung, Auswertung und Interpretation der Tests enthalten.

Fundierte psychologische Tests werden mit einer genauen Handlungsanweisung an den Anwender geliefert und können nur aussagekräftig durchgeführt werden, wenn die vorgeschriebenen Instruktionen eingehalten werden. Dies gilt besonders für Tests, die von einem Testleiter interaktiv durchgeführt werden. Für mögliche Besonderheiten bei der Durchführung müssen Anweisungen vorhanden sein, wie dann zu verfahren ist. Die Durchführung von Tests muss deshalb vor dem ersten Einsatz geübt werden und zählt in Deutschland zum Angebot des Psychologiestudiums.

Da quasi alle Tests messfehlerbehaftet sind, Randbedingungen das Ergebnis mit beeinflussen können und nur Wahrscheinlichkeitsaussagen bezüglich der Vorhersage bestimmter Sachverhalte (Vorliegen einer Störung, Studienerfolg u. ä.) möglich sind, ist bei der Interpretation der Ergebnisse eine genaue Kenntnis des Tests und der zugrundeliegenden Theorien und Konzepte notwendig. Dies gilt besonders für die Kommunikation der Befunde an Diagnostizierte und Auftraggeber, damit Testergebnisse nicht übergeneralisiert werden (siehe auch iatrogene Noxe).

Für einige Tests existieren daher Anwenderseminare, deren Besuch empfehlenswert oder sogar obligatorisch ist. Eine umstrittene Frage ist, ob Tests aus den genannten Gründen nur ausgebildeten Psychologen zugänglich sein dürfen. Ein kontrollierter Testvertrieb (Bezug nur für ausgebildete Psychologen durch die Testzentrale unter Nachweis des Diplom-Abschlusses) sollte dies ursprünglich gewährleisten, ließ sich aber rechtlich und organisatorisch^[13] nur bedingt durchsetzen. DIN 33430 hat für den Bereich der Eignungsdiagnostik den Anwenderkreis nun ausdrücklich geöffnet, schreibt aber Ausbildungsstandards vor. In Deutschland steht die Ausbildung auch anderen Berufsgruppen offen und wird mit einer Lizenz zertifiziert.^[14]

Weitere Arten/Gebiete von Tests

Siehe auch

Die Darstellung der folgenden Wiki-Links ist nicht abschließend. Auf diesem Gebiet findet sich auch eine große begriffliche Vielfalt, gleiche Phänomene und Sachverhalte werden schulenspezifisch auch unterschiedlich benannt.

Grundlagen

Persönlichkeits- und Differentielle Psychologie (zugeordnete Fachdisziplin)
Assessment (Psychologie) vergleichbarer Begriff aus der ABO-Psychologie, der die Konnotation der Begriffe „Diagnose“ und „Diagnostik“ mit klinischen (medizinischen) Fragestellungen vermeiden will.
Testtheorie (Psychologie) – Testpsychologie (veraltet, Methodischer Ansatz)
Reliabilität – Utilität (Diagnostik)

Begriffe der Testkonstruktion und -anwendung

Normwertskala – Flächentransformation

Literatur

E. Brähler, H. Holling, D. Leutner, F. Petermann (Hrsg.): Brickenkamp Handbuch psychologischer und pädagogischer Tests. 3. Auflage. Hogrefe, Göttingen 2002, ISBN 3-8017-1441-1.
M. Bühner: Einführung in die Test- und Fragebogenkonstruktion. 3., aktualisierte Auflage. Pearson Studium, München 2010, ISBN 978-3-8689-4033-6.
G. A. Lienert, U. Raatz: Testaufbau und Testanalyse. 6. Auflage. Beltz PsychologieVerlagsUnion, Weinheim 1998.
H. Kranz: Einführung in die klassische Testtheorie. 5. Auflage. Klotz Verlag, Eschborn 2001.
H. Moosbrugger, A. Kelava: Testtheorie und Fragebogenkonstruktion. Springer, Heidelberg 2007, ISBN 3-540-71634-3.
W. Sarges, H. Wottawa (Hrsg.): Handbuch wirtschaftspsychologischer Testverfahren – Band I: Personalpsychologische Instrumente. 2., überarbeitete und erweiterte Auflage. Lengerich 2004, Pabst Science Publishers, ISBN 3-935357-55-9.

Weblinks

Testsuche

Siehe auch: Kategorie:Psychologisches Testverfahren
PSYNDEX plus mit Testfinder
- kostenpflichtig nutzbare Datenbank mit einem Segment Tests, an vielen Universitäten verfügbar – durch Änderung zu kostenfreien Angeboten vermutlich nicht mehr notwendig
- Neuer kostenloser Zugang: PSYNDEX direkt, man beachte die erweiterten Suchmöglichkeiten
- Kostenfreie Testverzeichnisse aus dieser Datenbank als PDF.
ERIC/AE Test locator (englisch, die wohl umfassendste Dokumentation)
- Ein Projekt des Clearinghouses on Assessment and Evaluation, des Educational Testing Services und einiger anderer Universitätsinstitute
- "Free" Tests and Instruments, ETS Test Collection, Buros Classified Subject Index, CEEE/ERIC Test Database (tests commonly used with LEP students), Code of Fair Testing Practices und Test Selection Tips
DMIDI.net der Columbia University New York
- Skalenübersicht des Centers for Research an Environmental decisions der Columbia University New York.
- Skalen für Entscheidungsstile, den Entscheidungsprozess und Entscheidungskompetenzen
FAQ: Finding Information About Psychological Tests
- Ausführliche Hinweise zur Auswahl publizierter und unpublizierter Tests sowie Hinweise für eine sachgerechte Anwendung.
Test Collection at Educational Testing Service (ETS)
- Datenbank mit mehr als 25 000 Tests beim Educational Testing Service.
Zusammenstellung sozialwissenschaftlicher Items und Skalen: ZIS auf gesis.org
- Open-Access Publikationssystem für die Sozialwissenschaften. ZIS veröffentlicht Messinstrumente, deren Entwicklung, deren Gütekriterien und Informationen zum theoretischen Hintergrund

Organisationen

Welt:
- Internationale Testkommsission
- Association of Test Publishers Internationale Vereinigung der Test-Anbieter
Europa:
- Board of Assessment (früher Standing committee on Tests and Testing) der EFPA
- European Test Publishers Group Europäische Vereinigung der Test-Anbieter
Einzelne Länder:
- Deutschland: Diagnostik- und Testkuratorium der Föderation Deutscher Psychologenvereinigungen
- Schweiz: Fachgruppe Diagnostik der SDBB (ehemals Testkommission des SBAPs)

Sonstiges

Befragung zum Testeinsatz (Schweiz)

Einzelnachweise

↑ Nach Lienert und Raatz (1998) ist ein psychologischer Test ein „… wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung“.
↑ Schmidt-Atzert und Amelang, Psychologische Diagnostik 5. Aufl. S. 37
↑ vgl. Moosbrugger und Kelava 2007, Kap. 2.5 S. 19 ff.
↑ M. Amelang, W. Zielinsky: Psychologische Diagnostik und Intervention Springer 2013. S. 61 ff.
↑ Manfred Amelang, Werner Zielinski: Psychologische Diagnostik und Intervention. 3. korrigierte, aktualisierte und überarbeitete Auflage. Springer, Berlin u. a. 2002, ISBN 3-540-42840-2, (Springer-Lehrbuch).
↑ Testkuratorium Homepage
↑ Testbeurteilungssystem TBS-TK
↑ Testrezensionen nach TBS-TK bei psyndex.de
↑ PSYNDEX-Klassifikation des Leibniz-Instituts für Psychologie (ZPID) Universität Trier
↑ Archivierte Kopie (Memento des Originals vom 15. Dezember 2014 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2 abgerufen am 29. Januar 2012
↑
Die Bundesanstalt für Arbeitsschutz und Arbeitsmedizin listet in ihrer Toolbox verschiedene Verfahren auf, wobei unter dem Stichwort „Gestaltungsbezug“ zwischen zwei Einsatzbereichen für Fragebogenverfahren unterschieden wird:
- Beurteilung von Personen zur Verhaltensprävention: Verfahren zur Beurteilung beispielsweise der individuellen psychischen Beanspruchung, Beanspruchbarkeit (Resilienz), Arbeitsfähigkeit usw.
- Beurteilung von Organisationen zur Verhältnisprävention: Verfahren für die im Arbeitsschutz erforderliche Beurteilung von psychischen Belastungen, die von dem Arbeitsplatz (also von der Organisation) ausgehen und auf die Mitarbeiter wirken.
↑ Konradt, U. & Sarges, W. (2003): E-Recruitment und E-Assessment. Göttingen: Hogrefe, ISBN 380171652X
↑ Standesrechtliche Vorschriften sind nicht allgemeinverbindlich und einklagbar, der Nachweis erfolgte durch Einsendung einer Kopie des Ausbildungsabschlusses
↑ DIN 33430 und Lizenzierung – Portal des Berufsverbandes Deutscher Psychologinnen und Psychologen

[1] Nach Lienert und Raatz (1998) ist ein psychologischer Test ein „… wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung“.

[2] Schmidt-Atzert und Amelang, Psychologische Diagnostik 5. Aufl. S. 37

[3] vgl. Moosbrugger und Kelava 2007, Kap. 2.5 S. 19 ff.

[4] M. Amelang, W. Zielinsky: Psychologische Diagnostik und Intervention Springer 2013. S. 61 ff.

[5] Manfred Amelang, Werner Zielinski: Psychologische Diagnostik und Intervention. 3. korrigierte, aktualisierte und überarbeitete Auflage. Springer, Berlin u. a. 2002, ISBN 3-540-42840-2, (Springer-Lehrbuch).

[6] Testkuratorium Homepage

[7] Testbeurteilungssystem TBS-TK

[8] Testrezensionen nach TBS-TK bei psyndex.de

[9] PSYNDEX-Klassifikation des Leibniz-Instituts für Psychologie (ZPID) Universität Trier

[10] Archivierte Kopie (Memento des Originals vom 15. Dezember 2014 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2 abgerufen am 29. Januar 2012

[11] Die Bundesanstalt für Arbeitsschutz und Arbeitsmedizin listet in ihrer Toolbox verschiedene Verfahren auf, wobei unter dem Stichwort „Gestaltungsbezug“ zwischen zwei Einsatzbereichen für Fragebogenverfahren unterschieden wird:
Beurteilung von Personen zur Verhaltensprävention: Verfahren zur Beurteilung beispielsweise der individuellen psychischen Beanspruchung, Beanspruchbarkeit (Resilienz), Arbeitsfähigkeit usw.

Beurteilung von Organisationen zur Verhältnisprävention: Verfahren für die im Arbeitsschutz erforderliche Beurteilung von psychischen Belastungen, die von dem Arbeitsplatz (also von der Organisation) ausgehen und auf die Mitarbeiter wirken.

[12] Beurteilung von Personen zur Verhaltensprävention: Verfahren zur Beurteilung beispielsweise der individuellen psychischen Beanspruchung, Beanspruchbarkeit (Resilienz), Arbeitsfähigkeit usw.

[13] Beurteilung von Organisationen zur Verhältnisprävention: Verfahren für die im Arbeitsschutz erforderliche Beurteilung von psychischen Belastungen, die von dem Arbeitsplatz (also von der Organisation) ausgehen und auf die Mitarbeiter wirken.

[12] Konradt, U. & Sarges, W. (2003): E-Recruitment und E-Assessment. Göttingen: Hogrefe, ISBN 380171652X

[13] Standesrechtliche Vorschriften sind nicht allgemeinverbindlich und einklagbar, der Nachweis erfolgte durch Einsendung einer Kopie des Ausbildungsabschlusses

[14] DIN 33430 und Lizenzierung – Portal des Berufsverbandes Deutscher Psychologinnen und Psychologen

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]