Ein Permutationstest ist in der nichtparametrischen Statistik ein exakter Test, bei dem zufällige Stichprobenwiederholungen unter Annahme der Nullhypothese identischer Verteilungen gezogen werden. Die Umsetzung erfolgt häufig mithilfe von Monte-Carlo-Simulationen und dem "Was-wäre-wenn-Ansatz". Basierend auf der daraus resultierenden Verteilung der Teststatistik wird bestimmt, wie wahrscheinlich die Teststatistik der Originaldaten unter der Nullhypothese ist.
Mithilfe von Permutationstests kann beispielsweise untersucht werden, ob zwei Stichproben aus unterschiedlichen Verteilungen stammen (beispielsweise kann man die Differenz der Mittelwerte als Teststatistik auswerten). Die Nullhypothese ist, dass beide Stichproben der gleichen Verteilung entstammen (und die Differenz der Mittelwerte den Wert 0 annimmt). Gilt die Nullhypothese, dann können Datenpunkte von der einen Stichprobe in die andere getauscht werden (Permutation). Man erhält durch Permutieren Stichprobenwiederholungen und kann dann die entsprechende Teststatistik wiederholt berechnen und deren empirische Verteilung bestimmen. Aus dieser Verteilung leitet sich direkt der p-Wert der auf den beiden ursprünglichen Stichproben vorliegenden Teststatistik ab[1]. Die Zahl der möglichen (sich nicht wiederholenden) Permutationen ist , wobei die jeweiligen Stichprobenumfänge sind. Da schnell sehr groß wird, beschränkt man sich typischerweise auf eine Monte-Carlo-Simulation, welche eine bestimmte Zahl zufälliger Permutationen zieht (vgl. auch Fisher-Yates-Algorithmus zur Implementierung).
Die Zahl der nötigen Permutationen kann durch Stoppregeln bestimmt werden[2].
Ein Beispiel für einen Permutationstest zur Varianzanalyse ist PERMANOVA.
Für gepaarte Stichproben ist der gepaarte Permutationstest geeignet, welcher die Paarungsstruktur beibehält und lediglich innerhalb der jeweiligen Paare permutiert. Daneben ist der Bootstraptest (neben dem nichtparametrischen Wilcoxon-Vorzeichen-Rang-Test) geeignet um bei gepaarten Stichproben zu überprüfen ob der Mittelwert der Differenzen statistisch signifikant von Null verschieden ist.
Randomisierte Tests (welche auf einer zufälligen Zuweisung des Testergebnisses beruhen) sind nicht zu verwechseln mit Permutationstests (welche auf zufälligen Stichprobenwiederholungen basieren)[3]. Historisch wurden Permutationstests gelegentlich als randomisierte Tests bezeichnet.
Bootstrap-basierte Tests nehmen nicht zwangsläufig die Nullhypothese an (obwohl es möglich ist).