Phi katsayısı veya Φ - katsayısı veya ortalama kare kontenjansı katsayısı olarak isimlendirilen ve matematik notasyonla by φ (veya rφ) olarak ifade edilen iki tane iki-değerli isimsel veya sırasal değişkenin birbirine "birliktelik (association)" ilişkisini gösteren ölçü katsayılarıdır.
İlk defa istatistikçi Karl Pearson tarafından ortaya atılmışlardır.[1] Bu ölçü katsayısının anlamı kavram olarak Pearson çarpım-moment korelasyon katsayısı kavramına çok yakındır. Gerçekten de "phi-katsayısı" iki (0-1) değer alan kategorik değişken için Pearson'un korelasyon katsayısı formülünün uygulanması ile ortaya çıkarılmıştır.[2] Diğer taraftan "phi-katsayısı" karesi 2x2 kontenjans tablosu için hesaplanan "ki-kare" değeri ile ve Pearson'un ki-kare testi ile yakından ilişkilidir.[3]
Bu phi-katsayısı şöyle ifade edilir:
Burada n örneklem gözlem sayısıdır. Genel iki (0,1)değerli x ve y değişkenli bir 2x2 kontenjans tablosu şöyle yazılabilir:
y = 0 | y = 1 | Satır toplamı | |
x = 0 | |||
x = 1 | |||
Sütun toplamı |
Burada n11, n10, n01, n00 hücredeki veri sayılarıdır; , : satır toplamları; ve : sütun toplamları ve n tüm toplam gözlem sayısıdır.
Phi-katsayısı bu 2x2 kontenjans tablosundan şöyle hesaplanabilir:
Phi-katsayısı (tümüyle negatif bağımlı olan) -1 'den bir maksimum değere kadar değişir. Eğer her iki değişken %50:%50 olarak bölünmüşlerse bu maksimum değer +1 olur ve aksi halde +1'in altındadır.
"Birliktelik" "eğer bir veri sujesinin hangi hücrenin belirli bir satırına dahil olduğunu bilirsek onun hangi sütuna dahil olacağını tahmin edebilir miyiz?" şeklinde de ifade edilebilir. Eğer iki (0-1) değerli kategorik değişken "pozitif birliktelik" gösterirse verilerin çok büyük bir kısmı diyagonal üzerinde bulunur; eğer "negatif birliktelik" gösterirse verilerin çoğunluğu diygonal dışında bulunurlar.
Hesaplanan phi-katsayısı şöyle açıklanabilir:[4][5]
Bir işyerinde çalışanlar iki tipe ayrılmışlardır "memur" ve "hizmetli". Bu işyerinde iki türlü ücret ödemesi yapılmaktadır: sabit aylık "maaş" ve çalışılan saate göre "ücret". "Çalışan ayrımı" ile "ödeme ayrımı" değişkenleri arasında ne şekilde bir ilişki mevcut olduğu araştırma sorunudur. Bunlara için 86 adet gözlem toplanmıştır ve bu iki tane iki değerli veri ayrımlara göre şu 2x2 kontenjans tablosunda gösterilmiştir. Bu tabloda sütun toplamları, satır toplamları ve toplam veri sayısı da gösterilmektedir.
Hizmetli = 0 | Memur = 1 | Ödeme tipi toplamı | |
Saate ücret = 0 | 33 | 2 | 35 |
Aylık maaş = 1 | 33 | 18 | 51 |
Çalışan toplamı | 66 | 20 | 86 |
Böylece elimizde (0-1) değerli iki kategori değişkeni bulunmaktadır. Elimizdeki verileri "phi-katsayısı" formülüne koyarsak şu sonucu elde ederiz.
Bu örnek için elde ettiğimiz "phi-katsayısı" değeri 0.0661491858 olarak bulunmuştur ve bu değer -0.3 ile +0.3arasında olduğu için 0 veya çok güçsüz bağımlılık gösterir.