Shapiro-Wilk mi Kolmogorov-Smirnov mu tercih etmeliyim?

n<50 olduğunda kesinlikle Shapiro-Wilk. Daha yüksek güce sahip ve sapmaları çok daha hassas yakalıyor. K-S testi büyük örneklemlerde kullanılabilir ama pratikte Shapiro-Wilk her örneklem büyüklüğünde güvenilir. SPSS Explore menüsünden her ikisi de otomatik olarak üretiliyor.

200 kişilik örneklemde Shapiro-Wilk p<0.001 verdi. Non-parametrik teste mi geçmeliyim?

Hemen geçmemekte fayda var. Büyük örneklemlerde Shapiro-Wilk çok hassas, önemsiz sapmaları bile yakalıyor. Histogram ve Q-Q grafiğine bakmak daha bilgilendirici. Çarpıklık -1 ile +1 arasındaysa ve Q-Q grafiğinde sistematik sapma yoksa, Merkezi Limit Teoremi devrede — parametrik test güvenle kullanılabiliyor.

Q-Q grafiğinde uçlarda sapma var ama orta kısım iyi. Ne anlama geliyor?

Uçlardaki sapma genellikle ağır kuyruklu dağılıma veya uç değerlerin varlığına işaret ediyor. Orta kısım iyiyse dağılımın ana gövdesi normale yakın demek. Bu durumda uç değerleri incelemek, gerekirse robust yöntemler düşünmek daha mantıklı.

Çarpıklık ve basıklık için hangi eşik değerlerini kullanmalıyım?

Genel kullanımda çarpıklık ±1 ve basıklık ±2 kabul edilebilir. Küçük örneklemlerde daha katı (±0.5) davranmak güvenli. n>300'de z-skoru yerine bu mutlak değer eşikleri daha pratik çünkü z-skoru büyük örneklemlerde çok küçük sapmalar için bile anlamlı çıkıyor.

SPSS'te normallik testine nasıl ulaşabilirim?

Analyze > Descriptive Statistics > Explore menüsü. Plots butonundan 'Normality plots with tests' seçeneğini işaretlediğinizde Shapiro-Wilk, K-S testi, Q-Q grafiği ve kutu grafiği otomatik üretiliyor. Çarpıklık ve basıklık Descriptives tablosunda standart hatalarıyla birlikte raporlanıyor.

Regresyon analizinde normallik testi neye uygulanır?

Ham verilere değil, modelin artıklarına (residuals). Bu çok sık yapılan bir hata — ham bağımlı değişkenin normal dağılmaması, artıkların da normal dağılmayacağı anlamına gelmiyor. Modeli kurup standartlaştırılmış artıkların Q-Q grafiğine bakmak doğru yaklaşım.

Grup karşılaştırması yapacağım. Normalliği grup bazında mı test etmeliyim?

Evet, grup bazında. t-testi veya ANOVA için normallik varsayımı her grup içinde ayrı ayrı sağlanmalı. Tüm veriyi birlikte test etmek yanıltıcı — iki farklı dağılımın karışımı bimodal bir yapı oluşturup normallik testini yanıltabiliyor.

Normallik Testi Yöntemleri: Hangisi, Ne Zaman?

Q: Shapiro-Wilk mi Kolmogorov-Smirnov mu tercih etmeliyim?

n<50 olduğunda kesinlikle Shapiro-Wilk. Daha yüksek güce sahip ve sapmaları çok daha hassas yakalıyor. K-S testi büyük örneklemlerde kullanılabilir ama pratikte Shapiro-Wilk her örneklem büyüklüğünde güvenilir. SPSS Explore menüsünden her ikisi de otomatik olarak üretiliyor.

Q: 200 kişilik örneklemde Shapiro-Wilk p<0.001 verdi. Non-parametrik teste mi geçmeliyim?

Hemen geçmemekte fayda var. Büyük örneklemlerde Shapiro-Wilk çok hassas, önemsiz sapmaları bile yakalıyor. Histogram ve Q-Q grafiğine bakmak daha bilgilendirici. Çarpıklık -1 ile +1 arasındaysa ve Q-Q grafiğinde sistematik sapma yoksa, Merkezi Limit Teoremi devrede — parametrik test güvenle kullanılabiliyor.

Q: Q-Q grafiğinde uçlarda sapma var ama orta kısım iyi. Ne anlama geliyor?

Uçlardaki sapma genellikle ağır kuyruklu dağılıma veya uç değerlerin varlığına işaret ediyor. Orta kısım iyiyse dağılımın ana gövdesi normale yakın demek. Bu durumda uç değerleri incelemek, gerekirse robust yöntemler düşünmek daha mantıklı.

Q: Çarpıklık ve basıklık için hangi eşik değerlerini kullanmalıyım?

Genel kullanımda çarpıklık ±1 ve basıklık ±2 kabul edilebilir. Küçük örneklemlerde daha katı (±0.5) davranmak güvenli. n>300'de z-skoru yerine bu mutlak değer eşikleri daha pratik çünkü z-skoru büyük örneklemlerde çok küçük sapmalar için bile anlamlı çıkıyor.

SPSS çıktısında iki satır var: Kolmogorov-Smirnov p=0,200, Shapiro-Wilk p=0,038. Biri "normal" diyor, diğeri "normal değil". Hangisine güvenmek gerekiyor?

Doğru cevap: ikisine de körü körüne güvenmek yanıltıcı olabiliyor. Normallik değerlendirmesi tek bir testin p değerine indirgenemez; sayısal ve görsel yöntemlerin birlikte kullanıldığı bir süreçtir (Ghasemi ve Zahediasl 2012). Bu yazıda hangi yöntemin hangi durumda daha güvenilir olduğunu ele alıyoruz.

Normallik kararının ardından hangi teste yöneleceğinizi belirlemek için istatistik test seçici aracımız normallik yanıtınızı da içeren birkaç soruyla uygun testi öneriyor.

Shapiro-Wilk neden altın standart?

Shapiro-Wilk testi, gözlenen değerlerin sıra istatistikleri ile normal dağılım altında beklenen değerler arasındaki uyuma bakıyor. W istatistiği 0–1 arasında değer alır; 1'e yakınlık normallik lehine yorumlanır.

Bu testin öne çıkma sebebi küçük örneklemlerdeki gücü. n<50 olduğunda diğer tüm normallik testlerinden daha hassas biçimde sapmaları tespit ediyor (Mishra ve ark. 2019). Pilot çalışmalar, nadir hastalık araştırmaları, küçük gruplarla çalışan tez öğrencileri — hepsi için Shapiro-Wilk birincil tercih.

Üst sınır olarak n=5000 civarına kadar kullanılabiliyor. Ama burada bir paradoks ortaya çıkıyor: büyük örneklemlerde test o kadar hassas hâle geliyor ki pratikte önemsiz sapmalar bile p<0,05 veriyor. 300 kişilik bir veri setinde çarpıklık sadece 0,2 olsa bile Shapiro-Wilk "normal dağılmıyor" diyebiliyor.

Formal test tek başına karar verici değildir; ağırlık örneklem büyüklüğüne göre kayar.

Kolmogorov-Smirnov: bilinen ama sınırlı

K-S testi gözlenen ve teorik kümülatif dağılım fonksiyonları arasındaki maksimum farka bakıyor. SPSS'te "Kolmogorov-Smirnov with Lilliefors significance correction" olarak çıkar — bu düzeltme önemli çünkü parametreler veriden tahmin edildiğinde orijinal K-S testi yanıltıcı sonuç verebiliyor.

K-S testinin en büyük sınırlılığı küçük örneklemlerdeki düşük güç. n<50 olduğunda gerçek bir normallik ihlalini yakalama şansı Shapiro-Wilk'in çok gerisinde kalıyor. K-S p=0,200 verdi diye rahatlamak, küçük örneklemlerde yanıltıcı.

Birçok tezde ve makalede hâlâ "normallik Kolmogorov-Smirnov testi ile değerlendirildi" ifadesi standart kalıp olarak kullanılıyor. Özellikle küçük örneklemli çalışmalarda bu tercih, hakemlerin eleştiri noktası hâline gelebiliyor.

Görsel yöntemler: testin söylemediğini gösterir

Sayısal testler bir p değeri verir ama dağılımın şeklini göstermez. Görsel kontrol her zaman sayısal testten önce gelir.

Q-Q grafiği sapmanın yalnızca varlığını değil, türünü de gösterir.

Q-Q (Quantile-Quantile) grafiği en bilgilendirici araç. Noktalar 45 derecelik referans çizgisine yakın diziliyorsa dağılım normale yakın. Uçlarda S şeklinde sapma varsa ağır kuyruklu dağılım (uç değer sinyali), sağa doğru kavis varsa sağa çarpıklık söz konusu. Q-Q grafiğinin güzel yanı: sapmanın türünü de teşhis etmesi.

Q-Q Grafiği Paterni	Yorumu
Noktalar doğru üzerinde	Normal dağılıma uygun
Uçlarda yukarı sapma (S şekli)	Ağır kuyruklu, uç değer varlığı
Sağa doğru kavisli sapma	Sağa çarpık dağılım
Sola doğru kavisli sapma	Sola çarpık dağılım
Basamaklı yapı	Ölçüm hassasiyeti düşük

Histogram genel şekli gösterir — simetri, tek tepelilik, kuyruk yapısı. Ama küçük örneklemlerde (n<30) aralık sayısı çok az olduğu için güvenilir görünüm sunmuyor; bu durumda Q-Q grafiği daha bilgilendirici.

Kutu grafiği (box plot) simetriyi ve uç değerleri hızlıca gösterir. Medyan çizgisi kutunun ortasına yakınsa ve bıyıklar dengeliyse normallik lehine yorumlanabilir.

Çarpıklık ve basıklık: sayılarla değerlendirme

Normal dağılımda çarpıklık (skewness) = 0, fazlalık basıklık (excess kurtosis) = 0 beklenir. Sıfırdan uzaklaşma normallikten sapma sinyali. Hangi eşik değerinin kullanılacağı örneklem büyüklüğüne bağlı (Kim 2013):

Kriter	Çarpıklık	Basıklık	Ne zaman?
Katı	±0,5	±0,5	Küçük örneklem, hassas analizler
Orta (genel kullanım)	±1,0	±2,0	Çoğu klinik araştırma
Esnek	±2,0	±7,0	Büyük örneklem, SEM

z-skoru yöntemi de yaygın: çarpıklık değerini standart hatasına böldüğünüzde (SPSS Descriptives tablosunda her ikisi de var) çıkan z −1,96 ile +1,96 arasında kalıyorsa normallik lehine yorumlanır. Ama n>300'de z-skoru çok hassaslaşıyor, o noktadan sonra mutlak değer eşikleri daha pratik.

Örneklem Büyüklüğüne Göre Normallik Stratejisi

n < 50 (Küçük Örneklem)

n > 300 (Büyük Örneklem)

Bütüncül yaklaşım en güvenilir

En sağlam karar, dört bilgi kaynağının birlikte değerlendirilmesiyle alınıyor: normallik testi (Shapiro-Wilk), Q-Q grafiği, çarpıklık-basıklık değerleri ve histogram. Bunların çoğunluğu normallik lehine veya aleyhine işaret ediyorsa, karar güvenilir oluyor.

Makaleye yazarken de bu bütüncül yaklaşımı yansıtmakta fayda var. Örnek: "Yaş değişkeninin normalliği Shapiro-Wilk testi, Q-Q grafiği ve çarpıklık-basıklık katsayıları ile değerlendirildi. Shapiro-Wilk testi sonucuna göre dağılım normal kabul edildi (W=0,973, p=0,284). Q-Q grafiğinde sistematik sapma gözlenmedi. Çarpıklık (0,32, SE=0,34) ve basıklık (−0,18, SE=0,67) katsayıları kabul edilebilir sınırlar içindeydi."

Bu tarz bir raporlama hakem değerlendirmesinde metodolojik güven oluşturuyor. İstatistik testi seçimi sürecinde normallik değerlendirmesinin doğru yapılması, revizyon taleplerini ciddi ölçüde azaltıyor.

Uyarı

Normallik testlerinde p>0,05 sonucu "veriler kesinlikle normal" anlamına gelmiyor. "Normal dağılmadığına dair yeterli kanıt yok" diyor — özellikle küçük örneklemlerde testin gücü düşük olduğundan gerçek bir sapma bile tespit edilemeyebilir. Q-Q grafiği bu boşluğu dolduran en değerli araç.

Normallik değerlendirmesinde hangi yöntemi ne zaman kullanacağınız konusunda tereddüt yaşıyorsanız, Model İstatistik ekibi olarak analiz planınızı birlikte şekillendirmekten memnuniyet duyarız. Doğru değerlendirme, doğru test seçiminin ve güçlü bir makalenin başlangıç noktası.

Kullanılan kaynaklar

Ghasemi A, Zahediasl S. Normality tests for statistical analysis: a guide for non-statisticians. International Journal of Endocrinology and Metabolism. 2012;10(2):486-489. · DOI
Mishra P, Pandey CM, Singh U, Gupta A, Sahu C, Keshri A. Descriptive statistics and normality tests for statistical data. Annals of Cardiac Anaesthesia. 2019;22(1):67-72. · DOI
Kim HY. Statistical notes for clinical researchers: assessing normal distribution (2) using skewness and kurtosis. Restorative Dentistry & Endodontics. 2013;38(1):52-54. · DOI

SPSS çıktısında iki satır var: Kolmogorov-Smirnov p=0,200, Shapiro-Wilk p=0,038. Biri "normal" diyor, diğeri "normal değil". Hangisine güvenmek gerekiyor?

Normallik kararının ardından hangi teste yöneleceğinizi belirlemek için istatistik test seçici aracımız normallik yanıtınızı da içeren birkaç soruyla uygun testi öneriyor.

Q-Q Grafiği Paterni	Yorumu
Noktalar doğru üzerinde	Normal dağılıma uygun
Uçlarda yukarı sapma (S şekli)	Ağır kuyruklu, uç değer varlığı
Sağa doğru kavisli sapma	Sağa çarpık dağılım
Sola doğru kavisli sapma	Sola çarpık dağılım
Basamaklı yapı	Ölçüm hassasiyeti düşük

Kutu grafiği (box plot) simetriyi ve uç değerleri hızlıca gösterir. Medyan çizgisi kutunun ortasına yakınsa ve bıyıklar dengeliyse normallik lehine yorumlanabilir.

Çarpıklık ve basıklık: sayılarla değerlendirme

Kriter	Çarpıklık	Basıklık	Ne zaman?
Katı	±0,5	±0,5	Küçük örneklem, hassas analizler
Orta (genel kullanım)	±1,0	±2,0	Çoğu klinik araştırma
Esnek	±2,0	±7,0	Büyük örneklem, SEM

Örneklem Büyüklüğüne Göre Normallik Stratejisi

n < 50 (Küçük Örneklem)

n > 300 (Büyük Örneklem)

Bütüncül yaklaşım en güvenilir

Uyarı

Kullanılan kaynaklar

Ghasemi A, Zahediasl S. Normality tests for statistical analysis: a guide for non-statisticians. International Journal of Endocrinology and Metabolism. 2012;10(2):486-489. · DOI
Mishra P, Pandey CM, Singh U, Gupta A, Sahu C, Keshri A. Descriptive statistics and normality tests for statistical data. Annals of Cardiac Anaesthesia. 2019;22(1):67-72. · DOI
Kim HY. Statistical notes for clinical researchers: assessing normal distribution (2) using skewness and kurtosis. Restorative Dentistry & Endodontics. 2013;38(1):52-54. · DOI

Normallik Testi Yöntemleri: Hangisi, Ne Zaman?

Shapiro-Wilk neden altın standart?

Kolmogorov-Smirnov: bilinen ama sınırlı

Görsel yöntemler: testin söylemediğini gösterir

Çarpıklık ve basıklık: sayılarla değerlendirme

Örneklem Büyüklüğüne Göre Normallik Stratejisi

Bütüncül yaklaşım en güvenilir

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Doğru İstatistik Testini Nasıl Seçersiniz?

Non-Parametrik Test Seçimi: Hangisi Ne Zaman?

Uç Değer (Outlier) Tespiti ve Yönetimi: Silmek Çözüm mü?

Araştırmanız İçin Destek Alın

Normallik Testi Yöntemleri: Hangisi, Ne Zaman?

Shapiro-Wilk neden altın standart?

Kolmogorov-Smirnov: bilinen ama sınırlı

Görsel yöntemler: testin söylemediğini gösterir

Çarpıklık ve basıklık: sayılarla değerlendirme

Örneklem Büyüklüğüne Göre Normallik Stratejisi

Bütüncül yaklaşım en güvenilir

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Doğru İstatistik Testini Nasıl Seçersiniz?

Non-Parametrik Test Seçimi: Hangisi Ne Zaman?

Uç Değer (Outlier) Tespiti ve Yönetimi: Silmek Çözüm mü?

Araştırmanız İçin Destek Alın