120 hastanın verisini topladınız. SPSS'e girdiniz, analizi çalıştırdınız. Sonuç penceresinde "N=87" yazıyor. 33 hasta nereye gitti?
Bazılarının laboratuvar sonucu eksik. Birkaçı anketi yarım bırakmış. Birinin HBS kaydında iki değişken hiç girilmemiş. Hepsini topladığınızda, veri setinizin %27'si delik deşik.
SPSS varsayılan olarak ne yaptı? Listwise deletion. Herhangi bir değişkende eksik değeri olan gözlemi komple attı. 120 hasta toplayıp 87'sini analiz ettiniz. Güç analiziniz 120'ye göre yapılmıştı. Gücünüz %80'den %65'e düştü.
Tanıdık geliyorsa, eksik veri stratejinizi gözden geçirmenin zamanı gelmiş demektir.
Mekanizmayı anlamadan yöntem seçemezsiniz
Eksik veri analizi, "hangi kutucuğu dolduracağım" sorusuyla başlamıyor. "Veri neden eksik?" sorusuyla başlıyor. Rubin'in 1976'da tanımladığı üç mekanizma, tüm stratejinin temelini oluşturuyor.
Laboratuvar numunesinin taşıma sırasında kırılması, veri giriş görevlisinin bir satırı atlaması -- bunlar tamamen rastgele kayıp (MCAR). Eksiklik hiçbir değişkenle ilişkili değil. Gerçek hayatta çok nadir.
Yaşlı hastaların genç hastalara göre daha fazla vizit kaçırması, düşük eğitim düzeyindeki katılımcıların anketi daha sık yarım bırakması -- bunlar koşullu rastgele kayıp (MAR). Eksiklik gözlenen değişkenlerle açıklanabiliyor. Çoklu imputasyon burada çalışıyor.
Ağır depresyondaki hastanın depresyon ölçeğini doldurmayı reddetmesi, yan etki yaşayan katılımcının ilaç çalışmasından çekilmesi -- bunlar rastgele olmayan kayıp (MNAR). En sorunlu durum. Standart yöntemler yanlı sonuç üretiyor.
Mekanizmayı kesin olarak belirlemek istatistiksel olarak imkansız -- MNAR tanımı gereği gözlenemeyen veriye dayanıyor. Bu yüzden pratikte MAR varsayımını kabul edip, MNAR olasılığını duyarlılık analiziyle değerlendirmek standart yaklaşım.
Little's MCAR testi: Ne söylüyor, ne söylemiyor?
Little'ın testi, farklı eksiklik örüntülerine sahip alt grupların ortalamalarını karşılaştıran bir ki-kare testi. p>0.05 ise MCAR reddedilemiyor. p<0.05 ise veriler MCAR değil -- ama MAR mı MNAR mı, bunu test söylemiyor.
SPSS'te: Analyze > Missing Value Analysis > EM > MCAR Test. R'de: naniar::mcar_test(data) veya BaylorEdPsych::LittleMCAR(data).
Dikkat gerektiren bir nokta: büyük örneklemlerde klinik olarak önemsiz farklılıklar bile istatistiksel anlamlılığa ulaşabiliyor. Küçük örneklemlerde ise testin gücü düşük. Bu yüzden sadece teste güvenmek yetersiz -- klinik muhakemeyle birlikte değerlendirmek gerekiyor.
Listwise deletion: Neden yetersiz?
SPSS'te çoğu analiz varsayılan olarak listwise deletion uyguluyor. Basit ve MCAR altında yansız. Ama ciddi güç kaybı var. 10 değişkenin her birinde bağımsız %5 eksiklik varsa, tam gözlem oranı 0.95^10 = %60. Gözlemlerin %40'ı kaybediliyor.
Pairwise deletion daha fazla veri kullanıyor ama farklı analizler farklı örneklemler üzerinde yürüyor. Tutarsız sonuçlar çıkabiliyor, korelasyon matrisi pozitif belirli olmayabiliyor.
Uyarı
Ortalama ile doldurma (mean substitution) yöntemini kesinlikle önermiyoruz. Değişkenin varyansını sistematik olarak küçültüyor, değişkenler arası korelasyonları zayıflatıyor, standart hataları yapay biçimde daraltıyor. Modern istatistik pratiğinde kabul edilebilir bir yöntem olarak görülmüyor. LOCF (Last Observation Carried Forward) da benzer sorunlar taşıyor.
Çoklu imputasyon: Altın standart
Rubin'in 1987'de önerdiği çoklu imputasyon (MI) üç aşamadan oluşuyor.
Birinci aşamada eksik değerler için m adet tamamlanmış veri seti oluşturuluyor. Her birinde farklı -- tahmin belirsizliğini yansıtıyor. İkinci aşamada ilgilendiğiniz analiz (regresyon, t-testi, ne olursa) her veri setinde ayrı ayrı çalıştırılıyor. Üçüncü aşamada m adet sonuç Rubin kurallarıyla birleştiriliyor. Havuzlanmış tahmin, m sonucun ortalaması. Toplam varyans ise hem analiz içi hem analizler arası varyansı içeriyor -- böylece imputasyon belirsizliği standart hatalara yansıyor.
MICE (Multivariate Imputation by Chained Equations) en yaygın MI algoritması. Her eksik değişken için ayrı bir model tanımlıyor: sürekli değişkenler için predictive mean matching (PMM), ikili değişkenler için lojistik regresyon, nominal değişkenler için multinomial lojistik. R'deki mice paketi bu esnekliği sunuyor; SPSS'in modülü daha sınırlı, özellikle kategorik değişkenlerde.
Kaç imputasyon yapılmalı? Eski kural 5-10 diyordu ama güncel öneriler eksiklik yüzdesine yakın sayıda imputasyon yapılmasını söylüyor. %20 eksiklik varsa en az 20 imputasyon. Graham ve arkadaşları (2007), 20+ imputasyonun parametre tahminlerinin kararlılığını önemli ölçüde artırdığını göstermiş. Hesaplama gücü artık kısıt değil -- m=50 veya m=100 kullanmak makul.
FIML: Imputasyon yapmadan analiz
Full Information Maximum Likelihood (FIML), eksik değerleri doldurmak yerine gözlenen verilerin olabilirlik fonksiyonunu maksimize ederek parametre tahmini yapıyor. Her gözlem için mevcut tüm bilgi kullanılıyor. Standart hataları doğrudan doğru hesaplıyor.
FIML, yapısal eşitlik modelleri (SEM) ve çok düzeyli modellerde özellikle güçlü. Mplus, lavaan (R) ve Amos destekliyor. MAR varsayımı altında MI ile asimptotik olarak eşdeğer sonuçlar veriyor.
Genel regresyon ve t-testi gibi analizlerde MI daha esnek bir çerçeve sunarken, SEM gibi model bazlı analizlerde FIML daha doğal bir seçenek.
Duyarlılık analizi: MAR varsayımını test etmek
MAR altında imputasyon yapıyorsunuz ama gerçek mekanizma MNAR ise sonuçlar yanlı olabilir. Bu riski değerlendirmek için duyarlılık analizi zorunlu.
Tipping point analizi en yaygın yöntem. Impute edilmiş değerlere sistematik bir sapma (delta) ekleniyor ve sonuçların hangi noktada anlamlılığını yitirdiği belirleniyor. Tedavi grubundaki eksik sonuç değerlerine delta=0, 1, 2, 3... eklenerek her senaryoda tedavi etkisi kontrol ediliyor. Tipping point klinik olarak mantıksız bir düzeyde ise, sonuçlar MNAR'a karşı dayanıklı.
EMA ve FDA, klinik araştırma raporlarında duyarlılık analizini zorunlu kılıyor. Hakemler de %10'un üzerinde eksiklik olan çalışmalarda bunu arıyor. En basit yaklaşım olarak complete case analizi ile MI sonuçlarını karşılaştırarak tutarlılığı göstermek bile hiç yapmamaktan çok daha güçlü.
Raporlama
Eksik veri analizinin doğru raporlanması, hakem sürecinde karşılaşılan eleştirileri önlemenin en etkili yolu. STROBE, CONSORT ve RECORD kılavuzları detaylı bilgi verilmesini açıkça talep ediyor.
Yöntem bölümünde: eksiklik mekanizması varsayımı ve gerekçesi, uygulanan yöntem, kaç imputasyon yapıldığı, modele dahil edilen değişkenler, duyarlılık analizi yaklaşımı ve kullanılan yazılım.
Sonuçlar bölümünde: her değişken için eksiklik oranı, Little's MCAR testi sonucu, MI/ML sonuçları (havuzlanmış tahminler), complete case ile karşılaştırma ve duyarlılık analizi bulguları.
Örnek raporlama cümlesi: "Birincil sonuç değişkeninde %12.4 eksiklik gözlendi. Little's MCAR testi MCAR ile uyumsuz bulundu (chi2=34.2, df=18, p=0.012). MAR varsayımı altında 20 tamamlanmış veri seti ile çoklu imputasyon uygulandı (MICE, PMM). Tipping point yaklaşımıyla sonuçların delta=5 birime kadar dayanıklı olduğu gösterildi."
Türkiye'de eksik veri farkındalığı
Türkiye'deki tıp tezlerinin önemli bir bölümünde eksik veri sorununa hiç değinilmiyor veya yalnızca "eksik veriler analiz dışı bırakıldı" ifadesi kullanılıyor. SPSS yaygın olarak kullanılıyor ama çoklu imputasyon modülü kategorik değişkenlerde sınırlı. R'deki mice paketi çok daha esnek bir ekosistem sunuyor.
Etik kurul başvurularında eksik veri stratejisinin protokolde belirtilmesi giderek daha fazla kurul tarafından bekleniyor. Veri temizleme kontrol listesi yazımız veri kalitesi sürecinde rehber olabiliyor.
Model İstatistik olarak eksik veri stratejisinin planlanmasından raporlanmasına kadar tüm sürece rehberlik ediyoruz. Dropout rate hesaplama yazımız katılımcı düzeyindeki kayıpları, bu yazı ise değişken düzeyindeki eksiklikleri ele alıyor -- ikisi birbirini tamamlıyor.
Eksik veri, çalışmanızın kaderi değil. Doğru mekanizma değerlendirmesi, uygun imputasyon yöntemi ve şeffaf raporlama ile eksik veri sorunu yönetilebilir bir teknik detaya dönüşüyor.