Lojistik regresyon modeli kuruldu. Sekiz bağımsız değişken eklendi — yaş, BMI, trigliserid, total kolesterol, LDL, HDL, glukoz, insülin. SPSS'te "Run" denildi. Çıktıya bakıldığında: bazı değişkenlerin katsayısı mantıksız, bazı p değerleri 0.90, bir kısım standart hata astronomik büyüklükte.
Neden? Çünkü modelde multicollinearity var.
Multicollinearity ne demek?
Multicollinearity, bağımsız değişkenlerin birbiriyle yüksek korelasyonlu olması. Regresyon modeline "bu değişkenlerin her biri bağımsız etkiye sahip" varsayımıyla dahil edilen değişkenler aslında birbiriyle ilintili olduğunda, model katsayıları stabil bir şekilde hesaplayamıyor.
Trigliserid ile total kolesterol arasında r=0.85 korelasyon varsa, ikisi aynı modele konulduğunda model şaşırıyor: "Bunların ikisi neredeyse aynı şeyi ölçüyor, ikisinin de etkisini ayrı hesaplamam imkansız." Sonuç: katsayılar çılgınca büyüyüp küçülüyor, standart hatalar şişiyor, p değerleri güvenilirliğini yitiriyor.
Danışmanlık sürecimizde 12 bağımsız değişkenli bir modelle karşılaştık — değişkenlerden 7'si kan lipid panel parametresiydi (total kolesterol, LDL, HDL, VLDL, trigliserid, apoB, non-HDL). VIF değerleri 30-40 bandında. Hakemin ilk yorumu: "Model yorumlanamaz. Değişken sayısını azaltın."
Nasıl tespit edilir?
İki yöntem öne çıkıyor: korelasyon matrisi ve VIF (Variance Inflation Factor).
Korelasyon matrisi basit ama yüzeysel. İki değişken arasındaki ikili korelasyona bakılıyor — r>0.80 görülürse potansiyel sorun var demek. Ancak multicollinearity üç veya daha fazla değişken arasında da oluşabiliyor; bu durumda ikili korelasyonlar düşük görünse bile model çökebiliyor.
VIF daha güvenilir. Her değişkenin diğer bağımsız değişkenlerle ne kadar açıklandığını ölçüyor. Değer 1'e yakınsa sorun yok, 5-10 arası şüpheli, 10 üzeri ciddi sorun.
SPSS'te Linear Regression > Statistics > Collinearity diagnostics yolu izleniyor. R'da car::vif() fonksiyonu, Stata'da regresyon sonrasında estat vif komutu kullanılıyor.
Multicollinearity ne yapıyor?
Multicollinearity modeli imha etmiyor — sessizce sabote ediyor. R² hala yüksek çıkabiliyor ama katsayılar güvenilir değil.
Katsayılar dengesizleşiyor. LDL için β=2.3 (p=0.02), HDL için β=−4.1 (p=0.87) bulunuyor. HDL ile ilgili güvenilir bir yorum yapmak imkansız hale geliyor — çünkü LDL ile iç içe geçmiş durumda.
Standart hatalar şişiyor. Katsayı tahmini stabil olmadığında standart hata büyüyor, güven aralığı genişliyor, p değerleri anlamlılık bulamıyor. Gerçekte etkili olan bir değişken, multicollinearity yüzünden anlamsız çıkabiliyor.
Model yorumlanamaz hale geliyor. "BMI 1 birim artınca risk 0.4 kat azalıyor" bulgusu, eğer bel çevresi de modeldeyse mantıksız bir sonuç — çünkü BMI ile bel çevresi zaten aynı şeyi ölçüyor.
Daha kötüsü: model farklı bir örneklemde tekrarlandığında katsayılar tamamen farklı çıkabiliyor. Bu replikasyon için felaket anlamına geliyor.
Çözüm 1: Değişken eleme
En basit ve en etkili çözüm: ilişkili değişkenlerden birini çıkarmak.
Total kolesterol ile LDL arasında r=0.92 korelasyon varsa, ikisinden biri seçilmeli. Hangisi? Klinik mantık ve literatür belirleyici. Kardiyovasküler risk modelinde LDL daha spesifik olduğu için genellikle tercih ediliyor.
Korelasyon matrisi çizilip 0.80 üzeri korelasyonlar not ediliyor. Her çiftten biri çıkarılıyor. VIF tekrar hesaplanıyor. Hala 10 üzerindeyse bir değişken daha çıkarılıyor — iteratif bir süreç.
Danışmanlıklarımızda en sık uyguladığımız yaklaşım bu: "12 değişkenli model var, ama 5 tanesi birbiriyle yüksek korelasyonlu — 3 tanesini çıkaralım." Model hem yorumlanabilir hale geliyor hem de makale hakemlerden geçiyor.
Çözüm 2: Birleştirme veya PCA
Bazen değişken çıkarmak istenmeyebilir — hepsi klinik olarak anlamlı. Bu durumda birleştirme düşünülebilir.
Composite score: Trigliserid, LDL, HDL birleştirilerek tek bir "lipid skoru" oluşturulabiliyor. Ortalama alınabiliyor veya klinik kılavuzlara göre ağırlıklandırılabiliyor.
Principal Component Analysis (PCA): Yüksek korelasyonlu değişkenler boyut indirgeme ile birleştiriliyor. İlk 2-3 principal component orijinal değişkenlerin varyansının %80-90'ını açıklıyorsa, onlar kullanılabiliyor. Ancak yorumlama zorlaşıyor — PC1'in klinik olarak ne anlama geldiğini tartışma bölümünde açıklamak gerekiyor.
İpucu
VIF hesaplandıktan sonra değişken çıkarmaya başlamadan önce korelasyon matrisinin çizilip değişkenlerin gruplandırılması çok faydalı. "Lipid grubu", "inflamasyon grubu", "glisemik kontrol grubu" gibi. Her gruptan en klinik anlamlı olan bırakılıp diğerleri çıkarıldığında hem multicollinearity çözülüyor hem model yorumlanabilir kalıyor.
Çözüm 3: Ridge/Lasso regresyon
Klasik regresyon yerine penalized regression de bir seçenek. Ridge regresyon katsayıları sıfıra yaklaştırıp stabilize ediyor; Lasso regresyon ise bazı katsayıları tam sıfır yaparak otomatik değişken eleme gerçekleştiriyor.
Bu yöntemler makine öğrenmesi tabanlı çalışmalarda yaygın ama klasik biyomedikal dergilerde henüz standart değil. Kullanılacaksa metodolojide açıkça belirtilmesi ve sonuçların klasik regresyonla karşılaştırılması bekleniyor. Lojistik regresyonda OR ve CI raporlama kuralları bu karşılaştırmada referans noktası oluşturuyor.
Raporlama
Regresyon analizi yapıldığında VIF değerlerinin belirtilmesi bekleniyor:
"Multicollinearity değerlendirmesi Variance Inflation Factor (VIF) ile yapılmıştır. Tüm değişkenler için VIF < 5 bulunmuştur."
Yüksek VIF bulunup değişken çıkarıldıysa: "Başlangıçta 10 bağımsız değişken değerlendirilmiş, ancak VIF > 10 nedeniyle total kolesterol ve VLDL modelden çıkarılmıştır."
Bu şeffaflık hakemlerin "neden bu değişken yok?" sorusunu önceden yanıtlıyor. Lojistik regresyon model kurma stratejisi yazımızda değişken seçim sürecinin tamamı detaylı ele alınıyor.
VIF düşük ama model hala tutarsız?
VIF < 5 bulunmasına rağmen model tutarsız sonuçlar veriyorsa birkaç olasılık var:
Örneklem yetersizliği. Her bağımsız değişken için en az 10-15 olay gerekiyor. 8 değişkenli bir modelde 80-120 olay bekleniyor — olay sayısı 45 ise model overfitting yapıyor olabilir.
Non-linearity. Değişkenler arasında doğrusal olmayan ilişki varsa katsayılar yanıltıcı çıkabiliyor. Spline veya kategorik dönüşüm denenmesi gerekebilir.
Uç değer etkisi. Birkaç influential case tüm modeli bozabiliyor. Cook's distance ile kontrol edilmesi öneriliyor.
VIF tek başına yeterli değil — model diagnostics paketinin bir parçası. p değeri anlamsız çıktığında ne yapılacağını bilmek de bu değerlendirme sürecinin doğal tamamlayıcısı.
Model İstatistik ekibi olarak regresyon modellerinin kurulmasından multicollinearity değerlendirmesine, değişken seçim stratejisinden raporlamaya kadar tüm süreçte destek sunmaktan memnuniyet duyarız.