Tıpta uzmanlık tezinin veri analizi aşamasına geçtiniz. Excel'de 450 satırlık bir tablo var: hasta demografikleri, laboratuvar değerleri, takip verileri. Danışmanınız "SPSS'te analiz yap" dedi. Excel'i açtınız, SPSS'i açtınız, File > Open > Data dediniz ve... 12 sütun string olarak geldi, Türkçe karakterler bozuldu, tarihler 5 haneli sayıya döndü.
Tanıdık geldi mi?
Bu yazı aktarım sürecinin kendisine odaklanıyor: dosya hazırlığından encoding ayarlarına, değişken tanımlamadan doğrulamaya kadar tüm adımları sıralıyoruz. Aktarımda karşılaşılan spesifik hatalar ve tuzaklar için Excel-SPSS hataları yazımıza bakabilirsiniz.
Neden Bu Kadar Sorunlu?
Excel bir hesap tablosu programı, SPSS bir istatistik yazılımı. İkisinin veri anlama biçimi temelden farklı.
Excel'de bir hücreye "1" yazdığınızda program bunu sayı da metin de olarak yorumlayabilir. Hücre formatına bağlı. SPSS ise her değişkenin tipini (numeric, string, date), ölçek düzeyini (scale, ordinal, nominal) ve eksik veri kodunu net olarak bilmek istiyor.
Bu felsefe farkı, hazırlıksız aktarımlarda sorun çıkarıyor. Ama biraz hazırlıkla sorunsuz geçiş sağlamak mümkün.
Adım 1: Excel Dosyasını Hazırlama
Değişken adlandırma kuralları küçük ama kritik bir detay:
| Excel'deki Ad | Sorun | SPSS Uyumlu |
|---|---|---|
| Hasta Adı | Boşluk | hasta_adi |
| Yaş (yıl) | Parantez ve boşluk | yas_yil |
| 1.ölçüm | Sayıyla başlıyor | olcum_1 |
| BMI kg/m2 | Özel karakter | bmi_kg_m2 |
Adım 2: Encoding Ayarları
Türkçe karakterler (ş, ç, ğ, ı, ö, ü, İ) veri aktarımında en sık sorun çıkaran unsur. Excel'de doğru görünen "şikâyet" kelimesi SPSS'te "Åikâyet" olabiliyor.
Bunun nedeni encoding uyumsuzluğu. Eski .xls formatı Windows-1254 (Türkçe) kodlaması kullanırken, .xlsx UTF-8 destekliyor. SPSS ise versiyonuna göre farklı varsayılan encoding kullanabiliyor.
Çözüm: SPSS'te Edit > Options > General sekmesinde "Character Encoding for Data and Syntax" ayarını Unicode (UTF-8) yapmak. Dosyayı .xlsx olarak kaydetmek. Hala sorun varsa Excel'i önce CSV (UTF-8) olarak kaydedip SPSS'te CSV okuma sihirbazıyla açmak, burada encoding'i manuel seçebiliyorsunuz.
İpucu
Excel'de bir sütunun gerçekten sayısal olup olmadığını test etmenin kolay yolu: sütundaki herhangi bir hücreye TOPLA (SUM) fonksiyonu uygulayın. Sonuç sıfır çıkıyorsa ve hücrelerde veri varsa, o sütun metin olarak biçimlendirilmiş demektir. SPSS'e aktarımda string değişken oluşmasına neden olacaktır.
Adım 3: SPSS'te Import
File > Open > Data yolundan Excel dosyanızı seçin. Açılan pencerede "Read variable names from the first row of data" seçeneğini işaretleyin. İlk satırdaki değişken adlarınız SPSS'e aktarılacak.
Import sonrası Data View'da ilk 20-30 satırı hızlıca tarayın:
- Sayısal değerler doğru mu?
- Tarihler mantıklı mı yoksa 5 haneli sayılar mı?
- Türkçe karakterler sağlam mı?
- Case sayısı Excel'dekiyle eşleşiyor mu?
Bu hızlı kontrol, büyük sorunları erken yakalatıyor.
Adım 4: Variable View Düzenlemesi
SPSS'in asıl gücü burada. Variable View sekmesinde her değişken için 8 kritik alan var:
Type: Sayısal mı, metin mi, tarih mi? Excel'den gelen otomatik atama çoğu zaman yanlış.
Width ve Decimals: Sayısal değişkenlerde ondalık basamak sayısı. Yaş için 0, BMI için 1, p değeri için 3 gibi.
Label: Değişkenin uzun açıklaması. "yas_yil" yerine "Yaş (yıl olarak)" gibi. Analiz çıktılarında bu etiket görünüyor.
Values: Kategorik değişkenlerin değer etiketleri. 1=Erkek, 2=Kadın gibi. Frekans tablolarında ve grafiklerde bu etiketler okunuyor.
Missing: Eksik veri kodları. 99 veya 999 gibi değerleri burada tanımlarsanız SPSS analizlerde otomatik olarak missing sayıyor.
Measure: Ölçek düzeyi. Scale (sürekli), Ordinal (sıralı) veya Nominal (kategorik). SPSS otomatik atama yapıyor ama çoğu zaman yanlış. Likert ölçeği ordinal olmalı, cinsiyet nominal olmalı, yaş scale olmalı.
| Değişken | Doğru Tür | Doğru Ölçek | Sık Yapılan Hata |
|---|---|---|---|
| Yaş | Numeric | Scale | String olarak aktarılır |
| Cinsiyet (1/2) | Numeric | Nominal | Scale olarak kalır |
| Likert (1-5) | Numeric | Ordinal | Nominal atanır |
| Hemoglobin | Numeric | Scale | Ondalık hatasıyla string olur |
| Ameliyat tarihi | Date | - | String olarak aktarılır |
Bu adım zaman alıcı görünüyor ama analiz sırasında çok daha büyük zaman kayıplarını önlüyor.
Adım 5: Doğrulama
Import ve düzenleme bittikten sonra her şeyin doğru aktarıldığını teyit etmek gerekiyor.
Frekans kontrolü: Analyze > Descriptive Statistics > Frequencies ile her değişkenin dağılımını kontrol edin. Beklenmedik kategoriler (mesela cinsiyet değişkeninde 12 farklı değer) aktarım hatası işareti.
Min-max kontrolü: Analyze > Descriptive Statistics > Descriptives ile sayısal değişkenlerin aralığını inceleyin. Yaş değişkeninde minimum 0, maksimum 9500 gibi değerler görüyorsanız bir yerde toplam satırı veya kodlama hatası var.
Case sayısı kontrolü: Excel'deki satır sayısı ile SPSS'teki case sayısı eşleşmeli. Fark varsa boş satırlar veya gizli satırlar olabilir.
Eksik veri kontrolü: Beklediğiniz eksik veri sayısı ile SPSS'in gösterdiği missing sayısı uyumlu mu? Fazla missing varsa aktarım sırasında veri kaybolmuş olabilir.
Bu doğrulama adımlarını her aktarımda yapmak bir refleks haline gelmeli.
Büyük Dosyalar İçin CSV Alternatifi
500+ satırlık veya 100+ sütunluk dosyalarda doğrudan .xlsx import bazen yavaş kalabiliyor veya donma riski taşıyor.
CSV (UTF-8) formatı bu durumda daha güvenilir. Excel'de File > Save As > CSV UTF-8 olarak kaydedin. SPSS'te File > Read Text Data ile açın. CSV sihirbazında delimiter (ayırıcı), encoding ve değişken adı seçeneklerini manuel belirleyebiliyorsunuz. Daha fazla kontrol sunuyor.
CSV'nin dezavantajı: formüller, renkler ve formatlar kaybolur. Ama zaten SPSS'e bunların hiçbirini aktarmıyorsunuz, sadece değerleri aktarıyorsunuz.
SPSS Formatında Kaydetmek
Tüm düzenlemeler bittikten sonra dosyayı .sav formatında kaydetmek kritik. Bu format değişken tiplerini, etiketleri, missing tanımlarını ve ölçek düzeylerini koruyor. Bir daha Excel'den import etmenize gerek kalmıyor.
Eğer etiketleme işlemini her seferinde tekrar yapmak istemiyorsanız SPSS syntax dosyası (.sps) yazabilirsiniz. Syntax ile tüm etiketleme ve düzenleme komutlarını kaydedip tek tıkla çalıştırabilirsiniz. Özellikle çok merkezli çalışmalarda farklı kurumlardan gelen benzer formattaki verilere aynı syntax'ı uygulamak büyük zaman tasarrufu sağlıyor.
Verileriniz hazır olduğunda analiz aşamasına geçmeden önce normallik testi sonuçlarını değerlendirmekte fayda var. Hangi istatistik testini uygulayacağınız büyük ölçüde veri dağılımına bağlı.
Model İstatistik olarak veri aktarım sürecinde ve analiz aşamasında araştırmacılara rehberlik sağlıyoruz. Veri kontrolünden raporlamaya kadar tüm süreci birlikte yürütüyoruz.
Temiz aktarım, güvenilir analizin ilk adımı.