İzmir kira piyasası: 5.841 ilan, bir analist gözüyle
2024 · 12 dakika okuma · Python + pandas + sklearn
İzmir'de ev aramak artık farklı bir spor. Bir ilan açıyorsun, iki gün sonra fiyat değişmiş. Üç ay önce uygun olan ilçe bütçenin dışına çıkmış. Peki hangi ilçe gerçekten değerli, hangisi sadece büyük?
Veriyi açalım ve bakalım. Kaggle'daki İzmir Konut Fiyatları 2024 datasetinden 5.841 ilan, 4.211 temizlenmiş daire kaydıyla çalıştık.
Veriyi Tanıyalım
Dataset şu sütunları içeriyor: gayrimenkul tipi, fiyat, oda sayısı, salon, alan (m²), bina yaşı, il ve ilçe. Aykırı değerleri temizlemek için fiyatın 1. ve 99. yüzdelik dilimini kestik.
import pandas as pd
df = pd.read_csv('data_cleaned.csv')
df['district'] = df['district'].str.strip()
daire = df[df['left'] == 'Daire'].copy()
q1 = daire['price'].quantile(0.01)
q99 = daire['price'].quantile(0.99)
daire = daire[(daire['price'] >= q1) & (daire['price'] <= q99)]
print(f"Temiz kayıt: {len(daire)}") # 4211Hangi İlçe Ne Kadar?
Ham fiyat sıralamalarına bakınca Güzelbahçe, Çeşme ve Narlıdere üst sıralarda. Ama bu sıralama yanıltıcı olabilir — büyük daireler her zaman pahalıdır. Daha adil karşılaştırma için m² başına fiyata bakmak gerekiyor.

Asıl Soru: m² Başına Fiyat
m² bazında baktığımızda tablo değişiyor: Çeşme 68.750 TL/m² ile açık ara birinci. Urla (60.968), Güzelbahçe (56.071) ve Narlıdere (47.318) takip ediyor. Karşıyaka ise medyan fiyatta yüksek görünse de m² bazında orta pakette kalıyor.

En uygun m² fiyatı Tire (22.222 TL) ve Ödemiş'te (19.346 TL). Şehir merkezine uzaklığın bedeli net görünüyor.
Oda Sayısı Fiyatı Ne Kadar Etkiliyor?
Oda sayısı arttıkça fiyat artıyor. Ama dikkat çekici olan kutu grafiğindeki geniş aralıklar: aynı oda sayısına sahip daireler arasında 2-3 kat fiyat farkı olabiliyor.

Alan mı, Oda mı, Yaş mı?
Korelasyon analizinde alanın fiyatla ilişkisi (0.49) oda sayısından (0.31) çok daha güçlü. Bina yaşı ise şaşırtıcı şekilde zayıf etki gösteriyor (-0.08). Yani asıl soru kaç odalı değil, kaç m².

Yeni Bina Farkı Gerçek mi?
Evet, gerçek. 0-5 yaş binalarda m² fiyatı en yüksek. Ama 6-10 ile 11-15 yıl arası binalarda fiyat neredeyse aynı. Biraz eski bina almak mantıklı olabilir.

Fiyat Tahmin Edebilir miyiz?
Alan, oda sayısı ve bina yaşını kullanarak linear regression modeli kurduk. Sonuç: R² = 0.27. Bu üç değişken fiyat değişiminin yalnızca yüzde 27'sini açıklayabiliyor.
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score
X = daire[['area', 'room', 'age']]
y = daire['price']
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, random_state=42
)
model = LinearRegression()
model.fit(X_train, y_train)
print(f"R²: {r2_score(y_test, model.predict(X_test)):.3f}")
# Sonuç: 0.273Geri kalan yüzde 73 nerede? İlçe, kat, manzara, ulaşım, sosyal donatı... İyi bir modelin sınırını bilmek, modeli körce kullanmaktan değerlidir.
3 Ana Bulgu
- Çeşme ve Urla m² bazında tartışmasız en pahalı. Ham fiyata değil, m² fiyatına bakın.
- Alanı büyük daire pahalıdır ama m²'si pahalı olmayabilir. Karşıyaka bunun örneği.
- Alan, oda ve yaşla fiyat tahmini mümkün ama yetersiz. Konum verisi olmadan model gerçek hayatı yakalamıyor.
Sıradaki yazıda ilçe bilgisini de modele ekleyip R²'yi ne kadar yukarı çekebileceğimize bakacağız. Spoiler: fark büyük.