Merkezi Limit Teoremi: her şey eninde sonunda normal dağılır
2026 · istatistik · olasılık · 10 dakika
Dağılım ne kadar çarpık, garip veya simetrik olursa olsun — yeterince büyük bir örneklemden alınan ortalamaların dağılımı hep normal dağılıma yaklaşır. Bu, istatistiğin en güçlü ve en şaşırtıcı gerçeklerinden biri. Aşağıda gözlerinizle görün.
Nasıl çalışır?
Bir popülasyondan n tane değer seç, ortalamasını al. Bunu yüzlerce kez tekrarla. Bu ortalamaların dağılımı ne olur?
Popülasyon dağılımı ne olursa olsun, n yeterince büyükse X̄ ~ N(μ, σ²/n) yakınsaması gerçekleşir. Genellikle n ≥ 30 yeterlidir.
Neden bu kadar önemli?
İstatistiğin büyük çoğunluğu bu teoreme dayanır. Güven aralığı hesaplarken, hipotez testi yaparken, A/B testi sonuçlarını yorumlarken — hepinde örneklem ortalamasının normal dağıldığını varsayarsın. Popülasyon dağılımı ne olursa olsun bu varsayım geçerli çünkü CLT var.
Ne zaman dikkatli olmalısın?
- Küçük örneklem (n < 30): CLT henüz tam oturmamış olabilir, özellikle çarpık dağılımlarda
- Ağır kuyruklu dağılımlar: Çok aşırı değerler içeren dağılımlar için daha büyük n gerekebilir
- Bağımlı gözlemler: Zaman serisi, kümelenmiş veri — bağımsızlık varsayımı bozulabilir
Günlük hayatta CLT
- 100 müşterinin ortalama sipariş tutarı her gün biraz farklı — ama bu farkların dağılımı normaldir
- A/B testinde conversion rate'lerin farkı — normal dağılıma yaklaşır, bu yüzden z-testi kullanabiliriz
- Seçim anketleri — örneklem yeterince büyükse ±hata marjını güvenle hesaplarsın
Python'da
import numpy as np
import matplotlib.pyplot as plt
# Bimodal popülasyondan örnekle
def bimodal():
return np.random.normal(0.25, 0.08) if np.random.random() < 0.5 else np.random.normal(0.75, 0.08)
n = 30 # örneklem büyüklüğü
tekrar = 1000 # kaç kez örnekle
ortalamalar = [
np.mean([bimodal() for _ in range(n)])
for _ in range(tekrar)
]
# Sonuç → normal dağılıma benzeyecek
plt.hist(ortalamalar, bins=40, density=True, color='#1D9E75', alpha=0.7)
plt.title(f'Örneklem ortalamaları — n={n}, tekrar={tekrar}')
plt.xlabel('x̄')
plt.show()
# Ampirik standart hata
print(f"Teorik SE: {0.271 / np.sqrt(n):.4f}")
print(f"Ampirik SE: {np.std(ortalamalar):.4f}")Özet
- Popülasyon dağılımı ne olursa olsun, örneklem ortalamaları normal dağılıma yaklaşır
- n arttıkça yakınsama hızlanır, standart hata (σ/√n) küçülür
- n ≥ 30 çoğu durumda yeterlidir
- Güven aralığı, hipotez testi ve A/B testinin matematiksel temeli CLT'dir
İlgili: A/B test hesaplayıcı →