Merkezi Limit Teoremi: her şey eninde sonunda normal dağılır

2026 · istatistik · olasılık · 10 dakika

Dağılım ne kadar çarpık, garip veya simetrik olursa olsun — yeterince büyük bir örneklemden alınan ortalamaların dağılımı hep normal dağılıma yaklaşır. Bu, istatistiğin en güçlü ve en şaşırtıcı gerçeklerinden biri. Aşağıda gözlerinizle görün.

Nasıl çalışır?

Bir popülasyondan n tane değer seç, ortalamasını al. Bunu yüzlerce kez tekrarla. Bu ortalamaların dağılımı ne olur?

Örneklem ortalaması: X̄ = (X₁ + X₂ + ··· + Xₙ) / n

Ortalama: E[X̄] = μ (popülasyon ortalamasına eşit)

Standart hata: SE = σ / √n (n büyüdükçe küçülür)

Popülasyon dağılımı ne olursa olsun, n yeterince büyükse X̄ ~ N(μ, σ²/n) yakınsaması gerçekleşir. Genellikle n ≥ 30 yeterlidir.

⚡ Merkezi Limit Teoremi — DeneÖrnekle butonuna bas

POPÜLASYONun DAĞILIMI

Her değer eşit olasılıkla — tamamen düz

ÖRNEKLEM BÜYÜKLÜĞÜ (n) — her örnekte kaç değer?

Teorik standart hata: σ/√n = 0.289/√1 = 0.289

POPÜLASYONun DAĞILIMI (μ=0.50, σ=0.289)Düzgün

↓ n=1 değer seç → ortalama al

ÖRNEKLEM ORTALAMALARI DAĞILIMI (0 örneklem)

Örnekle butonuna bas →

💡 Dene: Bimodal dağılımı seç, n=1 ile başla → çarpık görünür. Sonra n=30 yap → birkaç yüz örneklemden sonra normal eğriyle örtüşür.

Neden bu kadar önemli?

İstatistiğin büyük çoğunluğu bu teoreme dayanır. Güven aralığı hesaplarken, hipotez testi yaparken, A/B testi sonuçlarını yorumlarken — hepinde örneklem ortalamasının normal dağıldığını varsayarsın. Popülasyon dağılımı ne olursa olsun bu varsayım geçerli çünkü CLT var.

Ne zaman dikkatli olmalısın?

Küçük örneklem (n < 30): CLT henüz tam oturmamış olabilir, özellikle çarpık dağılımlarda
Ağır kuyruklu dağılımlar: Çok aşırı değerler içeren dağılımlar için daha büyük n gerekebilir
Bağımlı gözlemler: Zaman serisi, kümelenmiş veri — bağımsızlık varsayımı bozulabilir

Günlük hayatta CLT

100 müşterinin ortalama sipariş tutarı her gün biraz farklı — ama bu farkların dağılımı normaldir
A/B testinde conversion rate'lerin farkı — normal dağılıma yaklaşır, bu yüzden z-testi kullanabiliriz
Seçim anketleri — örneklem yeterince büyükse ±hata marjını güvenle hesaplarsın

Python'da

import numpy as np
import matplotlib.pyplot as plt

# Bimodal popülasyondan örnekle
def bimodal():
    return np.random.normal(0.25, 0.08) if np.random.random() < 0.5            else np.random.normal(0.75, 0.08)

n = 30          # örneklem büyüklüğü
tekrar = 1000   # kaç kez örnekle

ortalamalar = [
    np.mean([bimodal() for _ in range(n)])
    for _ in range(tekrar)
]

# Sonuç → normal dağılıma benzeyecek
plt.hist(ortalamalar, bins=40, density=True, color='#1D9E75', alpha=0.7)
plt.title(f'Örneklem ortalamaları — n={n}, tekrar={tekrar}')
plt.xlabel('x̄')
plt.show()

# Ampirik standart hata
print(f"Teorik SE: {0.271 / np.sqrt(n):.4f}")
print(f"Ampirik SE: {np.std(ortalamalar):.4f}")

Özet

Popülasyon dağılımı ne olursa olsun, örneklem ortalamaları normal dağılıma yaklaşır
n arttıkça yakınsama hızlanır, standart hata (σ/√n) küçülür
n ≥ 30 çoğu durumda yeterlidir
Güven aralığı, hipotez testi ve A/B testinin matematiksel temeli CLT'dir

İlgili: A/B test hesaplayıcı →