İNTERAKTİF · SİMÜLASYON

Örnekleme & Bootstrap:
Belirsizliği Ölç

85 milyon nüfustan 30 kişiyle neden güvenilir sonuç çıkarılabilir? Popülasyondan örneklem çek, dağılımın nasıl şekillendiğini izle, bootstrap ile güven aralığını hesapla.

🌍 1. Popülasyonu Seç

Gerçek hayatta popülasyonun tam dağılımını bilmeyiz — ama burada kontrol bizde. Farklı şekillerde dene.

Sağa uzanan kuyruk — maaş, servet · Popülasyon ortalaması: 0.00 · N = 5.000

💡 Çarpık dağılım dene — sampling dağılımının yine de normal görünmesi Merkezi Limit Teoremi'nin büyüsüdür.

🎲 2. Tek Örneklem Çek

Popülasyondan rastgele n kişi seçiyoruz. Bu bizim "anketimiz".

n = 30

Yukarıdaki butona tıkla → örneklem burada görünecek

📈 3. Örnekleme Dağılımı

Aynı n'lik örneklemi 1000 kez çekip her seferinde ortalamasını hesaplıyoruz. Bu ortalamaların dağılımı örnekleme dağılımı'dır — ve neredeyse her zaman normal görünür!

"1000 Örneklem Çek" butonuna bas → dağılım burada şekillenecek

🔁 4. Bootstrap — Tek Örneklemden Güven Aralığı

Gerçek hayatta popülasyona erişemeyiz — elimizde yalnızca bir örneklem var. Bootstrap, bu tek örneklemden yeniden örnekleme yaparak tahmin belirsizliğini ölçer.

⚠ Önce 2. bölümden bir örneklem çek.

Bootstrap uygula → güven aralığı burada şekillenecek

📚 Temel Kavramlar

Neden 1000 kişilik anket 85 milyonu temsil eder? +

Standart hata SE = σ/√n formülüne göre çalışır. σ=15 (tipik) ve n=1000 için SE ≈ 0.47. Bu, tahminimizin gerçek ortalamadan yalnızca yarım puan sapabileceği anlamına gelir — yeterince hassas. n'yi 4 katına çıkarmak SE'yi yalnızca yarıya indirir (√4=2), bu yüzden 85 milyon yerine 4000 kişilik anket yapmak çok az şey katıyor.

Merkezi Limit Teoremi (CLT) nedir? +

Popülasyon ne kadar "çirkin" (çarpık, bimodal, düzgün) olursa olsun, yeterince büyük n'de örneklem ortalamaları normal dağılıma yaklaşır. Kural: n ≥ 30 çoğu durumda yeterli. Bu teoremi istatistiğin "sihiri" olarak düşünebilirsin — parametrik testlerin çoğu buna dayanır.

Bootstrap ne zaman kullanılır? +

Teorik formülün olmadığı veya karmaşık olduğu durumlarda: medyan, oran, korelasyon gibi istatistikler için. Popülasyon dağılımı hakkında varsayımda bulunmak istemediğinde. Küçük örneklemlerde CLT'ye güvenilemeyecek durumlarda. Modern makine öğrenmesinde model güvenilirlik aralığı için de kullanılır.

%95 güven aralığı ne anlama gelir? +

Yanlış anlaşılan istatistik kavramlarının başında gelir. "Gerçek parametre %95 ihtimalle bu aralıkta" DEĞİLDİR. Doğrusu: "Aynı yöntemle 100 deney yapsak, üretilen 100 güven aralığının 95'i gerçek parametreyi kapsar." Bu sayfada birkaç kez örneklem çekip bootstrap uygularsan, bazen μ'nun aralık dışında kaldığını göreceksin — işte o %5'lik durum.

Örnekleme hatası vs. ölçüm hatası farkı? +

Örnekleme hatası: rastgele seçimden kaynaklanır, n artınca azalır, formülle ölçülür. Ölçüm hatası: yanlı soru, anket tasarımı, yanıt eğilimi gibi sistematik sorunlardan kaynaklanır, n artınca azalmaz, istatistiksel yöntemlerle düzeltilmez. 85 milyon kişiye sormak da yanlı bir soruyla yapılırsa yanlış sonuç verir.

🗂 Formül Özeti

Standart Hata

SE = s / √n

Örneklem ort. dalgalanması

%95 Normal CI

x̄ ± 1.96 × SE

Parametrik güven aralığı

Bootstrap CI

P2.5 — P97.5

Yeniden örneklem yüzdelikleri

CLT Koşulu

n ≥ 30

Genellikle yeterli