Örnekleme & Bootstrap:
Belirsizliği Ölç
85 milyon nüfustan 30 kişiyle neden güvenilir sonuç çıkarılabilir? Popülasyondan örneklem çek, dağılımın nasıl şekillendiğini izle, bootstrap ile güven aralığını hesapla.
🌍 1. Popülasyonu Seç
Gerçek hayatta popülasyonun tam dağılımını bilmeyiz — ama burada kontrol bizde. Farklı şekillerde dene.
🎲 2. Tek Örneklem Çek
Popülasyondan rastgele n kişi seçiyoruz. Bu bizim "anketimiz".
📈 3. Örnekleme Dağılımı
Aynı n'lik örneklemi 1000 kez çekip her seferinde ortalamasını hesaplıyoruz. Bu ortalamaların dağılımı örnekleme dağılımı'dır — ve neredeyse her zaman normal görünür!
🔁 4. Bootstrap — Tek Örneklemden Güven Aralığı
Gerçek hayatta popülasyona erişemeyiz — elimizde yalnızca bir örneklem var. Bootstrap, bu tek örneklemden yeniden örnekleme yaparak tahmin belirsizliğini ölçer.
📚 Temel Kavramlar
Neden 1000 kişilik anket 85 milyonu temsil eder? +
Standart hata SE = σ/√n formülüne göre çalışır. σ=15 (tipik) ve n=1000 için SE ≈ 0.47. Bu, tahminimizin gerçek ortalamadan yalnızca yarım puan sapabileceği anlamına gelir — yeterince hassas. n'yi 4 katına çıkarmak SE'yi yalnızca yarıya indirir (√4=2), bu yüzden 85 milyon yerine 4000 kişilik anket yapmak çok az şey katıyor.
Merkezi Limit Teoremi (CLT) nedir? +
Popülasyon ne kadar "çirkin" (çarpık, bimodal, düzgün) olursa olsun, yeterince büyük n'de örneklem ortalamaları normal dağılıma yaklaşır. Kural: n ≥ 30 çoğu durumda yeterli. Bu teoremi istatistiğin "sihiri" olarak düşünebilirsin — parametrik testlerin çoğu buna dayanır.
Bootstrap ne zaman kullanılır? +
Teorik formülün olmadığı veya karmaşık olduğu durumlarda: medyan, oran, korelasyon gibi istatistikler için. Popülasyon dağılımı hakkında varsayımda bulunmak istemediğinde. Küçük örneklemlerde CLT'ye güvenilemeyecek durumlarda. Modern makine öğrenmesinde model güvenilirlik aralığı için de kullanılır.
%95 güven aralığı ne anlama gelir? +
Yanlış anlaşılan istatistik kavramlarının başında gelir. "Gerçek parametre %95 ihtimalle bu aralıkta" DEĞİLDİR. Doğrusu: "Aynı yöntemle 100 deney yapsak, üretilen 100 güven aralığının 95'i gerçek parametreyi kapsar." Bu sayfada birkaç kez örneklem çekip bootstrap uygularsan, bazen μ'nun aralık dışında kaldığını göreceksin — işte o %5'lik durum.
Örnekleme hatası vs. ölçüm hatası farkı? +
Örnekleme hatası: rastgele seçimden kaynaklanır, n artınca azalır, formülle ölçülür. Ölçüm hatası: yanlı soru, anket tasarımı, yanıt eğilimi gibi sistematik sorunlardan kaynaklanır, n artınca azalmaz, istatistiksel yöntemlerle düzeltilmez. 85 milyon kişiye sormak da yanlı bir soruyla yapılırsa yanlış sonuç verir.