veri bilimi · türkçe
Hakkımda🗺️ Haritam
AnasayfaTüm İçerikler
← Ana sayfa
interaktifgörselleştirme10 dakika

Sayılar aynı —
ama gerçek çok farklı

1973'te Frank Anscombe, yalnızca istatistiklere bakmanın ne kadar yanıltıcı olduğunu kanıtlamak için dört veri seti oluşturdu. Hepsi aynı ortalama, varyans, korelasyon ve regresyon çizgisine sahip — ama grafikleri bambaşka.

📐
4 veri seti, birebir aynı istatistikler
Her satır 4 veri seti için de geçerli
İstatistikIIIIIIIV
n11111111
x̄ (ortalama)9.009.009.009.00
ȳ (ortalama)7.50 ±0.017.50 ±0.017.50 ±0.017.50 ±0.01
Var(x)11.0011.0011.0011.00
Var(y)~4.12~4.12~4.12~4.12
Korelasyon0.8160.8160.8160.816
Regresyony = 3.0 + 0.5xy = 3.0 + 0.5xy = 3.0 + 0.5xy = 3.0 + 0.5x
0.670.670.670.67
💡 Bunları gören bir analist "bu veri setleri benzer" der. Ama grafik çizilince…
I
📊
Veri Seti I
II
📊
Veri Seti II
III
📊
Veri Seti III
IV
📊
Veri Seti IV
Devam et
📉 Lineer Regresyon🐼 Pandas ile Veri Analizi⚖️ Bias-Variance Trade-off
Bu içerik:

Bunları da beğenebilirsin

interaktif

Linear regression: çizgiyi sen çiz

8 dakika

interaktif

Gradient descent: top yuvarlama oyunu

10 dakika

interaktif

K-Means: müşterilerini kümele

10 dakika

Faydalı bulduysan paylaş

X'te paylaşLinkedIn'de paylaş

💬 Yorumlar