Statystyka
Średnia arytmetyczna, mediana, dominanta, odchylenie standardowe, wariancja, wykresy statystyczne.
Statystyka
1. Miary tendencji centralnej
Średnia arytmetyczna (x̄)
x̄ = (x₁ + x₂ + … + xₙ) / n
Średnia ważona:
x̄ = (w₁x₁ + w₂x₂ + … + wₙxₙ) / (w₁ + w₂ + … + wₙ)
Mediana (Me)
Mediana to wartość środkowa po uporządkowaniu danych.
- n nieparzyste: Me = x₍₍ₙ₊₁₎/₂₎
- n parzyste: Me = (x₍ₙ/₂₎ + x₍ₙ/₂₊₁₎) / 2
Przykład: Dane: 3, 7, 8, 12, 15
Me = 8 (element środkowy)
Przykład: Dane: 3, 7, 8, 12
Me = (7 + 8)/2 = 7,5
Dominanta (Moda, Mo)
Dominanta to wartość występująca najczęściej.
Przykład: Dane: 2, 3, 3, 5, 7, 7, 7, 9 → Mo = 7
Uwaga: zbiór danych może mieć kilka dominant lub nie mieć żadnej.
---
2. Miary rozproszenia (zmienności)
Rozstęp (R)
R = x_max − x_min
Wariancja (σ²)
σ² = [(x₁ − x̄)² + (x₂ − x̄)² + … + (xₙ − x̄)²] / n
Inaczej: średnia kwadratów odchyleń od średniej.
Odchylenie standardowe (σ)
σ = √(σ²)
Im mniejsze σ, tym dane bardziej skupione wokół średniej.
---
3. Przykład z rozwiązaniem
Zadanie: Oblicz średnią, medianę, dominantę, wariancję i odchylenie standardowe dla danych: 4, 6, 6, 8, 10, 12.
Średnia:
x̄ = (4 + 6 + 6 + 8 + 10 + 12) / 6 = 46/6 ≈ 7,67
Mediana:
Dane uporządkowane: 4, 6, 6, 8, 10, 12 (n = 6, parzyste)
Me = (6 + 8)/2 = 7
Dominanta:
Mo = 6 (występuje 2 razy)
Wariancja:
σ² = [(4−7,67)² + (6−7,67)² + (6−7,67)² + (8−7,67)² + (10−7,67)² + (12−7,67)²] / 6
σ² = [13,47 + 2,79 + 2,79 + 0,11 + 5,43 + 18,77] / 6
σ² = 43,36/6 ≈ 7,23
Odchylenie standardowe:
σ = √7,23 ≈ 2,69
Interpretacja: Wyniki różnią się od średniej przeciętnie o około 2,69.
---
4. Wykresy statystyczne
| Typ wykresu | Zastosowanie |
|-------------|-------------|
| Histogram | Dane ciągłe pogrupowane w przedziały |
| Diagram słupkowy | Dane dyskretne, porównanie kategorii |
| Diagram kołowy | Udziały procentowe |
| Wykres pudełkowy (box plot) | Me, Q₁, Q₃, min, max |
| Diagram punktowy | Zależność między dwiema zmiennymi |
---
5. Kwartyle
Q₁ (pierwszy kwartyl) — 25% danych poniżej
Q₂ = Me (mediana) — 50% danych poniżej
Q₃ (trzeci kwartyl) — 75% danych poniżej
Rozstęp międzykwartylowy: IQR = Q₃ − Q₁
---
6. Percentyle
Percentyl k-ty (Pₖ) — wartość, poniżej której leży k% danych.
- P₅₀ = Me
- P₂₅ = Q₁
- P₇₅ = Q₃
---
Częste błędy
- Mediana wymaga UPORZĄDKOWANIA danych — nie bierz elementu „ze środka" nieposortowanej listy!
- Wariancja to średnia kwadratów odchyleń, NIE średnia odchyleń
- Odchylenie standardowe = √wariancji, nie wariancja/n
- Dominanta może nie istnieć (gdy wszystkie wartości różne) lub być niejednoznaczna