📐 Matematyka
1535 min

Statystyka

Średnia arytmetyczna, mediana, dominanta, odchylenie standardowe, wariancja, wykresy statystyczne.


Statystyka

1. Miary tendencji centralnej

Średnia arytmetyczna (x̄)

x̄ = (x₁ + x₂ + … + xₙ) / n

Średnia ważona:
x̄ = (w₁x₁ + w₂x₂ + … + wₙxₙ) / (w₁ + w₂ + … + wₙ)

Mediana (Me)

Mediana to wartość środkowa po uporządkowaniu danych.

  • n nieparzyste: Me = x₍₍ₙ₊₁₎/₂₎
  • n parzyste: Me = (x₍ₙ/₂₎ + x₍ₙ/₂₊₁₎) / 2

Przykład: Dane: 3, 7, 8, 12, 15
Me = 8 (element środkowy)

Przykład: Dane: 3, 7, 8, 12
Me = (7 + 8)/2 = 7,5

Dominanta (Moda, Mo)

Dominanta to wartość występująca najczęściej.

Przykład: Dane: 2, 3, 3, 5, 7, 7, 7, 9 → Mo = 7

Uwaga: zbiór danych może mieć kilka dominant lub nie mieć żadnej.

---

2. Miary rozproszenia (zmienności)

Rozstęp (R)


R = x_max − x_min

Wariancja (σ²)

σ² = [(x₁ − x̄)² + (x₂ − x̄)² + … + (xₙ − x̄)²] / n

Inaczej: średnia kwadratów odchyleń od średniej.

Odchylenie standardowe (σ)

σ = √(σ²)

Im mniejsze σ, tym dane bardziej skupione wokół średniej.

---

3. Przykład z rozwiązaniem

Zadanie: Oblicz średnią, medianę, dominantę, wariancję i odchylenie standardowe dla danych: 4, 6, 6, 8, 10, 12.

Średnia:
x̄ = (4 + 6 + 6 + 8 + 10 + 12) / 6 = 46/6 ≈ 7,67

Mediana:
Dane uporządkowane: 4, 6, 6, 8, 10, 12 (n = 6, parzyste)
Me = (6 + 8)/2 = 7

Dominanta:
Mo = 6 (występuje 2 razy)

Wariancja:
σ² = [(4−7,67)² + (6−7,67)² + (6−7,67)² + (8−7,67)² + (10−7,67)² + (12−7,67)²] / 6
σ² = [13,47 + 2,79 + 2,79 + 0,11 + 5,43 + 18,77] / 6
σ² = 43,36/6 ≈ 7,23

Odchylenie standardowe:
σ = √7,23 ≈ 2,69

Interpretacja: Wyniki różnią się od średniej przeciętnie o około 2,69.

---

4. Wykresy statystyczne

| Typ wykresu | Zastosowanie |
|-------------|-------------|
| Histogram | Dane ciągłe pogrupowane w przedziały |
| Diagram słupkowy | Dane dyskretne, porównanie kategorii |
| Diagram kołowy | Udziały procentowe |
| Wykres pudełkowy (box plot) | Me, Q₁, Q₃, min, max |
| Diagram punktowy | Zależność między dwiema zmiennymi |

---

5. Kwartyle

Q₁ (pierwszy kwartyl) — 25% danych poniżej
Q₂ = Me (mediana) — 50% danych poniżej
Q₃ (trzeci kwartyl) — 75% danych poniżej

Rozstęp międzykwartylowy: IQR = Q₃ − Q₁

---

6. Percentyle

Percentyl k-ty (Pₖ) — wartość, poniżej której leży k% danych.

  • P₅₀ = Me
  • P₂₅ = Q₁
  • P₇₅ = Q₃

---

Częste błędy


  • Mediana wymaga UPORZĄDKOWANIA danych — nie bierz elementu „ze środka" nieposortowanej listy!
  • Wariancja to średnia kwadratów odchyleń, NIE średnia odchyleń
  • Odchylenie standardowe = √wariancji, nie wariancja/n
  • Dominanta może nie istnieć (gdy wszystkie wartości różne) lub być niejednoznaczna