Comandă rapidă a formulei

Comandă rapidă a formulei

Calculul unei variații de probă sau abatere standard este, de obicei, declarat ca fracție. Numerotatorul acestei fracții implică o sumă a abaterilor pătrate de la medie. În statistici, formula pentru această sumă totală de pătrate este

Σ (xeu - X)2

Aici simbolul x̄ se referă la media eșantionului, iar simbolul Σ ne spune să adăugăm diferențele pătrate (xeu - x̄) pentru toate eu.

În timp ce această formulă funcționează pentru calcule, există o formulă de scurtătură echivalentă care nu necesită să calculăm mai întâi media probei. Această formulă de scurtătură pentru suma pătratelor este

Σ (xeu2) - (Σ xeu)2/n

Aici variabila n se referă la numărul de puncte de date din eșantionul nostru.

Exemplu de formulă standard

Pentru a vedea cum funcționează această formulă de comenzi rapide, vom lua în considerare un exemplu care este calculat folosind ambele formule. Să presupunem că eșantionul nostru este 2, 4, 6, 8. Media eșantionului este (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Acum calculăm diferența fiecărui punct de date cu media 5.

  • 2 - 5 = -3
  • 4 - 5 = -1
  • 6 - 5 = 1
  • 8 - 5 = 3

Acum pătrundem fiecare dintre aceste numere și le adăugăm împreună. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.

Exemplu de formulare rapidă

Acum vom folosi același set de date: 2, 4, 6, 8, cu formula de comandă rapidă pentru a determina suma pătratelor. Mai întâi pătrundem fiecare punct de date și le adăugăm împreună: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.

Următorul pas este să adăugați toate datele și să pătrați această sumă: (2 + 4 + 6 + 8)2 = 400. Împărțim acest lucru la numărul de puncte de date pentru a obține 400/4 = 100.

Acum scădem acest număr din 120. Acest lucru ne dă că suma abaterilor pătrate este 20. Acesta a fost exact numărul pe care l-am găsit deja din cealaltă formulă.

Cum funcționează asta?

Mulți oameni vor accepta doar formula la valoarea nominală și nu au habar de ce funcționează această formulă. Folosind un pic de algebră, putem vedea de ce această formulă de scurtătură este echivalentă cu modul standard, tradițional de calcul al sumei abaterilor pătrate.

Deși pot exista sute, dacă nu chiar mii de valori într-un set de date din lumea reală, vom presupune că există doar trei valori de date: x1 , X2, X3. Ceea ce vedem aici ar putea fi extins la un set de date care are mii de puncte.

Începem prin a observa că (x1 + x2 + x3) = 3 x̄. Expresia Σ (xeu - X)2 = (x1 - X)2 + (x2 - X)2 + (x3 - X)2.

Acum folosim faptul din algebra de bază că (a + b)2 = a2 + 2ab + b2. Aceasta înseamnă că (x1 - X)2 = x12 -2x1 x̄ + x̄2. Facem acest lucru pentru ceilalți doi termeni ai rezumării noastre și avem:

X12 -2x1 x̄ + x̄2 + x22 -2x2 x̄ + x̄2 + x32 -2x3 x̄ + x̄2.

Reorganizăm acest lucru și avem:

X12+ x22 + x32+ 3x̄2 - 2x̄ (x1 + x2 + x3) .

Prin rescriere (x1 + x2 + x3) = 3x̄ de mai sus devine:

X12+ x22 + x32 - 3x̄2.

Acum de la 3x̄2 = (x1+ x2 + x3)2/ 3, formula noastră devine:

X12+ x22 + x32 - (X1+ x2 + x3)2/3

Acesta este un caz special al formulei generale menționate mai sus:

Σ (xeu2) - (Σ xeu)2/n

Este într-adevăr o scurtătură?

S-ar putea să nu pară că această formulă este cu adevărat o scurtătură. La urma urmei, în exemplul de mai sus se pare că sunt la fel de multe calcule. O parte din asta are legătură cu faptul că am analizat doar o dimensiune a eșantionului care era mică.

Pe măsură ce creștem dimensiunea eșantionului nostru, vedem că formula de scurtătură reduce numărul de calcule cu aproximativ jumătate. Nu trebuie să scădem media din fiecare punct de date și apoi să pătrundem rezultatul. Aceasta reduce considerabil numărul total de operațiuni.