Định nghĩa độ lệch chuẩn là gì
Độ lệch chuẩn là căn bậc hai dương của phương sai. Nó là một trong những phương pháp cơ bản của phân tích thống kê. Độ lệch chuẩn thường được viết tắt là SD và được ký hiệu bằng ký hiệu ‘σ’. Nó cho biết mức độ các giá trị dữ liệu bị lệch khỏi giá trị trung bình. Nếu chúng ta có độ lệch chuẩn thấp, có nghĩa là các giá trị có xu hướng gần giá trị trung bình, trong khi độ lệch chuẩn cao cho biết rằng các giá trị xa giá trị trung bình. Chúng ta có các công thức riêng để tính độ lệch chuẩn của dữ liệu được nhóm và không được nhóm. Ngoài ra, chúng ta còn có các công thức độ lệch chuẩn khác nhau để tính SD của một biến ngẫu nhiên. Hãy xem xét tất cả các công thức này chi tiết.
Công thức tính độ lệch chuẩn
Công thức tính độ lệch chuẩn của dữ liệu không được nhóm:
SD = căn bậc hai ((Σ(xi – x̄)^2)/(n-1))
- SD: độ lệch chuẩn
- Σ: tổng của
- xi: giá trị của mẫu thứ i
- x̄: giá trị trung bình của các giá trị mẫu
- n: số lượng các giá trị mẫu
Công thức tính độ lệch chuẩn của dữ liệu được nhóm:
SD = căn bậc hai ((Σ(fi(xi – x̄)^2))/(n-1))
- SD: độ lệch chuẩn
- Σ: tổng của
- fi: tần số của mẫu thứ i
- xi: giá trị của mẫu thứ i
- x̄: giá trị trung bình của các giá trị mẫu
- n: số lượng các mẫu
Cách tính độ lệch chuẩn

Thông thường, độ lệch chuẩn áp dụng cho độ lệch chuẩn của toàn bộ quần thể và dưới đây là các bước để tính độ lệch chuẩn của tập giá trị dữ liệu:
- Tìm giá trị trung bình, đó là trung bình cộng của các quan sát.
- Tìm các khác biệt bình phương với giá trị trung bình. (\(giá trị~dữ~liệu~-\) trung bình)2
- Tìm giá trị trung bình của các khác biệt bình phương. (Phương sai = Tổng khác biệt bình phương ÷ số quan sát)
- Tìm căn bậc hai của phương sai. (Độ lệch chuẩn = √Phương sai)
Các công thức tính độ lệch chuẩn
Trong thống kê tóm tắt, độ phân tán của tập dữ liệu được đo bằng độ lệch chuẩn. Phương sai của tập dữ liệu là trung bình cách bình phương giữa giá trị trung bình và mỗi giá trị dữ liệu. Độ lệch chuẩn xác định sự phân tán của các giá trị dữ liệu xung quanh giá trị trung bình. Có hai công thức độ lệch chuẩn được sử dụng để tìm độ lệch chuẩn của dữ liệu mẫu và độ lệch chuẩn của quần thể đã cho.
Lưu ý rằng cả hai công thức này trông gần như giống nhau, ngoại trừ mẫu số của độ lệch chuẩn của quần thể là N trong khi mẫu số của độ lệch chuẩn của dữ liệu mẫu là n-1. Khi tính trung bình của dữ liệu mẫu, không cần xem xét tất cả các giá trị dữ liệu trong quần thể, do đó trung bình của dữ liệu mẫu chỉ là ước lượng của trung bình của quần thể, nhưng điều này đưa vào một số không chắc chắn hoặc thiên vị trong việc tính toán độ lệch chuẩn. Để điều chỉnh điều này, mẫu số của độ lệch chuẩn mẫu được điều chỉnh để là n-1 thay vì chỉ là n. Điều này được biết đến là sửa chữa của Bessel.
Công thức tính độ lệch chuẩn cho dữ liệu mẫu
\(s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i – \bar{x})^2}\)
Công thức tính độ lệch chuẩn cho quần thể
\(\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i – \mu)^2}\)
Sự khác nhau giữa quần thể và dữ liệu mẫu
Có hai loại tập dữ liệu: quần thể và dữ liệu mẫu. Quần thể là một nhóm toàn bộ mà chúng ta quan tâm đến để nghiên cứu, trong khi dữ liệu mẫu là một nhóm nhỏ các cá nhân được lấy từ quần thể.
Tính độ lệch chuẩn (Standard Deviation)
Phương sai và độ lệch chuẩn cho toàn bộ quần thể và mẫu
Phương trình để tính độ lệch chuẩn của toàn bộ quần thể và mẫu khác nhau một chút. Phương trình để tính độ lệch chuẩn của toàn bộ quần thể là:
\(\sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(X_{i}-\mu\right)^{2}}\)
Ở đây,
σ = ký hiệu độ lệch chuẩn của quần thể
μ = trung bình của quần thể
N = tổng số quan sát
Tương tự, phương trình tính độ lệch chuẩn của mẫu là:
s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}
Ở đây,
s = ký hiệu độ lệch chuẩn của mẫu
\(\bar x\) = trung bình cộng của các quan sát
n = tổng số quan sát
Độ lệch chuẩn của dữ liệu không được nhóm lại
Cách tính độ lệch chuẩn khác nhau cho các loại dữ liệu khác nhau.
Phân phối đo lường sự sai lệch của dữ liệu từ giá trị trung bình hoặc trung vị
Phương pháp tính độ lệch chuẩn
Có ba phương pháp để tính độ lệch chuẩn:
- Phương pháp trung bình thực tế
- Phương pháp giả định trung bình
- Phương pháp bước nhảy
Độ lệch chuẩn bằng phương pháp trung bình thực tế
Trong phương pháp này, chúng ta tính trung bình của các giá trị dữ liệu (\(\bar x\)) và sau đó tính độ lệch của mỗi giá trị dữ liệu so với giá trị trung bình. Sau đó, chúng ta sử dụng công thức tính độ lệch chuẩn sau đây bằng phương pháp trung bình thực tế:
σ = √(∑\((x-\bar x)\)2 /n), trong đó n là tổng số quan sát.
Ví dụ, giả sử chúng ta có các quan sát dữ liệu 3, 2, 5, 6. Trung bình của các điểm dữ liệu này là (3 + 2 + 5 + 6)/4 = 16/4 = 4. Tổng của các bình phương độ lệch từ trung bình = (4-3)2+(2-4)2 +(5-4)2 +(6-4)2 = 10. Tương ứng, phương sai = Tổng bình phương độ lệch từ trung bình/ số lượng dữ liệu = 10/4 = 2.5. Độ lệch chuẩn = √2.5 = 1.58.
Độ lệch chuẩn bằng phương pháp giả định trung bình
Khi các giá trị x lớn, một giá trị tùy ý (A) được chọn làm giá trị trung bình (vì tính toán trung bình khó trong trường hợp này). Độ lệch so với giá trị trung bình giả định này được tính là d = x – A.
Tính độ lệch chuẩn
Độ lệch chuẩn đo sự lệch của dữ liệu so với giá trị trung bình hoặc vị trí trung tâm khác. Có ba phương pháp để tính độ lệch chuẩn:
Phương pháp giá trị trung bình thực tế

Trong phương pháp này, ta tính trung bình của các giá trị dữ liệu (\(\bar x\)) và tính độ lệch của mỗi giá trị dữ liệu so với giá trị trung bình. Sau đó, ta sử dụng công thức tính độ lệch chuẩn sau đây theo phương pháp giá trị trung bình thực tế:
σ = √(∑\((x-\bar x)\)2 /n), trong đó n là tổng số quan sát. Ví dụ với dãy số 3, 2, 5, 6, ta tính giá trị trung bình là (3 + 2 + 5 + 6)/4 = 16/4 = 4. Tổng bình phương sai số so với trung bình = (4-3)2+(2-4)2 +(5-4)2 +(6-4)2 = 10. Phương sai = Tổng bình phương sai số/ số lượng quan sát = 10/4 = 2.5. Độ lệch chuẩn = √2.5 = 1.58
Phương pháp giá trị trung bình ước lượng
Khi giá trị của x quá lớn, ta chọn một giá trị ước lượng (A) làm giá trị trung bình để tính toán (vì tính trung bình sẽ rất khó khăn trong trường hợp này). Sai số so với giá trị ước lượng này được tính bằng cách d = x – A.
Sau đó, ta tính độ lệch bước (d’) bằng cách sử dụng công thức d’ = d/i, trong đó ‘i’ là một yếu tố chung của tất cả các giá trị ‘d’ (chọn bất kỳ yếu tố chung nào trong trường hợp có nhiều yếu tố). Bây giờ, độ lệch chuẩn của dữ liệu không được nhóm bằng phương pháp độ lệch bước được tính bằng công thức sau:
σ = √[(∑(d’)2 /n) – (∑d’/n)2] × i, trong đó ‘n’ là tổng số giá trị dữ liệu.
Phương pháp giá trị trung bình bước nhảy
Phương sai chuẩn của Dữ liệu Rời rạc bằng Phương pháp giá trị trung bình thực tế
Đối với n quan sát, \(x_1, x_2, …..x_n\), và tần số tương ứng, \(f_1, f_2, f_3, …f_n\), phương sai chuẩn là:
(\sigma=\sqrt{\frac{1}{n} \sum_{i=1}^{n}f_i \left(x_{i}-\bar x\right)^{2}}). Ở đây:
n = tổng tần số = (\sum_{i=1}^{n}f_i)
(\bar x) = giá trị trung bình
Ví dụ: Hãy tính phương sai chuẩn cho dữ liệu sau đây:
xi 6 10 12 14 24
fi 2 3 4 5 4
Tính giá trị trung bình((\bar x)): (6 × 2 + 10 × 3 + 12 × 4 + 14 × 5 + 24 × 4)/(2+3+4+5+4) = 14.22
xi fi fixi xi – (\bar x) (xi – (\bar x))2 fi (xi – (\bar x))2
6 2 12 -8.22 67.5684 135.1368
10 3 24 -4.22 17.8084 53.4252
12 4 40 -2.22 4.9284 19.7136
14 5 60 -0.22 0.0484 0.242
24 4 56 9.78 95.6484 382.5936
18 192 591.1112
Bây giờ, phương sai: σ2 = 1/n (\sum_{i=1}^{n}f_i \left(x_{i}-\bar x\right)^{2})
= 1/18 × 591.1112 = 32.83
Tính độ lệch chuẩn: σ = √Phương sai = √32.83 = 5.73
Phương sai chuẩn của Dữ liệu Rời rạc bằng Phương pháp giá trị trung bình ước lượng
Khi giá trị dữ liệu rất lớn, một trong các giá trị dữ liệu được chọn làm giá trị trung bình ước lượng (và do đó được biết là giá trị trung bình ước lượng, A). Sau đó, độ lệch của mỗi giá trị dữ liệu từ giá trị trung bình ước lượng được tính toán d = x – A.
Phương sai chuẩn độ dịch vụ của dữ liệu rời rạc theo phương pháp giá trị trung bình thực tế
Đối với n quan sát, \(x_1, x_2, …..x_n\), và tần số tương ứng, \(f_1, f_2, f_3, …f_n\) phương sai chuẩn độ là:
\(\sigma=\sqrt{\frac{1}{n} \sum_{i=1}^{n}f_i \left(x_{i}-\bar x\right)^{2}}\). Ở đây:
- n = tổng tần số = \(\sum_{i=1}^{n}f_i\)
- \(\bar x\) = giá trị trung bình
Ví dụ: Hãy tính phương sai chuẩn độ cho dữ liệu được đưa ra dưới đây:
xi | 6 | 10 | 12 | 14 | 24 |
---|---|---|---|---|---|
fi | 2 | 3 | 4 | 5 | 4 |
Tính giá trị trung bình (\(\bar x\)): (6 × 2 + 10 × 3 + 12 × 4 + 14 × 5 + 24 × 4)/(2+3+4+5+4) = 14.22
xi | fi | fixi | xi – \(\bar x\) | (xi – \(\bar x\))2 | fi (xi – \(\bar x\))2 |
---|---|---|---|---|---|
6 | 2 | 12 | -8.22 | 67.5684 | 135.1368 |
10 | 3 | 24 | -4.22 | 17.8084 | 53.4252 |
12 | 4 | 40 | -2.22 | 4.9284 | 19.7136 |
xi | fi |
---|---|
6 | 2 |
10 | 3 |
12 | 4 |
14 | 5 |
24 | 4 |
Calculate mean(\(\bar x\)): (6 × 2 + 10 × 3 + 12 × 4 + 14 × 5 + 24 × 4)/(2+3+4+5+4) = 14.22
xi | fi | fixi | xi – \(\bar x\) | (xi – \(\bar x\))2 | fi(xi – \(\bar x\))2 |
---|---|---|---|---|---|
6 | 2 | 12 | -8.22 | 67.5684 | 135.1368 |
10 | 3 | 24 | -4.22 | 17.8084 | 53.4252 |
12 | 4 | 40 | -2.22 | 4.9284 | 19.7136 |
14 | 5 | 60 | -0.22 | 0.0484 | 0.242 |
24 | 4 | 56 | 9.78 | 95.6484 | 382.5936 |
18 | 192 | 591.1112 |
Tìm độ lệch chuẩn:
Đầu tiên, xem xét liệu các giá trị dữ liệu đại diện cho quần thể hay mẫu. Nếu chúng đại diện cho mẫu, sau đó sử dụng công thức độ lệch chuẩn của mẫu √ [ 1/(n-1) ∑(xi – trung bình mẫu)2. Nếu chúng đại diện cho quần thể, sau đó sử dụng công thức độ lệch chuẩn của quần thể √ [ 1/n ∑(xi – trung bình quần thể)2. Các Công Thức Độ Lệch Chuẩn Cho Dữ Liệu Không Gom Nhóm Là Gì? Khi dữ liệu không được nhóm lại, độ lệch chuẩn (SD) có thể được tính bằng 3 phương pháp sau đây. Các công thức tương ứng với SD là:
- Phương pháp giá trị thực tế: σ = √(∑\((x-\bar x)\)2 /n)
- Phương pháp giá trị giả định: σ = √[(∑(d)2 /n) – (∑d/n)2]
- Phương pháp dịch chuyển bước: σ = √[(∑(d’)2 /n) – (∑d’/n)2] × i
Để hiểu rõ từng phương pháp này, xin vui lòng tham khảo trang trên. Đưa ra Một Ví Dụ Về Độ Lệch Chuẩn. Hãy tìm độ lệch chuẩn của các điểm dữ liệu 1, 3, 4, 5. Trung bình là 13/4 = 3,25. Trung bình khác biệt trung bình = [(3,25-1)2 + (3-3,25)2+ (4-3,25)2 + (5-3,25)2]/4 = 2,06. Độ lệch chuẩn = √2,06 = 1,43. Công thức độ lệch chuẩn cho dữ liệu đã nhóm là gì? Dữ liệu đã nhóm có thể là rời rạc hoặc liên tục.
Độ lệch chuẩn của phân phối xác suất
Độ lệch chuẩn của phân phối xác suất của X, 𝜎 = \(\sqrt{\Sigma\left[(x-\mu)^2 \cdot P(x)\right]}\)
Công thức tóm tắt để tìm độ lệch chuẩn của biến ngẫu nhiên là: 𝜎 = \(\sqrt{E(X^2)-[E(X)]^2}\) (hoặc) 𝜎 = \(\sqrt{\Sigma\left[x^2 \cdot P(x)\right]-\mu^2}\)
Độ lệch chuẩn của phân phối xác suất
Xác suất thực nghiệm bao gồm nhiều lần thử. Khi sự khác biệt giữa xác suất lý thuyết của một sự kiện và tần số tương đối của nó tiệm cận nhau, chúng ta có xu hướng biết kết quả trung bình. Giá trị trung bình này được gọi là giá trị kỳ vọng của thí nghiệm được ký hiệu bởi 𝜇. Trong phân phối chuẩn, giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1. Trong một thí nghiệm nhị phân, số lần thành công là một biến ngẫu nhiên. Nếu một biến ngẫu nhiên có phân phối nhị phân, độ lệch chuẩn của nó được cho bởi: 𝜎 = √npq, trong đó trung bình: 𝜇 = np, n = số lần thử, p = xác suất thành công và 1-p = q là xác suất thất bại.
Công thức độ lệch chuẩn cho dữ liệu rời rạc được nhóm theo các phương pháp khác nhau
Trong trường hợp dữ liệu liên tục, giá trị dữ liệu sẽ là giữa khoảng của các lớp, sau đó độ lệch chuẩn có thể được tính bằng cách sử dụng các công thức tương tự như dữ liệu rời rạc. Các phương pháp tính độ lệch chuẩn bao gồm:
- Phương pháp trung bình thực tế: σ = √(∑\(f(x-\bar x)\)2 /n)
- Phương pháp giả định trung bình: σ = √[(∑(fd)2 /n) – (∑fd/n)2]
- Phương pháp bước nhảy độ lệch: σ = √[(∑(fd’)2 /n) – (∑fd’/n)2] × i
Để hiểu quá trình tính độ lệch chuẩn chi tiết hơn, vui lòng cuộn trang lên.
Sự khác biệt giữa công thức độ lệch chuẩn và công thức phương sai là gì?
Phương sai là trung bình của các sai số bình phương so với giá trị trung bình, trong khi độ lệch chuẩn là căn bậc hai của con số này. Cả hai chỉ số đều phản ánh sự biến thiên trong phân phối, nhưng đơn vị của chúng khác nhau: độ lệch chuẩn được thể hiện trong cùng đơn vị như giá trị ban đầu (ví dụ: phút hoặc mét). Công thức độ lệch chuẩn cho mẫu = √[ Σ (xi – x̅)2/(n-1) ], công thức phương sai = σ2 = Σ (xi – x̅)2/(n-1)
Ý nghĩa của trung bình, phương sai và độ lệch chuẩn trong thống kê?
Phương sai là tổng bình phương của hiệu số giữa tất cả các số và trung bình, còn độ lệch chuẩn là căn bậc hai của con số này. Cả hai chỉ số đều cho biết độ biến động của dữ liệu, với độ lệch chuẩn thường được sử dụng rộng rãi hơn để đánh giá sự phân tán của dữ liệu. Trung bình là giá trị trung bình của tất cả các số trong tập dữ liệu, được sử dụng để đại diện cho gi
Phương sai và độ lệch chuẩn
Định nghĩa và công thức
Độ lệch chuẩn là căn bậc hai của phương sai. Nó là một chỉ số đo mức độ phân tán của dữ liệu so với giá trị trung bình. Công thức tính độ lệch chuẩn là căn bậc hai của phương sai: √phương sai.
Sử dụng công thức nào hơn, phương sai hay độ lệch chuẩn?
Cả hai công thức có mục đích khác nhau. Độ lệch chuẩn thường được sử dụng để mô tả tính biến động của dữ liệu trong khi phương sai thường được sử dụng để tính toán toán học. Ví dụ, tổng của các phân phối không tương quan (biến ngẫu nhiên) cũng có một phương sai là tổng của các phương sai của những phân phối đó.
Vì sao chúng ta sử dụng công thức độ lệch chuẩn và phương sai?
Độ lệch chuẩn giúp xem xét mức độ lan truyền của một nhóm số so với giá trị trung bình, bằng cách xem xét căn bậc hai của phương sai. Phương sai đo mức độ trung bình mà mỗi điểm khác biệt so với giá trị trung bình.
Nguồn Tham Khảo: Độ lệch chuẩn