Hàm SKEW Trong Excel: Cách Phân Tích Độ Lệch Dữ Liệu Trong 5 Phút

Hầu hết người dùng Excel chỉ dùng hàm trung bình và trung vị để phân tích dữ liệu. Họ bỏ qua hàm SKEW mặc dù công cụ này cho biết điều mà hai hàm kia không thể: dữ liệu có đối xứng hay lệch về một phía. Tôi phát hiện hàm này sau ba năm làm việc với bảng tính và nó thay đổi cách tôi đánh giá chất lượng dữ liệu.

SKEW đo lường độ không đối xứng

Hàm SKEW trả về giá trị độ lệch của một tập dữ liệu, cho biết mức độ mất cân đối của phân bố so với trung bình. Giá trị dương nghĩa là dữ liệu có đuôi dài bên phải, giá trị âm có nghĩa đuôi dài bên trái, còn số không là phân bố hoàn toàn đối xứng.

Cú pháp cơ bản:

=SKEW(số1, [số2], ...)

Hàm chấp nhận từ 3 đến 255 đối số. Mỗi đối số có thể là số đơn lẻ, tham chiếu ô hoặc vùng dữ liệu. Nếu có ít hơn 3 giá trị, Excel trả về lỗi #DIV/0! vì không thể tính độ lệch với mẫu quá nhỏ.

Cách sử dụng trong 3 bước

Giả sử bạn có dữ liệu điểm thi của 20 học sinh từ ô A2 đến A21. Để tính độ lệch của phân bố điểm số:

XEM THÊM:  3 Điều Tôi Ước Biết Về Hàm Z.TEST Excel Trước Khi Phân Tích 500 Báo Cáo

Bước 1: Nhấp vào ô trống để hiển thị kết quả (ví dụ ô B2)

Bước 2: Nhập công thức =SKEW(A2:A21) và nhấn Enter

Bước 3: Xem giá trị trả về để phân tích phân bố

Excel tính toán ngay lập tức. Không cần bước phụ hay công thức trung gian. Hàm hoạt động với mọi loại dữ liệu số từ điểm thi, doanh số bán hàng, đến thời gian phản hồi.

Diễn giải kết quả chính xác

Khi hàm SKEW trả về giá trị, cách đọc như sau:

Độ lệch dương (> 0): Đuôi phân bố kéo dài về phía giá trị cao. Đa số điểm dữ liệu tập trung ở phía thấp. Ví dụ điển hình là thu nhập hộ gia đình, phần lớn người có thu nhập trung bình và thấp, một số ít có thu nhập rất cao.

Độ lệch âm (< 0): Đuôi phân bố kéo dài về phía giá trị thấp. Đa số điểm dữ liệu tập trung ở phía cao. Tuổi thọ con người là ví dụ điển hình, đa số người sống đến 70-90 tuổi, một số ít qua đời sớm.

Gần bằng 0 (-0.5 đến 0.5): Phân bố gần như đối xứng. Dữ liệu cân bằng hai bên trung bình. Tuy nhiên phân bố hoàn toàn đối xứng hiếm khi xảy ra với dữ liệu thực tế.

Tôi dùng ngưỡng -1 đến +1 để đánh giá độ lệch chấp nhận được. Khi giá trị vượt quá phạm vi này, cần xem xét lại mô hình phân tích hoặc chuyển đổi dữ liệu.

XEM THÊM:  Hướng Dẫn Chi Tiết Hàm PERCENTRANK.EXC Excel 2010 Từ A-Z

Phát hiện bất thường trong dữ liệu bán hàng

Một ví dụ thực tế từ công việc của tôi: Phân tích doanh số 30 chi nhánh trong quý vừa qua. Dữ liệu doanh số từ ô C2 đến C31.

Công thức =SKEW(C2:C31) trả về giá trị 2.3, độ lệch dương mạnh. Điều này cho biết đa số chi nhánh có doanh số thấp đến trung bình, một vài chi nhánh có doanh số cực cao làm kéo trung bình lên.

Kết quả này chỉ ra hai vấn đề: Một là có thể có chi nhánh hoạt động bất thường tốt cần phân tích riêng. Hai là sử dụng giá trị trung bình để đánh giá hiệu suất chung không chính xác, nên dùng trung vị thay vì.

Sau khi loại bỏ hai chi nhánh có doanh số ngoại lệ, độ lệch giảm xuống 0.8, phân bố trở nên cân đối hơn và dễ phân tích hơn.

SKEW và SKEW.P khác nhau như thế nào

Excel cung cấp hai hàm tính độ lệch: SKEW và SKEW.P. Sự khác biệt nằm ở phương pháp tính toán.

SKEW: Tính độ lệch cho mẫu dữ liệu. Dùng khi bạn có một phần dữ liệu từ tổng thể lớn hơn. Ví dụ khảo sát 100 khách hàng trong tổng số 10000 khách hàng.

SKEW.P: Tính độ lệch cho toàn bộ tổng thể. Dùng khi bạn có đầy đủ dữ liệu cần phân tích. Ví dụ điểm thi của tất cả học sinh trong lớp, không phải mẫu ngẫu nhiên.

XEM THÊM:  Hàm LOGEST Trong Excel: Hướng Dẫn Đầy Đủ Để Phân Tích Hồi Quy Mũ Với Ví Dụ Thực Tế

Cú pháp hai hàm giống nhau: =SKEW.P(số1, [số2], ...). Sự khác biệt về công thức tính khiến SKEW.P thường trả về giá trị thấp hơn một chút so với SKEW với cùng tập dữ liệu.

Trong hầu hết trường hợp làm việc với dữ liệu kinh doanh, SKEW là lựa chọn phù hợp vì bạn thường làm việc với mẫu chứ không phải toàn bộ tổng thể.

Áp dụng ngay với dữ liệu hiện tại

Hàm SKEW hoạt động trên Excel 2016 trở lên và Excel 365. Thử ngay với bất kỳ tập dữ liệu số nào từ 3 giá trị trở lên. Kết hợp với hàm trung bình và trung vị để có cái nhìn đầy đủ về phân bố dữ liệu. Nếu giá trị độ lệch quá cao hoặc quá thấp, xem xét sử dụng phép biến đổi logarit hoặc căn bậc hai để chuẩn hóa dữ liệu trước khi phân tích sâu hơn.

Related Posts

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *