Thứ Hai, 14 tháng 4, 2014

Sự khác nhau giữa mean và medican

Trong cuộc sống cũng như học tập có rất nhiều các kiến thức dù rất dễ mà không hiểu tại sao học hoài cứ quên và đọc mãi vẫn cứ lộn, nhầm lẫn. Đó là lý do mà tôi nhận thấy việc ghi chú lại những khái niệm nho nhỏ đôi khi có ý nghĩa rất lớn trong việc làm chắc mớ kiến thức hỗn loạn của mình. Trong bài viết này chúng ta sẽ nói tới 4 khái niệm hay thuật ngữ rất cơ bản tồn tại ở nhiều lĩnh vực nghiên cứu khác nhau như thống kê, xử lý ảnh, computer vision, …ngay cả ở trong đời sống. 3 trong số đó, Mean, Median, Mode là những thuật ngữ nói về các dạng khác nhau của ý nghĩa “trung bình” (everage) mà dễ gây nhầm lẫn.

Mean là từ mà ta thường dùng để chỉ trung bình theo đúng nghĩa đen thông dụng, có được khi ta cộng tất cả các phần tử trong một tập hợp đang xét lại rồi chia đều cho số lượng phần tử.

Median là giá trị giữa (middle) trong một tập hợp các phần tử, giá trị. Median thông thường được tìm bằng các bước như sau:
             + Với tập hợp cần tìm Median ta tiến hành sắp xếp chúng theo một thứ tự nhất định, ví dụ nếu là tập các số nguyên thì ta xếp theo thứ tự giá trị số tăng dần.
             + Lấy ra số ở vị trí giữa (middle), đó là median. Trong trường hợp không có vị trí chính xác giữa ta có thể xét lấy median một cách tương đối. Vì dụ với tập số nguyên, nếu số lượng phần tử chẳn, vậy sẽ không có 1 vị trí giữa, nên ta lấy Mean của 2 phần tử nằm giữa làm Median.

Mode là giá trị xuất hiện thường xuyên nhất trong tập hợp, danh sách các giá trị, phần tử. Trong trường hợp không có giá trị nào được lặp lại thì không có Mode.

Range là sự khác biệt, khoảng cách giữa phần tử dưới và phần tử trên, giữa giá trị nhỏ nhất (Min) với giá trị lớn nhất (Max) trong tập hợp.
Một vài ví dụ tìm Mean, Median, Mode, Range với tập hợp là các số nguyên cho trước:
1./  13, 18, 13, 14, 13, 16, 14, 21, 13
             + Mean = (13 + 18 + 13 + 14 + 13 + 16 + 14 + 21 + 13) ÷ 9 = 15
             + Tìm Median
                        .: Xếp các số theo thứ tự: 13, 13, 13, 13, 14, 14, 16, 18, 21
                        .: Tìm vị trí giữa: (9 + 1) ÷ 2 = 10 ÷ 2 = 5 
                        .: Vậy Mean = 14
             + Mode = 13 vì 13 lặp lại nhiều nhất, 4 lần.
             + Range = Max – Min = 21 – 13 = 8

2./ 1, 2, 4, 7
             + Mean = (1 + 2 + 4 + 7) ÷ 4 = 14 ÷ 4 = 3.5
             + Tìm Median
                        .: Xếp các số theo thứ tự: 1, 2, 4, 7
                        .: Tìm vị trí giữa: (4 + 1) ÷ 2 = 2 (dư 1), không có vị trí giữa chính xác mà nó thuộc về 2 vị trí 2 và 3. 
                        .: Vậy Mean = (2 + 4) ÷ 2 = 6 ÷ 2 = 3
             + Không có Mode vì không có phần tử nào lặp lại.
             + Range = Max – Min = 7 – 1 = 6
3./ 8, 9, 11, 10, 10, 11, 10, 11, 12, 13
             + Mean = (8 + 9 + 11 + 10 + 10 + 11 + 10 + 11 + 12 + 13) ÷ 10 = 105 ÷ 10 = 10.5
             + Tìm Median
                        .: Xếp các số theo thứ tự: 8, 9, 10, 10, 10, 11, 11, 11, 12, 13
                        .: Tìm vị trí giữa: (10 + 1) ÷ 2 = 5 (dư 1), không có vị trí giữa chính xác mà nó thuộc về 2 vị trí 5 và 6. 
                        .: Vậy Mean = (10 + 11) ÷ 2 = 21 ÷ 2 = 10,5
             + Mode = 10 và 11 vì hai giá trị này đều lặp lại nhiều nhất, 3 lần.
             + Range = Max – Min = 13 – 8 = 5

4./ Vài phút giải trí với Video vui nhộn
Nếu để ý, các bạn sẽ thấy rằng tôi có một thói quen lý giải vấn đề có lúc chung chung, có lúc thì lại quá cụ thể mà có thể nhiều người cho rằng chú này thật thích dài dòng, giỏi chém gió. Tuy nhiên không phải tự dưng mà lại có cái sự lắm điều đó, nó xuất phát từ việc tôi luôn mong muốn người đọc nên mở rộng các khái niệm, tham chiếu các khái niệm, hiểu rỏ nhưng không khô cứng mà có sự trừu tượng để dễ dàng có cái nhìn đúng đắn khi gặp cùng vấn đề nhưng ở các ứng dụng khác nhau, góc nhìn khác nhau, hoàn cảnh khác nhau. Như các ví dụ trên ta xét chỉ trong hoàn cảnh các dãy số nhưng chúng ta đều hiểu rằng trên đời không chỉ có bấy nhiêu. Chẳng hạn nếu bạn làm với xử lý ảnh thì chắc bạn sẽ có dịp nghe về bộ lọc trung vị (median filter), nếu bạn có cái nhìn đúng về từ median và một chút uyển chuyển trong nhận thức thì tôi tin rằng chỉ từ cái tên bạn đã có thể hiểu 30% nội dung bộ lọc này. Hy vọng khi gặp Mean, Median, Mode, Range dù tình huống nào ta cũng có thể từ cái cơ bản có sự suy luận để hiểu cho đúng.

Không có nhận xét nào:

Đăng nhận xét