Nhận dạng (pattern recognition) là
một ngành thuộc lĩnh vực học máy (machine learning). Nhận dạng nhằm mục đích
phân loại dữ liệu (là các mẫu) dựa trên: hoặc là kiến thức tiên nghiệm (a
priori) hoặc dựa vào thông tin thống kê được trích rút từ các mẫu có sẵn. Các
mẫu cần phân loại thường được biểu diễn thành các nhóm của các dữ liệu đo đạc
hay quan sát được, mỗi nhóm là một điểm ở trong một không gian đa chiều phù
hợp. Đó là không gian của các đặc tính để dựa vào đó ta có thể phân loại. Quá trình
nhận dạng dựa vào những mẫu học biết trước gọi là nhận dạng có thầy hay học có
thầy (supervised learning); trong trường hợp ngược lại là học không có thầy (unsupervised
learning).
Trong lý thuyết nhận dạng nói chung
có ba cách tiếp cận khác nhau:
- Nhận dạng dựa vào phân hoạch không
gian.
- Nhận dạng cấu trúc.
- Nhận dạng dựa vào kỹ thuật mạng nơ
ron.
Hai cách tiếp cận đầu là các kỹ
thuật kinh điển. Cách tiếp cận thứ ba hoàn toàn khác. Nó dựa vào cơ chế đoán
nhân, lưu trữ và phân biệt đối tượng mô phỏng theo hoạt động của hệ thần kinh
con người. Các cách tiếp cận trên sẽ trình bày trong các phần dưới đây.
Các ứng dụng phổ biến là nhận dạng
tiếng nói tự động, phân loại văn bản thành nhiều loại khác nhau (ví dụ: những
thư điện tử nào là spam/non-spam), nhận dạng tự động các mã bưu điện viết tay
trên các bao thư, hay hệ thống nhận dạng danh tính dựa vào mặt người. Ba ví dụ
cuối tạo thành lãnh vực con phân tích ảnh của nhận dạng với đầu vào là các ảnh
số.
Không có nhận xét nào:
Đăng nhận xét