Đại diện và các chỉ số cho phân đoạn chữ viết tay ngoại tuyến

T.M. Breuel1
1PARC, Palo Alto, CA, USA

Tóm tắt

Phân đoạn là một bước quan trọng trong nhiều hệ thống nhận diện chữ viết tay ngoại tuyến, nhưng cho đến nay, hầu như không có cơ sở dữ liệu phân đoạn chính xác và không có các chỉ số đã được chấp nhận rộng rãi và định nghĩa chính thức cho hiệu suất phân đoạn. Bài báo này đề xuất một cách diễn đạt về các phân đoạn và phân đoạn trước trong dạng hình ảnh màu. Các cách diễn đạt này cho phép trao đổi thuận tiện giữa nền tảng thật và các phân đoạn giả thuyết dưới dạng các định dạng hình ảnh tiêu chuẩn. Bài báo định nghĩa chính thức các khái niệm phân đoạn quá mức và phân đoạn không đủ theo dạng kết quả tối đa giữa các pixel tương ứng. Nó cũng định nghĩa một số chỉ số định lượng tần suất và mức độ của các sự kiện trong chữ viết tay như khoảng cách giữa các ký tự, phân chia và hợp nhất các ký tự. Hy vọng rằng các chỉ số và cách diễn đạt này sẽ được sử dụng phổ biến hơn trong cộng đồng và sẽ phục vụ như một cơ sở để tạo ra các cơ sở dữ liệu huấn luyện và kiểm tra tiêu chuẩn cho dữ liệu phân đoạn.

Từ khóa

#Phân đoạn hình ảnh #Píxel #Màu sắc #Nhận diện chữ viết tay #Cơ sở dữ liệu hình ảnh #Tần suất #Hợp nhất #Kiểm tra #Hiệu suất hệ thống #Hình ảnh đồ họa

Tài liệu tham khảo

10.1109/ICDAR.2001.953902 breuel, 1995, Recognition of handwritten responses on us census forms, International Association for Pattern Recognition Workshop on Document Analysis Systems, 237 10.1109/ICDAR.2001.953964 10.1016/S0031-3203(01)00129-7 10.1007/s100320050040 10.1016/0031-3203(95)00072-0 10.1109/34.295905 10.1016/S0031-3203(98)00081-8 10.1016/S0167-8655(00)00049-0