Phương pháp thêm dấu tự động

Để gõ tiếng Việt có dấu đòi hỏi phải mất nhiều công sức, phải có font chữ, bộ gõ, vì thế mà 1 bộ phận khá nhiều tiếng Việt trên web là tiếng Việt không dấu. Việc tự động thêm dấu và phân tích các từ này là 1 vấn đề cần thiết và thú vị. 

Thuật toán thêm dấu tự động không hề khó. Đơn giản nhất là ta thực hiện việc thêm dấu đồng thời với việc phân tích từ. 
Tại các bước tạo ra các đỉnh trong thuật toán tách từ, ta sẽ tạo ra tất cả các đỉnh có thể thêm dấu. 
Ví dụ : từ "hoi" sẽ thêm vào các đỉnh là "hói", "họi", "hỏi", "hoi", "hợi", "hời", "hới", ...
Sau đó thực hiện thuật toán phân tích từ bình thường. 

Việc tăng thêm số lượng các đỉnh này không làm ảnh hưởng nhiều đến tốc độ thuật toán khi thuật toán Viterbi chỉ phụ thuộc vào độ dài câu input. 

Ứng dụng của phương pháp thêm dấu tự động là khá nhiều như : 
1. Thêm dâu cho các mail.
2. Cho các quản trị web, cho các trang web yêu cầu viết tiếng Việt nhưng người sử dụng không có sẵn bộ gõ(hoặc đơn giản là lười). 
3. Thêm dấu cho tin nhắn điện thoại.
Comments