Mô hình Markov ẩn

Mô hình Markov ẩn (hidden Markov model - HMM) là 1 mô hình rất đơn giản được ứng dụng vào bài toán gán nhãn chuỗi. Điều kiện cần là phải có dữ liệu huấn luyện đã được gán nhãn sẵn. 

1.Áp dụng mô hình MHH 
Gọi x là chuỗi đầu vào (câu) và y là chuỗi nhãn ứng với chuỗi x (đầu ra). Trong HMM, ta giả sử rằng các trạng thái chỉ phụ thuộc duy nhất vào trạng thái trước nó. Nói cách khác, trạng thái (xi,yi )chỉ phụ thuộc vào trạng thái (xi-1,yi-1). Cụ thể hơn nữa,giả sử xi chỉ phụ thuộc vào  yi, và yi  thì chỉ phụ thuộc vào yi-1.

Như thế, xác suất xảy ra đồng thời của x, y là : 
            P(x,y) = P(xk,yk|xk-1,yk-1)*P(xk-1,yk-1|xk-2,yk-2)*...*P(x1,y1|x0,y0)
                     = (tích) P(xi,yi|xi-1,yi-1)
                     = (tích) P(xi,yi)P(yi,yi-1)

Để đơn giản, ta sẽ sử dụng yếu tố "lính canh" (x0,y0), thoả mãn điều kiện : P(x1,y1)=P(x1,y1|x0,y0) , P(y1)=P(y1|y0). 

2. Ước lượng giá trị parameter

Comments