Arvind Arasu, Hector Garcia-Molina Stanford University Bài báo này có ý tưởng khá tương đồng với bài viết Automatic Tree and String Based Wrapper Generation for Semi-structured Documents, khi trích lọc các template trước. Tuy nhiên phương pháp thực hiện giữa 2 bài này lại khác nhau khá nhiều. Phương pháp của bài này coi trọng tính chất của cây và cấu trúc dữ liệu hơn. Cấu trúc dữ liệu:
Phương pháp tách template:
|