Tìm kiếm trang web này
Trang chủ
LY NAM PHONG
Lưu Tuấn Anh
Nguyễn Văn Hải
Các công cụ xử lý
Trích lọc tiếng Việt từ HTML
DongDu
Download dữ liệu
Giới thiệu về các nghiên cứu mới
[Máy học]Learning Combination Features with L1 Regularization
[phân loại]Text Categorization with All Substring Features [in Japanese]
Automatic Tree and String Based Wrapper Generation for Semi-structured Documents
Extracting Structured Data from Web Pages
Online Feature Selection using Grafting
Kiến thức cơ bản về xử lý ngôn ngữ tự nhiên
Khởi đầu NLP với Python
Liblinear-thư viện học máy
Lựa chọn đặc trưng (Feature selection)
Machine Learning trong NLP
Mô hình ngôn ngữ
NLP là gì ?
Phân nhóm dữ liệu (Clustering)
Thuật toán tách từ (Tokenizer)
Xử lý tiếng Việt bằng Python (1)
Ứng dụng Pointwise để tách từ
Nghiên cứu của tác giả
Bài toán thêm dấu cho tiếng Việt
Từ điển cảm xúc/ý kiến trong phân tích đánh giá của khách hàng.
Việt hoá Mecab
Nhập môn Linux
SHELL là gì
SHELL mạnh nhất : zsh
Tài nguyên ngôn ngữ tiếng Việt
Khái yếu về corpus
Khái yếu về từ điển
Kế hoạch xây dựng tự động corpus từ nguồn Web
Đặc trưng của tiếng Việt
Tạp đàm
seminar là gì
Sơ đồ trang web
Hoạt động gần đây của trang web
Tác giả trang
anh
tháng 7 23, 2012
Giới thiệu về các nghiên cứu mới
Nội dung
1
Phân loại văn bản
2
Máy học
3
Trích lọc thông tin
Phân loại văn bản
[phân loại văn bản]Text Categorization with All Substring Features [in Japanese]
Máy học
[Máy học]Learning Combination Features with L1 Regularization
Sử dụng Grafting và L1-LR để chọn lựa đặc trưng hữu hiệu.
Online Feature Selection using Grafting
Giải thích về grafting.
Trích lọc thông tin
Automatic Tree and String Based Wrapper Generation for Semi-structured Documents (japanese)
Phương pháp trích lọc thông tin từ các website có cấu trúc tương tự nhau.
Extracting Structured Data from Web Pages
Ý tưởng tương tự 1., nhưng phương pháp hiệu quả và tính ứng dụng cao hơn.
Comments