Xử lý ngôn ngữ tự nhiên (Trường đại học khoa học kỹ thuật Nagaoka)

Tìm kiếm trang web này
  • Trang chủ
    • LY NAM PHONG
    • Lưu Tuấn Anh
    • Nguyễn Văn Hải
  • Các công cụ xử lý
    • Trích lọc tiếng Việt từ HTML
  • DongDu
  • Download dữ liệu
  • Giới thiệu về các nghiên cứu mới
    • [Máy học]Learning Combination Features with L1 Regularization
    • [phân loại]Text Categorization with All Substring Features [in Japanese]
    • Automatic Tree and String Based Wrapper Generation for Semi-structured Documents
    • Extracting Structured Data from Web Pages
    • Online Feature Selection using Grafting
  • Kiến thức cơ bản về xử lý ngôn ngữ tự nhiên
    • Khởi đầu NLP với Python
    • Liblinear-thư viện học máy
    • Lựa chọn đặc trưng (Feature selection)
    • Machine Learning trong NLP
    • Mô hình ngôn ngữ
    • NLP là gì ?
    • Phân nhóm dữ liệu (Clustering)
    • Thuật toán tách từ (Tokenizer)
    • Xử lý tiếng Việt bằng Python (1)
    • Ứng dụng Pointwise để tách từ
  • Nghiên cứu của tác giả
    • Bài toán thêm dấu cho tiếng Việt
    • Từ điển cảm xúc/ý kiến trong phân tích đánh giá của khách hàng.
    • Việt hoá Mecab
  • Nhập môn Linux
    • SHELL là gì
    • SHELL mạnh nhất : zsh
  • Tài nguyên ngôn ngữ tiếng Việt
    • Khái yếu về corpus
    • Khái yếu về từ điển
    • Kế hoạch xây dựng tự động corpus từ nguồn Web
    • Đặc trưng của tiếng Việt
  • Tạp đàm
    • seminar là gì
  • Sơ đồ trang web
  • Hoạt động gần đây của trang web

Tác giả trang

  • anh
    tháng 7 23, 2012

Tài nguyên ngôn ngữ tiếng Việt

  1. Đặc trưng của tiếng Việt
  2. Khái yếu về corpus
  3. Khái yếu về từ điển
  4. Kế hoạch xây dựng tự động corpus từ nguồn Web
  5. Download dữ liệu tự vựng(corpus)
Trang con (4): Đặc trưng của tiếng Việt Kế hoạch xây dựng tự động corpus từ nguồn Web Khái yếu về corpus Khái yếu về từ điển
Comments

Sign in|Recent Site Activity|Report Abuse|Print Page|Powered By Google Sites