文章介绍
自然语言处理课程 主要讲解 词法->句法->语义->语用 四个方面 本文只介绍笔者学习过程中觉得重要的部分
第一章 绪论
大体了解自然语言处理是什么
第二章 数学知识
概率论 统计语言模型本质就是概率计算信息论 熵的概念与计算
第三章 词法分析
构词法(语言学知识)汉语分词 -> 基于字符串匹配的分词方法 -> -> 1 正向最大匹配分词算法; 2 逆向最大匹配分词算法; 3 双向最大匹配分词算法; 4 N-最短路径分词方法命名实体识别词性标注
第四章 句法分析
短语结构语法理论 与 Chomsky 语法体系 ->规则语言 ->基于规则【自顶向下的分析算法、自底向上的分析算法】判断是否合法
基于依存语法的分析方法
基于格语法的分析方法 含有语义
第五章 语法分析
纵向 - 语义场 同义词横向 - 语义搭配
第六章 语料库
HotNet
第七章 统计语言模型
PASS
第八章 文本表示模型
PASS
第九章 文本自动分类与聚类
PASS