← 返回首页

第12章 · NLP常用工具与文本挖掘

导航

12.1 分词与词性标注

核心内容:

分词是中文NLP处理的第一步,直接影响后续任务效果。

12.2 词频统计与TF-IDF

核心内容:

TF-IDF是文本挖掘中最常用的特征提取方法之一。

12.3 文本预处理与停用词

核心内容:

文本预处理是NLP任务的基础,能显著提升模型性能。