1\建立动态语料库Corpus(),静态语料库PCorpus()
2\导出语料库 writeCorpus(x, path = “.”, filenames = NULL)
3\语料库检索和查看ovid[] 查找语料库的某篇文档
4\元数据查看与管理meta(crude[[1]])查看语料库元数据信息,meta(crude)查看语料库元数据的格式
5\词条-文档关系矩阵:
1.创建词条-文档关系矩阵TermDocumentMatrix(x, control = list()) , DocumentTermMatrix(x, control = list())
2.文档距离计算dist(rbind(x, y), method = “binary” /”canberra” /”maximum”/”manhattan” )
6\文本聚类:Knn算法,支持向量机SVM