词频统计工具
词频统计工具安装教程
词频统计工具是款简单小巧的中英文词频统计软件,能够准确统计Word文档、网页文件、文本文件中某个中英文单词出现的总次数或频率,并输出为Excel表格或Word表格文档,两种统计方式随心用。用户可以指定文件中的中文词汇、英语词汇或标点符号。也可以使用全量统计方式,对多个文件中的词频进行比对。
词频统计工具功能
全量统计方式,即统计给定多个文档中的所有词汇的出现词频;
指定统计方式,只统计指定的某些特殊词汇的出现词频。
可以选择只统中文词汇、英语词汇或标点符号。
词频统计工具使用方法
打开软件以后,我们点击添加文件,找到你要统计的文件进行统计,你也可以在下面添加要统计的目录,设置好以后我们就可以选择统计的方式,可以选择指定统计或者是全量统计,全部搞好以后我们就可以设置统计结果输出目录了。
词频统计工具常见问题
问:词频分析结果是什么样的?比如我想把一篇文档进行分词,统计出高频词汇,这样能做到吗?分词是单个字,还是一个词语?
答:把一篇文档进行分词,统计出高频词汇,这就是这个软件的功能。分词是按语言学上的词语,比如“中化人民共和国”算一个词语。而且,对于一些新词,或特殊定义的词汇,如“新浪微博”这类新产生的词汇,软件提供了“自定义词汇表”功能,您只要把它添加到自定义的词汇表中,就可以作为一个词来进行统计。