忒低网站长怎么做,湖北网站建设服务公司,滨州建网站,安溪学校网站建设ChineseZhuguanDectection
项目地址#xff1a;https://github.com/liuhuanyong/ZhuguanDetection Chinese Subjective Dectection based on subjective knowlegebase, 基于中文主观性知识库的句子主观性评定方法。
#项目介绍 主观性是中文舆情和文本挖掘一个必不可少的一项…ChineseZhuguanDectection
项目地址https://github.com/liuhuanyong/ZhuguanDetection Chinese Subjective Dectection based on subjective knowlegebase, 基于中文主观性知识库的句子主观性评定方法。
#项目介绍 主观性是中文舆情和文本挖掘一个必不可少的一项环节。 对于英文而言我调研过textblob的主观性接口对于输入一个句子textblob用的是词语主观性词典加权的打法相应的介绍可以查看我的总结材料(documents下的pdf文件) 而针对目前github开源平台上还缺少有对中文句子主观性评定的接口本项目将尝试弥补这一空缺。 本项目将从中文自身的特点出发通过总结并挖掘中文句子主观性线索知识库和客观性线索知识库提供一个面向中文句子的主观性判定方法。
主观性字典
degree_words.txt:程度副词221个deny_words.txt:否定副词29个lianci_words.txt:连词93个nengyuan_words.txt:能愿副词719个pingjia_words.txt:评价词6846个qingtai_words.txt:情态动词29个rencheng_words.txt:人称代词32个senti_words:情感词2090个tanci_words:叹词139个yiwen_words:疑问代词26个yuqi_words:语气词17个zhishi_words.txt:指示代词64个zhuangtai_words.txt:状态词49个zhuzhang_words.txt:主张词235个
主观性计算规则
文本分句计算每个句子的主观性。每个句子主观性计算方式:主观线索词*主观线索词权重做加权累加和平均每个句子主观性求平均输出文本主观性
使用方式
from zhuguang import *
handler ZhuguanDetect()
sent 你要分析的文本
score handler.detect(sent)
print(score)效果
content 今天天气晴朗
score 0.0
**********************
content 江龙船艇台风“山竹”造成直接经济损失400万至500万
score 0.09375
**********************
content 中华人民共和国万岁
score 0.200
**********************
content 这两天经济不景气恐怕这单子有得毁掉了
score 0.2092
**********************
content 9月底美联储再次加息几乎板上钉钉央行大概率小幅跟随加息与此同时的定向降准对冲显得更为重要。预计10月前后可能再次实施定向降准措施。
score 0.237
**********************
content 预计明后两天江西会有大到暴雨
score 0.36
**********************
content 我喜欢你
score 0.767
*****************************总结
1本项目以词汇知识库的方式通过总结归纳出主观性线索词并加以规则进行计算。 2) 从上面的效果来看还像是那么回事但还有提升空间。 3) 主观性配合情感得分相信能够在舆情分析上起到一定作用。 4词库欢迎补充。send mail to: lhy_in_blcu126.com
项目地址https://github.com/liuhuanyong/ZhuguanDetection If any question about the project or me ,see https://liuhuanyong.github.io/