深圳建网站技术,常用于做网站的软件,商务电子是学什么的,环球资源网站【说明】文章内容来自《机器学习入门——基于sklearn》#xff0c;用于学习记录。若有争议联系删除。 wordcloud 是python的第三方库#xff0c;称为词云#xff0c;也成文字云#xff0c;可以根据文本中的词频以直观和艺术化的形式展示文本中词语的重要性。 依赖于pillow …【说明】文章内容来自《机器学习入门——基于sklearn》用于学习记录。若有争议联系删除。 wordcloud 是python的第三方库称为词云也成文字云可以根据文本中的词频以直观和艺术化的形式展示文本中词语的重要性。 依赖于pillow 和 numpy 安装
pip install pillow
pip install wordcloud
1、wordcloud 示例 wordcloud 绘制词云的步骤。
1.配置对象参数2.加载词云文本3.输出词云文件
出现次数越多的单词在生成的词云中越大
from wordcloud import WordCloud
text dog cat fish cat cat cat cat cat cat cat dog dog dog
wc WordCloud()
wc.generate(text) #向wordcloud对象w中加载文本
wc.to_file(e:/2.png) #将词云输出为图像文件
【运行结果】 2、函数调用
WordCloud(font_pathNone, width400, height200, margin2, ranks_onlyNone,
prefer_horizontal.9, maskNone, scale1, color_funcNone, max_words200,
min_font_size4, stopwordsNone, random_stateNone,
background_colorblack, max_font_sizeNone, font_step1, modeRGB,
relative_scalingauto, regexpNone, collocationsTrue, colormapNone,
normalize_pluralsTrue, contour_width0,
contour_colorblack, repeatFalse,include_numbersFalse,
min_word_length0, collocation_threshold30)
# 参数含义如下
# font_path : string //字体路径需要展现什么字体就把该字体路径后缀名写上如font_path 黑体.ttf
# width : int (default400) //输出的画布宽度默认为400像素
# height : int (default200) //输出的画布高度默认为200像素
# prefer_horizontal : float (default0.90) //词语水平方向排版出现的频率
# 默认 0.9 所以词语垂直方向排版出现频率为 0.1
# mask : nd-array or None (defaultNone) //如果参数为空则使用二维遮罩绘制词云。如果 mask 非空
# 设置的宽高值将被忽略遮罩形状被 mask 取代。除全白#FFFFFF的部分将不会绘制其余部分会用于绘制词云。
# 如bg_pic imread(读取一张图片.png)背景图片的画布一定要设置为白色#FFFFFF
# 然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存就ok了。
# scale : float (default1) //按照比例进行放大画布如设置为1.5则长和宽都是原来画布的1.5倍。
# min_font_size : int (default4) //显示的最小的字体大小
# font_step : int (default1) //字体步长如果步长大于1会加快运算但是可能导致结果出现较大的误差。
# max_words : number (default200) //要显示的词的最大个数
# stopwords : set of strings or None //设置需要屏蔽的词如果为空则使用内置的STOPWORDS
# background_color : color value (default”black”) //背景颜色如background_colorwhite,背景颜色为白色。
# max_font_size : int or None (defaultNone) //显示的最大的字体大小
# mode : string (default”RGB”) //当参数为“RGBA”并且background_color不为空时背景为透明。
# relative_scaling : float (default.5) //词频和字体大小的关联性
# color_func : callable, defaultNone //生成新颜色的函数如果为空则使用 self.color_func
# regexp : string or None (optional) //使用正则表达式分隔输入的文本
# collocations : bool, defaultTrue //是否包括两个词的搭配
# colormap : string or matplotlib colormap, default”viridis”
# 给每个单词随机分配颜色若指定color_func则忽略该方法。
【说明】使用的图片文件可以自己选择。