python一款高颜值的词云包让我拍案叫绝
🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。一个人可以走的很快,但一群人才能走的更远
-
为上述调色板提供直接梯度;
-
支持读取文本文件,或预生成的 CSV 文件(包含单词和数字);
-
提供命令行接口。
两行代码
stylecloud的对于处理英文词云有个酷炫的功能,可以实现两行代码实现词云,一行导入stylecloud,另外一行直接调用。
不过我们还是要先安装包 ↓
pip3 install stylecloud
以这里的Trump.txt为例,它是特朗普当选美国总统的演讲稿,直接生成词云。
from stylecloud import gen_stylecloud
gen_stylecloud(file_path=‘Trump.txt’)
生成效果如下:
是不是非常快捷高效,不过对于中文文本我们还是需要先分词再做处理。
影响词云颜值的问题之一就是蒙版图片的生成。
自己制作的要么分辨率不统一,要么需要调整对比度,比较麻烦。stylecloud
是直接使用Font Awesome这个现成的方案,wordcloud
其实也可以用。
网址:https://fontawesome.com/license/free
在stylecloud \ static的文件夹中,有一个fontawesome.min.css文件包含了巨量的图标,你可以定期到官方网站去升级这个图标库。
打开发现里面包含很多图标的代码,具体长什么样呢?
多亏有中文网站分门别类罗列了图标的样子和名字,
比如:https://fontawesome.dashgame.com/
它最新版地址:https://fa5.dashgame.com/#/%E5%9B%BE%E6%A0%87
,图标介绍更详细,分类更全面,不过经常抽风。
使用方法如下:
如果我们想要使用小狗的蒙版,只需先查找到它的图标名字fa-dog
,再加入到参数中icon_name='fas fa-dog'
即可。
stylecloud.gen_stylecloud(text=’ '.join(text1), collocations=False,
font_path=r’C:\Windows\Fonts\msyh.ttc’,
icon_name=‘fas fa-dog’,
size=400,output_name=‘词云.png’)
然后我换了一堆小动物的蒙版,生成了如下的词云动图:
其实企鹅并没有在动物里找到,不过我想起来了QQ的图标就是,但是替换后是报错的。原来品牌的图标前缀与其他不同,需要改为icon_name='fab fa-qq'
,这样就可以啦。
配色是影响词云颜值的又一大问题。stylecloud同样找到了比较好的方案,配色方案是使用的高级调色板palettable来实现了。
palettable 网站:https://jiffyclub.github.io/palettable/
这是一款专业的配色网站,非常适合我们这种对词云的美观有一点小追求的人。
里面的配色方案超级多,随便点击几个给大家预览一下:
我们可以通过修改参数palette='配色方案'
来达到更改自己词云配色的目的。
stylecloud.gen_stylecloud(text=’ '.join(text1), collocations=False,
palette=‘tableau.BlueRed_6’,
font_path=r’C:\Windows\Fonts\msyh.ttc’,
icon_name=‘fab fa-qq’,size=400,
output_name=‘腾讯-词云.png’)
其他参数
以下参数对 stylecloud Python 函数和 CLI 均有效,你可以通过 stylecloud -h 获取这些参数的信息。[3]
-
text:输入文本。最好在直接调用函数时使用。
-
file_path:输入文本/CSV 的文件路径。最好在 CLI 上使用。
-
gradient:梯度方向。(其默认值是 None,如果它的值不是 None,则 stylecloud 使用了方向性梯度。)[default: None]
-
size:stylecloud 的大小(长度和宽度)。[default: 512]
-
icon_name:stylecloud 形状的图标名称(如 fas fa-grin)。[default: fas fa-flag]
-
palette:调色板(通过 palettable 实现)。[default: cartocolors.qualitative.Bold_6]
-
background_color:背景颜色。[default: white]
-
max_font_size:stylecloud 中的最大字号。[default: 200]
-
max_words:stylecloud 可包含的最大单词数。[default: 2000]
-
stopwords:布尔值,用于筛除常见禁用词。[default: True]
-
output_name:stylecloud 的输出文本名。[default: stylecloud.png]
-
font_path:stylecloud 所用字体 .ttf 文件的路径。[default: uses included Staatliches font]
-
random_state:控制单词和颜色的随机状态。
上面参数由机器之心翻译自stylecloud的github介绍,我就直接引用,不班门弄斧了。
更多详情可以打开链接:https://github.com/minimaxir/stylecloud
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Python开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加V获取:vip1024c (备注Python)
最后
🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
[外链图片转存中…(img-VT1yvdcJ-1712847193635)]

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)