集团主站
欢迎来到成都达内官方网站!达内—美国上市公司 亿元级外企IT培训企业!
成都it培训哪家好
成都it培训哪家好
全国服务监督电话:15023458194  |   联系客服   |
当前位置:主页 > 培训课程 > Python >

成都python爬虫培训:Python数据可视化词云展示周董的歌

发布者: 成都达内     浏览次数:

成都python爬虫培训最达妹想告诉你,Python无论是在前端、后端、还是全栈开发方面都具有简洁、效率高的优势。并且Python在人工智能和大数据方面的优势得天独厚。Python早已超越Java成为...

  成都python爬虫培训:Python数据可视化词云展示周董的歌

  马上开始了,你准备好了么

  准备工作

  环境:Windows + Python3.6

  IDE:根据个人喜好,自行选择

  模块:

  Matplotlib是一个 Python 的 2D数学绘图库

  pip install matplotlibimport matplotlib.pyplot as plt

  jieba中文分词库

  pip install jiebaimport jieba

  wordcloud词云库

  pip install wordcloudfrom wordcloud import WordCloud

  成都python爬虫培训

  实战具体步骤:

  1、读入txt文本数据。

  2、结巴中文分词,生成字符串默认精确模式,如果不通过分词,无法直接生成正确的中文词云。

  3、生成词云图,这里需要注意的是WordCloud默认不支持中文,所以这里需已下载好的中文字库。

  (无自定义背景图:需要指定生成词云图的像素大小,默认背景颜色为黑色,统一文字颜色:mode='RGBA'和colormap='pink')

  4、显示图片。

  总体而言只有四个步骤还是比较简单的那咱们先看一下实现的效果图吧!

  成都python爬虫培训

  成都python爬虫培训

  看到效果图后发现里面的秘密没?

  完整代码

  # Matplotlib是一个 Python 的 2D数学绘图库

  # 安装:pip install matplotlibimport matplotlib.pyplot as plt

  # jieba中文分词库# 安装:pip install jiebaimport jieba# wordcloud词云库

  # 安装pip install wordcloudfrom wordcloud import WordCloud

  # 1.读入txt文本数据text = open(r'.\jay.txt', "r").read()#print(text)

  # 2.结巴中文分词,生成字符串,默认精确模式,如果不通过分词,无法直接生成正确的中文词云cut_text = jieba.cut(text)

  # print(type(cut_text))# print(next(cut_text))

  # print(next(cut_text))# print(next(cut_text))

  # 必须给个符号分隔开分词结果来形成字符串,否则不能绘制词云result = " ".join(cut_text)#print(result)

  # 3.生成词云图,这里需要注意的是WordCloud默认不支持中文,所以这里需已下载好的中文字库

  # 无自定义背景图:需要指定生成词云图的像素大小,默认背景颜色为黑色,统一文字颜色:mode='RGBA'和colormap='pink'wc = WordCloud(

  # 设置字体,不指定就会出现乱码 font_path=r'.\simhei.ttf',

  # 设置背景色 background_color='white',

  # 设置背景宽 width=500,

  # 设置背景高 height=350,

  # 最大字体 max_font_size=50,

  # 最小字体 min_font_size=10, )

  # max_words=1000 ),mode='RGBA',colormap='pink')

  # 产生词云wc.generate(result)

  # 保存图片wc.to_file(r".\wordcloud.png")

  # 按照设置的像素宽高度保存绘制好的词云图,比下面程序显示更清晰

  # 4.显示图片

  # 指定所绘图名称plt.figure("jay")

  # 以图片的形式显示词云plt.imshow(wc)

  # 关闭图像坐标系plt.axis("off")plt.show()

(责任编辑:范老师)
最新开班
  • 成都Java培训班
    免费试听名额发放中...
  • 成都C++培训班
    免费试听名额发放中...
  • 成都PHP培训班
    免费试听名额发放中...
  • 成都网络工程培训班
    免费试听名额发放中...
  • 成都Unity3D培训班
    免费试听名额发放中...
  • 成都大数据培训班
    免费试听名额发放中...
  • 成都uid培训班
    免费试听名额发放中...
  • 成都会计培训班
    免费试听名额发放中...
  • 成都Python培训班
    免费试听名额发放中...
  • 成都嵌入式培训班
    免费试听名额发放中...
  • 成都web培训班
    免费试听名额发放中...
  • 成都软件测试培训班
    免费试听名额发放中...
在线留言
提交

校区地址:绵阳市涪城区临园路东段68号富临大都会7栋3单元9层12号

联系电话:15023458194

公交路线:富乐路口凯德广场(10路;29路;3路;15路;11路;15a路;71路)

校区地址:成都市锦江区东大街紫东楼段35号明宇金融广场19楼1903室

联系电话:15023458194

公交路线:芷泉街(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:高新区奥克斯广场B座17楼08号

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

校区地址:成都市锦江区东大街芷泉段229号东方广场C座3楼

联系电话:15023458194

公交路线:芷泉街(188路;115路;515路;236路;505路;501路;84路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:成都市武侯区佳灵路3号红牌楼广场2号写字楼6楼14号

联系电话:15023458194

公交路线:红牌楼东(11路;92路;100路;111路;139路;g28路;快速公交K1/K2) 地铁路线:红牌楼站(地铁3号线)

校区地址:成都市锦江区红星路二段70号四川日报大厦502-2

联系电话:15023458194

公交路线:市二医院站(6路;49路;102路;5路;37路;g92路;) 地铁路线:地铁市二医院(地铁3号线)

校区地址:成都市锦江区东大街紫东段35号明宇广场2306

联系电话:15023458194

公交路线:芷泉街(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:成都市高新区孵化园9号园区E座7楼

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

校区地址:成都市成华区建设路10号万科钻石广场B座5楼

联系电话:15023458194

公交路线:建设路中(6路;14路;42路;72路;76路;1010路;)

校区地址:成都市高新区奥克斯广场B座1708

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

了解达内动态
关注成都达内教育公众号

首页 | 关于达内 | 课程中心 | 专家师资 | 视频教程 | 学员空间 | 校企合作 | 新闻资讯 | 就业指导 | 网站地图

20016-2025 达内时代科技集团有限公司 版权所有 京ICP证8000853号-56