集团主站
欢迎来到成都达内官方网站!达内—美国上市公司 亿元级外企IT培训企业!
成都it培训哪家好
成都it培训哪家好
全国服务监督电话:15023458194  |   联系客服   |
当前位置:主页 > 培训课程 > Python >

成都python爬虫培训-利用Python爬虫抓取图片详细讲解

发布者: 成都达内     浏览次数:     发布时间:2018-06-11 10:40:56

不管你们有没有 反正小编我是有一股冲劲的,自从知道了Python爬虫之后,只要看到有妹子的照片的网站,我就是想要批量下载一下!不为别的,是为了能更好的学习Python! 我这样说你们信...

  成都python爬虫培训-利用Python爬虫抓取图片详细讲解

  百度美女壁纸了解一下

  成都python爬虫培训

  看到这个图片,有没有一种.........emmmmm.......刺激、兴奋的感觉。

  不管你们有没有 反正小编我是有一股冲劲的,自从知道了Python爬虫之后,只要看到有妹子的照片的网站,我就是想要批量下载一下!

  不为别的,是为了能更好的学习Python! 我这样说你们信吗?

  成都python爬虫培训

  给代码 给代码 好东西 必须分享 大家一起享受!

  # !/usr/bin/env python

  # -*- coding:utf-8 -*-

  import requests

  import json

  # 定义一个请求函数,接收页面参数

  def get_page(page): # 把页面参数添加在url的字符串当中

  url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=美女&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&word=美女&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&cg=girl&pn={}&rn=30&gsm=1e'.format( page)

  # 请求网站,并且得到网站的响应

  response = requests.get(url)

  # 判断状态的状况

  if response.status_code == 200:

  # 返回文本文件信息

  return response.textdef json_load(text):

  # 把文本文件处理成字典格式

  jsondict = json.loads(text)

  # 创建一个空的合集,作用是去重

  urlset = set()

  # 检查字典里面是否包含了data这个值

  if 'data' in jsondict.keys():

  # 从jsondict中取出data这个字典里面的东西,依次赋值给items!

  for items in jsondict.get('data'):

  # 异常处理,不是每一行数据都包含thumbURL这个数据的

  try:

  urlset.add(items['thumbURL'])

  except:

  pass return urlset

  def down_cont(url):

  response = requests.get(url)

  name = url.split(',')[-1].split('&')[0]

  if response.status_code == 200:

  # 表示,如果文件名字相同,就删除当前文件,然后再创建一个一样名字的文件

  with open('./images/%s.jpg' % name, 'wb') as f:

  print('正在下载当前图片: ' + url)

  # 以二进制的方法写入到本地

  f.write(response.content)

  def main():

  for p in range(5):

  print('正在下载 %s页 的图片' % p)

  page = p * 30

  text = get_page(page)

  urlset = json_load(text)

  for url in urlset:

  down_cont(url)

  if __name__ == '__main__':

  main()

  运行效果图

  成都python爬虫培训

  成都python爬虫培训

(责任编辑:范老师)
最新开班
  • 成都Java培训班
    免费试听名额发放中...
  • 成都C++培训班
    免费试听名额发放中...
  • 成都PHP培训班
    免费试听名额发放中...
  • 成都网络工程培训班
    免费试听名额发放中...
  • 成都Unity3D培训班
    免费试听名额发放中...
  • 成都大数据培训班
    免费试听名额发放中...
  • 成都uid培训班
    免费试听名额发放中...
  • 成都会计培训班
    免费试听名额发放中...
  • 成都Python培训班
    免费试听名额发放中...
  • 成都嵌入式培训班
    免费试听名额发放中...
  • 成都web培训班
    免费试听名额发放中...
  • 成都软件测试培训班
    免费试听名额发放中...
在线留言
提交

校区地址:绵阳市涪城区临园路东段68号富临大都会7栋3单元9层12号

联系电话:15023458194

公交路线:富乐路口凯德广场(10路;29路;3路;15路;11路;15a路;71路)

校区地址:成都市锦江区东大街紫东楼段35号明宇金融广场19楼1903室

联系电话:15023458194

公交路线:芷泉街(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:成都市高新区奥克斯广场蜀锦路209号一楼商铺

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

校区地址:成都锦江区东大街芷泉街229号东方广场C座3楼303

联系电话:15023458194

公交路线:芷泉街(188路;115路;515路;236路;505路;501路;84路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:成都市武侯区佳灵路3号红牌楼广场2号写字楼11楼1115号

联系电话:15023458194

公交路线:红牌楼东(11路;92路;100路;111路;139路;g28路;快速公交K1/K2) 地铁路线:红牌楼站(地铁3号线)

校区地址:成都市锦江区红星路二段70号四川日报大厦502-2

联系电话:15023458194

公交路线:市二医院站(6路;49路;102路;5路;37路;g92路;) 地铁路线:地铁市二医院(地铁3号线)

校区地址:成都市锦江区东大街紫东段35号明宇广场2306

联系电话:15023458194

公交路线:芷泉街(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:四川省成都市武侯区高新科技孵化园9号园区E座7楼

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

校区地址:成都市成华区建设路10号万科钻石广场B座5楼

联系电话:15023458194

公交路线:建设路中(6路;14路;42路;72路;76路;1010路;)

校区地址:成都市高新区奥克斯广场B座1708

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

了解达内动态
关注成都达内教育公众号

首页 | 关于达内 | 课程中心 | 专家师资 | 视频教程 | 学员空间 | 校企合作 | 新闻资讯 | 就业指导 | 网站地图

20016-2025 达内时代科技集团有限公司 版权所有 京ICP证8000853号-56