Zzzz第一次完成 python 爬虫 某牙女主播 交友图片

import requests  # 第三方库解析浏览器
import lxml.html
etree = lxml.html.etree

url = 'https://www.huya.com/g/4079'  # 目标网址

response = requests.get(url=url)  # 解析获取源代码   这种时候纯文本 需要正则 太麻烦
# print(response.text)  # 打印 有时候是看不懂的转化UTF-8

data = etree.HTML(response.text)  #数据解析  可以有缩少案件了
girls = data.xpath('//img[@class="pic"]')

for girl in girls:
    img_url = girl.xpath('./@data-original')[0]
#   print(img_url)  缩小后的图片
    img_url = img_url.split("?")[0]
    #print(img_url)  原图
    name = girl.xpath('./@alt')[0]  #定义名称

    image = requests.get(url=img_url)  #图片的数据
    with open ('./Girl/%s.jpg' % name,'wb') as jpg:  #需要在python目录下创建Girl文件夹
        jpg.write(image.content)
        print('《%s》下载完成' % name)

THE END
喜欢就支持以下吧
点赞0 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称