桃子味分享:轻松爬取清纯小姐姐私房照!小孩子别学

194次阅读
没有评论

共计 1522 个字符,预计需要花费 4 分钟才能阅读完成。

桃子味分享:轻松爬取清纯小姐姐私房照!小孩子别学

先上效果图

桃子味分享:轻松爬取清纯小姐姐私房照!小孩子别学

import re
import requests
import os

 

头文件:

因为爬虫需要用到请求网络部分,所以需要这两个包,没有的话自行下载即可。这个可以直接用pip安装。如果连pip都不懂,那就只能学习一下python基础了。

请求头:

headers = {‘User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, l

完整的请求:

url = ‘https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word==’+name+’+&pn=’+str(i*30)
result = requests.get(url,headers=headers)
dowmloadPic(result.content.decode(), name)

正则表达式:

<pre class="enlighter-clipboard"><code class='language-default'>pic_url = re.findall('"objURL":"(.*?)",',html,re.S)</code></pre>

下载图片:

<pre class="enlighter-clipboard"><code class='language-default'>fp = open(dir, 'wb')
fp.write(pic.content)
fp.close()</code></pre>

完整代码:

<pre class="enlighter-clipboard">#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re
import requests
import os


def dowmloadPic(html, keyword,i):
    <code class='language-default'>pic_url = re.findall('"objURL":"(.*?)",',html,re.S)</code>
   
    abc=i*60
    print('找到关键词:' + keyword + '的图片,现在开始下载图片...')
    for each in pic_url:
        print('正在下载第' + str(abc) + '张图片,图片地址:' + str(each))
        try:
            pic = requests.get(each, timeout=10)
        except requests.exceptions.ConnectionError:
            print('【错误】当前图片无法下载')
            continue

        dir = r'D:\image\i' + keyword + '_' + str(abc) + '.jpg'
        if not os.path.exists('D:\image'):
            os.makedirs('D:\image')
        
        fp = open(dir, 'wb')
        fp.write(pic.content)
        fp.close()
        abc += 1


if __name__ == '__main__':
    #word = input("Input key word: ")
    headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36'}
    name = "清纯妹子私房照"
    num = 0
    x =1

    for i in range(int(x)):
        url = 'https://image.baidu.com/search/flip?tn=baiduimage&amp;ie=utf-8&amp;word='+name+'+&amp;pn='+str(i*30)
        print(url)
        result = requests.get(url,headers=headers)
        dowmloadPic(result.content, name,1)
print("下载完成")</pre>

我从没有这么渴望过知识,第一次感受到知识的力量!!!

桃子味分享:轻松爬取清纯小姐姐私房照!小孩子别学

正文完
 1
桃子味
版权声明:本站原创文章,由 桃子味 于2025-01-02发表,共计1522字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码