Python爬取pexels图片新动态

2023-04-12 04:54:52 来源：博客园

(资料图片)

研究Python爬虫，网上很多爬取pexels图片的案例，我下载下来运行没有成功，总量有各种各样的问题。

作为菜鸟初学者，网上的各个案例代码对我还是有不少启发作用，我用搜索引擎+chatGPT逐步对代码进行了完善。

最终运行成功。特此记录。

运行环境：Win10，Python3.10、Google Chrome111.0.5563.148（正式版本）

1 import urllib.request 2 from bs4 import BeautifulSoup 3 import os 4 import html 5 import requests 6 import urllib.parse 7  8 path = r"C:\Users\xiaochao\pexels" 9 url_lists = ["https://www.pexels.com/search/book/?page={}".format(i) for i in range(1, 21)]  #页面范围请自行根据实际情况修改。10 headers = {11     "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36",12     "Referer": "https://www.pexels.com/",13     "Accept-Language": "en-US,en;q=0.9",14 }15 16 for url in url_lists:17     print(url)18     req = urllib.request.Request(url, headers=headers)19     try:20         resp = urllib.request.urlopen(req)21     except urllib.error.HTTPError as e:22         print("HTTPError occurred: {}".format(e))23         continue24 25     html_content = resp.read().decode()26     soup = BeautifulSoup(html_content, "html.parser")27 28     import re29     pattern = re.compile(""Download" href="(.*?)/?cs=", re.S)30     matches = re.findall(pattern, html_content)31     print(matches)32 33     if not os.path.exists(path):34         os.makedirs(path)35 36     for match in matches:37         match_cleaned = match.split("?")[0]    # 去除图片URL地址最后带的“？”号。38         print(match_cleaned)   # 输出去除图片URL“？”号的地址39         match_cleaned = html.unescape(match_cleaned)  #解码 HTML 编码字符，将文件链接还原为正常的 URL 格式40         match_cleaned = urllib.parse.unquote(match_cleaned)   # 对 URL 进行进一步处理，解码URL，确保它的格式正确，包括删除多余的引号和处理特殊字符。41         match_cleaned = urllib.parse.urljoin(url, match_cleaned)  # 将相对 URL 转换为绝对 URL42 43 44         # 按URL地址后段命名45         filename = match_cleaned.split("/")[-1]46         with open(os.path.join(path, filename), "wb") as f:47             f.write(requests.get(match_cleaned).content)

标签：

上一篇 : 舰员散失殆尽，俄国防部下令重新组建“库兹涅佐夫”号航母舰员队|世界速讯

下一篇 : 最后一页

推荐阅读

Python爬取pexels图片新动态

研究Python爬虫，网上很多爬取pexels图片的案例，我下载下来运行没有成功，总量有各种各样的问题。作为...

04-12 04:54:52

舰员散失殆尽，俄国防部下令重新组建“库兹涅佐夫”号航母舰员队|世界速讯

4月10日，俄罗斯军方消息人士告诉《消息报》，俄罗斯国防部已经下令准备重新组建“库兹涅佐夫海军元帅”...

04-12 00:02:05

中华财险创新大熊猫保险服务

中华财险创新大熊猫保险服务---日前，中华财险四川雅安中心支公司与宝兴县人民政府签订“熊猫碳汇”保险...

04-11 21:39:08

当前关注：请问一下十年前的工伤现在可以起诉吗？

请问一下十年前的工伤现在可以起诉吗？

04-11 20:15:48

今天中午一SUV冲上人行道撞坏花坛撞倒多辆非机动车幸无人员伤亡-热门

今天中午12时许，有市民报料，称徐汇区漕溪北路上发生一起交通事故：一辆SUV冲上人行道，所幸事故未造成...

04-11 19:17:35

晶合集成上市在即推动集成电路产业国产化的坚定“旗手”_即时焦点

随着信息化和数字化的发展，新能源汽车、人工智能、消费电子等新兴领域快速成长，带动全球集成电路市场...

04-11 18:03:22

长春净月潭公园门票多少钱一张？

净月潭公园门票：30元人，个人年卡：300元人。景区开放时间：游客中心8:30-16:00，正门、西门6:00-1...

04-11 17:12:16

港股收评：恒生指数收涨0.76% 内房股尾盘拉升

港股冲高回落，截至收盘，恒指涨0 76%，恒生科技指数收涨0 25%。港股内房股尾盘拉升，龙光集团大涨26 19%，中国

04-11 16:32:26

2022年中国卡丁车市场产销量及行业市场规模分析[图]_资讯

共研产业咨询（共研网）发布的《中国卡丁车行业市场供需态势及发展战略咨询报告》详细分析了卡丁车行业...

04-11 16:02:23

全球焦点！人祸不断、创新不足，光明乳业的“败局”十五年前已注定？

爆款难寻的背后，光明乳业的渠道和营销短板暴露无疑。

04-11 14:59:27

乳酸菌的作用能祛斑吗_乳酸菌的作用-简讯

1、乳酸菌，顾名思义，是指在糖的发酵过程中能够产生乳酸的一大类细菌。这类细菌在人体肠道中大量存在，...

04-11 13:57:12

学技能促就业世界独家

近日，南和区史召乡就业创业培训班学员学习制作面点。近年来，南和区通过就业创业技能培训、对接用工企...

04-11 12:43:29

有画说｜早高峰送孩子上学，您着过这种急不？

争分夺秒的早高峰这种情况您有没有遇到过骑车时明明可以右转通过的路口却常被直行等红灯的车流堵住 ...

04-11 11:52:24

南财基金通·混合型基金收益排行榜（4月10日）-环球速读

根据南财基金通数据：2023年4月10日当日收益较高的混合型基金包括：中航新起航灵活配置混合型证券投资基...

04-11 10:57:01

“星光洒满了所有的童年”

重庆两江新区星光学校不是一所从事特殊教育的学校，但校园里总有一些需要“特殊教育”的学生。这些孩子...

04-11 10:32:37

国家统计局：2023年3月份工业生产者出厂价格同比下降2.5% 环比持平

上证报中国证券网讯据国家统计局4月11日消息，2023年3月份，全国工业生产者出厂价格同比下降2 5%，环比...

04-11 09:51:19

10岁女童穿拖鞋登山，被眼镜蛇咬伤脚-世界快报

【10岁女童登山被眼镜蛇咬伤脚】春天万物复苏，也是蛇虫鼠蚁开始活跃的季节

04-11 08:49:18

华锐精密（688059）4月10日主力资金净买入615.27万元

截至2023年4月10日收盘，华锐精密(688059)报收于155 96元，上涨2 18%，换手率1 04%，成交量2633 0手，成交额4064 8万元。

04-11 07:40:31

希捷丨珍视数据价值与安全，让其如同银河星海般辽阔璀璨环球热推荐

希捷在深耕数据存储方案的研发与技术革新的同时，也在积极寻求与人工智能行业的合作伙伴共同努力，共同...

04-11 05:54:18

全球快讯:26.7%！中来刷新n型TOPCon电池世界最高效率！

近日，据中国计量科学研究院的最新认证报告，中来在自主研发的J-TOPCon3 0POPAID技术和M10尺寸n型电池...

04-11 00:56:20

判决书揭厅官牛向东受贿细节:要完首付要尾款受贿千万买房

牛向东牛向东被判刑近两年后，一份近期公开的地产公司行贿案判决书，披露了牛向东更多受贿细节。武威中...

04-10 22:01:26

当前热讯：国海富兰克林基金旗下产品晨星奖入围率排名行业第2

2023年是晨星中国颁布年度基金奖的第20周年，日前，晨星中国盘点了历年晨星奖之“最”。其中，2004年-20...

04-10 20:41:43

中超联赛官方发布新赛季开赛海报：有你的未来，生生不息|全球快看点

中超联赛官方发布了新赛季中超联赛开赛的海报。海报采用了火神杯的造型为主题，寓意新赛季即将拉开帷幕...

04-10 19:15:40

天门市城市公园绿地开放共享试点工作实施方案！

天门市城市公园绿地开放共享试点工作实施方案！,城建,天门市,执法局,城市公园,开放共享试点

04-10 18:27:24

今日要闻!广州身份证办理可以提前多少天预约？

04-10 17:19:03

世界快资讯：2023五一郑州及周边采摘樱桃好去处推荐

2023五一郑州及周边采摘樱桃好去处推荐➤樱桃沟提到樱桃，很多小伙伴会第一时间想到樱桃沟。樱桃沟是郑...

04-10 16:25:19

世界观速讯丨2017金佑人生a款分红型值得买吗？承保公司是谁？

该保险值得购买，她属于终身寿险，有对应的保障：包含了88种重大疾病保障、身故或全残情形保障、20种特...

04-10 15:56:15

台当局：台湾若遭封锁，天然气只能撑11天_每日快播

台当局：台湾若遭封锁，天然气只能撑11天,台湾若被封锁，天然气可撑多久？王美花：有11天存量解放军环台...

04-10 15:03:35

世界讯息：北银消费金融2022年净利8700万元；马上消费金融2022年净收入和净利润双位数增长；宁银消金两名高管任资获批丨21消费金融参考

4月4日的2023中国金融学会学术年会暨中国金融论坛年会上，中国人民银行原行长周小川在主旨演讲中表示，...

04-10 13:51:06

当前动态:开封市龙亭区：服务项目送春风优化环境助发展

近日，开封市龙亭区发改委主任刘蕾蕾带领相关业务人员来到开封市民公共文化服务综合体区域综合开发项目...

04-10 12:08:22

天天速看：阿劳霍是世界前三位最优秀的中后卫之一

4月8日，西甲第28轮，赫罗纳将客场挑战巴萨，赛前，赫罗纳后卫圣地亚哥-布埃诺在接受采访时称赞了他的乌...

04-10 11:32:53

【当前独家】艾克森：在国家队目标拿到亚洲杯生涯很多幸福时光是在中国度过

直播吧4月10日讯在接受《足球报》专访时，艾克森介绍了他在国家队的目标，他认为自己找回状态后，下一次...

04-10 10:49:49

当前简讯:湿疹应该注意什么饮食_湿疹应该注意什么

1、湿疹是皮肤科的顽疾，但发病初期相对较轻，治疗的关键在于止痒。2、早期发作者，可外用丙酸氯倍他索...

04-10 09:56:33

主板注册制首批10家企业今日上市

4月10日，沪深交易所主板注册制首批10家企业将鸣锣敲钟上市，标志着全面注册制在A股市场正式落地。受访...

04-10 08:54:32

t检验结果怎么看显著性_t检验结果怎么看

1、你做了3次相关样本t检验第一个表是描述性统计量，有平均数、样本量、标准差、标准误第二个表是相关系...

04-10 07:53:43

小赢钱包逾期七个月影响征信吗

网贷逾期一般会上征信,有些借贷机构在用户逾期后一天后就会上报给征信机构，而有些借贷机构则是会在几天...

04-10 06:11:41

天天看热讯：今日小数是不是越乘越小_为什么小数乘小数越乘越小

1、因为乘法代表乘的是原来数字的倍数，小数如小于1，就说明不到原来的一倍。2、所以越乘越小。本文到此...

04-10 00:57:43

九洲药业：预计2022年营收同比增长33%-38%

新京报贝壳财经讯（记者丁爽）4月9日，九洲药业披露了2022年度及2023年一季度主要经营数据。九洲药业在...

04-09 19:31:14

全球热资讯！都市无敌文完结小说推荐_都市无敌文

1、重生之妖孽人生重生追美记很纯很暧昧校花的贴身高手超级医生巨龙战纪(笑。2、赞)超级优化宠物魔术师...

04-09 17:53:54

“女性如何走出逆境,涅槃重生?”,网友纷纷吐露心声

每个人在成长中都会遇到或大或小、或明或暗的坎坷和挫折。有青春期的叛逆和懵懂,有成长期的迷茫和困境,...

04-09 16:16:37

强制执行立案要多久|环球快播

强制执行立案的，一般是在三天内决定是否立案。在六个月内开始执行，如果人民法院超过六个月未采取执行...

04-09 14:09:24

男人生日送什么礼物

送给男人最好的生日礼物就是了，他会很高兴，而且对于这种东西是否感觉。如果你送给男生的生日礼物，你...

04-09 12:17:13

我国首次在5亿多年前页岩地层中钻获高产气藏_讯息

记者从中国石油获悉，今天（4月8日），我国首次在距今5 4亿年的寒武系页岩地层中，距离地面超过4500米...

04-09 12:30:28

安行宝两全保险是什么险种？值得买吗？|最新消息

安行宝是太平洋人寿保险公司旗下的一款两全保险，也是一款中长期的意外险。它的投保年龄范围为18~60周岁...

04-09 10:52:26

【三国杀个人制图】神张角

神张角在十周年和欢乐服中的技能为“异兆、三首、截军、天劫”，在OL服中则是把“三首”直接给砍了。异...

04-09 09:14:11

10元小商品批发_十块购

1、嗯！你说的折也这个网站我知道，我本人在用，不存在什么安全不安全的！这就是一个好东西聚集地。2、...

04-09 06:50:23

【播资讯】意甲-迪巴拉点射制胜索尔巴肯伤退罗马1-0客胜都灵升至第三

直播4月9日讯北京时间4月9日凌晨0:30，意甲第29轮，罗马客场挑战都灵。上半场，迪巴拉点射。下半场，帕...

04-09 03:11:38

诗和远方在一起河北推出近300家景区、酒店优惠政策及措施焦点热议

随着春暖花开，旅游市场日益升温，河北石家庄、承德、秦皇岛等地市，推出近300家景区、酒店优惠政策及措...

04-08 21:56:02

看点：3月上海二手房成交套数达20个月新高：挂牌量充足稳定

开年之际，各行各业成复兴态势，上海楼市小阳春再次出现，据相关数据显示，截止到三月份上海单月成交二...

04-08 20:15:54

江西井冈山：女子漂在河中央奄奄一息，危急时刻他一头跳入了水中！

来源|都市现场综合吉安公安“不好！水里漂浮着一个人！”“快快快！报警！”4月7日早上7时江西省井冈山...

04-08 18:05:01

精彩推送

舰员散失殆尽，俄国防部下令重新组建“库兹涅佐夫”号航母舰员队|世界速讯

中华财险创新大熊猫保险服务

当前关注：请问一下十年前的工伤现在可以起诉吗？

今天中午一SUV冲上人行道撞坏花坛撞倒多辆非机动车幸无人员伤亡-热门

晶合集成上市在即推动集成电路产业国产化的坚定“旗手”_即时焦点

长春净月潭公园门票多少钱一张？

港股收评：恒生指数收涨0.76% 内房股尾盘拉升

2022年中国卡丁车市场产销量及行业市场规模分析[图]_资讯

全球焦点！人祸不断、创新不足，光明乳业的“败局”十五年前已注定？

乳酸菌的作用能祛斑吗_乳酸菌的作用-简讯

学技能促就业世界独家

有画说｜早高峰送孩子上学，您着过这种急不？

南财基金通·混合型基金收益排行榜（4月10日）-环球速读

“星光洒满了所有的童年”

国家统计局：2023年3月份工业生产者出厂价格同比下降2.5% 环比持平

10岁女童穿拖鞋登山，被眼镜蛇咬伤脚-世界快报

华锐精密（688059）4月10日主力资金净买入615.27万元

希捷丨珍视数据价值与安全，让其如同银河星海般辽阔璀璨环球热推荐

全球快讯:26.7%！中来刷新n型TOPCon电池世界最高效率！

判决书揭厅官牛向东受贿细节:要完首付要尾款受贿千万买房

当前热讯：国海富兰克林基金旗下产品晨星奖入围率排名行业第2

中超联赛官方发布新赛季开赛海报：有你的未来，生生不息|全球快看点

天门市城市公园绿地开放共享试点工作实施方案！

今日要闻!广州身份证办理可以提前多少天预约？

世界快资讯：2023五一郑州及周边采摘樱桃好去处推荐

世界观速讯丨2017金佑人生a款分红型值得买吗？承保公司是谁？

台当局：台湾若遭封锁，天然气只能撑11天_每日快播

世界讯息：北银消费金融2022年净利8700万元；马上消费金融2022年净收入和净利润双位数增长；宁银消金两名高管任资获批丨21消费金融参考

当前动态:开封市龙亭区：服务项目送春风优化环境助发展

天天速看：阿劳霍是世界前三位最优秀的中后卫之一

【当前独家】艾克森：在国家队目标拿到亚洲杯生涯很多幸福时光是在中国度过

当前简讯:湿疹应该注意什么饮食_湿疹应该注意什么

主板注册制首批10家企业今日上市

t检验结果怎么看显著性_t检验结果怎么看

小赢钱包逾期七个月影响征信吗

天天看热讯：今日小数是不是越乘越小_为什么小数乘小数越乘越小

九洲药业：预计2022年营收同比增长33%-38%

全球热资讯！都市无敌文完结小说推荐_都市无敌文

“女性如何走出逆境,涅槃重生?”,网友纷纷吐露心声

强制执行立案要多久|环球快播

男人生日送什么礼物

我国首次在5亿多年前页岩地层中钻获高产气藏_讯息

安行宝两全保险是什么险种？值得买吗？|最新消息

【三国杀个人制图】神张角

10元小商品批发_十块购

【播资讯】意甲-迪巴拉点射制胜索尔巴肯伤退罗马1-0客胜都灵升至第三

诗和远方在一起河北推出近300家景区、酒店优惠政策及措施焦点热议

看点：3月上海二手房成交套数达20个月新高：挂牌量充足稳定

江西井冈山：女子漂在河中央奄奄一息，危急时刻他一头跳入了水中！

有卫星通信中兴行业终端春季新品发布会定档 4 月 12 日|独家

X 广告

行业动态

行业资讯

植物科普

植物收藏

福建尤溪县融媒体中心亮相2021中国网络媒体论坛展示会

　　尤溪县融媒体中心精彩亮相2021中国网络媒体论坛展示会　　今天(24日)上午，2021中国网络媒体论坛展...

中老铁路开通在即，建设者回味在“水豆腐”里打隧道的日子

　　中新网玉溪11月25日电题：中老铁路开通在即，建设者回味在“水豆腐”里打隧道的日子　　记者缪...

5G、8K、AI……媒体未来什么样？记者探馆中国网络媒体论坛

　　昨天，中国网络媒体论坛新技术新应用新业态展示会在广州开幕，43家媒体和互联网平台单位参加展会。...

花木盆景

园林景观

绿色生活