今天小千來發(fā)福利了,教大家如何從網(wǎng)上爬取美女街拍圖片,然后批量插入到word里面,沒事的時候可以拿出來養(yǎng)養(yǎng)眼不是,看下去文末附源碼獲取方式:
本文涉及知識主要包括Ajax動態(tài)加載網(wǎng)頁爬取、requests保存網(wǎng)頁圖片以及word批量插入圖片。
第一步:分析圖片數(shù)據(jù)接口打開今日頭條主頁,搜索街拍,會出現(xiàn)好多街拍圖片
一直往下拉,圖片會一直加載,但是網(wǎng)頁url未變化,這時我們要打開流量分析工具。以火狐瀏覽器為例,依次右鍵-查看元素-網(wǎng)絡(luò),然后點擊左上角清除按鈕
下拉網(wǎng)頁:
出現(xiàn)一大堆加載數(shù)據(jù),這時我們打開第一個的json文件的響應(yīng)窗口:
發(fā)現(xiàn)這返回的就是街拍圖片信息,每次返回20條,再看看它的請求參數(shù):
經(jīng)過試驗發(fā)現(xiàn),timestamp和_signature是變化參數(shù),但是可以舍棄,最后以offset的變化來改變換頁(0代表第1頁,20代表第2頁,依次類推...)
第二步:python下載圖片準(zhǔn)備下載20頁的數(shù)據(jù)
1.首先構(gòu)造url
2.模擬請求數(shù)據(jù),并將返回數(shù)據(jù)轉(zhuǎn)換成json格式
一定要帶上登錄后的cookie數(shù)據(jù),否則無法返回圖片信息
3.從返回數(shù)據(jù)中取出標(biāo)題和圖片url
4.requests下載圖片,并以標(biāo)題命名
5.圖片效果展示
第三步:word批量插入圖片安裝docx和PIL模塊,直接pip安裝即可
1.導(dǎo)入相關(guān)模塊
2.遍歷該文件夾下所有圖片名
3.獲取每張圖片像素大小
主要是因為街拍圖片像素差別較大,想按原像素大小導(dǎo)入word中,img.size為元組類型數(shù)據(jù),這里用list將其轉(zhuǎn)化為列表
4.將圖片按原像素添加至word中
5.最終效果
看完了,是不是想試一試了,想要源碼的同學(xué)可以添加我們的Python技術(shù)交流qq群:790693323,加群找群管理要學(xué)習(xí)資料和項目代碼即可,還在等什么,等你來哦~~~~