網(wǎng)站專題建設(shè)合同2024新聞熱點(diǎn)事件
嗨害大家好鴨!我是小熊貓~
本來(lái)是不玩原神的,
但是實(shí)在是經(jīng)不住誘惑鴨~
畢竟誰(shuí)能拒絕可以爬樹、炸魚、壺里造房子、抓小動(dòng)物、躲貓貓的對(duì)戰(zhàn)游戲捏~
準(zhǔn)備工具
源碼資料電子書:點(diǎn)擊此處跳轉(zhuǎn)文末名片獲取
準(zhǔn)備模塊
import requests
import re
import execjs
請(qǐng)求鏈接
本次目標(biāo)
所有角色的:
- 基礎(chǔ)介紹
- 中日語(yǔ)音
- 圖片
分析數(shù)據(jù)來(lái)源
1. 右鍵點(diǎn)擊檢查(開發(fā)者工具)
2.刷新網(wǎng)頁(yè),找準(zhǔn)對(duì)應(yīng)數(shù)據(jù)
開始代碼
url = 'https:///main/character/liyue?char=1'
html_data = requests.get(url).text
print(html_data)
源碼資料電子書:點(diǎn)擊此處跳轉(zhuǎn)文末名片獲取
篩選數(shù)據(jù)
隨便搜索網(wǎng)站內(nèi)包含內(nèi)容:“南十字”
使用正則表達(dá)式匹配數(shù)據(jù)內(nèi)容
js_text = re.findall('window.__NUXT__=(.*);', html_data)[0]
執(zhí)行結(jié)果
html_data = requests.get(url).text
js_text = re.findall('window.__NUXT__=(.*);', html_data)[0]
result = execjs.eval(js_text)
此時(shí)會(huì)出現(xiàn)編碼問題
加指定編碼
import subprocess
from functools import partial
subprocess.Popen = partial(subprocess.Popen, encoding="utf-8")
再次運(yùn)行,無(wú)報(bào)錯(cuò)
使用pprint查看數(shù)據(jù)結(jié)構(gòu)
pprint.pprint(result)
返回網(wǎng)頁(yè)查看我們需要的內(nèi)容
打印所需數(shù)據(jù)
charList = result['data'][0]['charList']
for char in charList:cover1 = char['cover1']title = char['title']intro = char['intro']audio_list = char['cv'][0]['audio']print(title, intro, cover1, audio_list)
部分效果展示
全部代碼
import requests
import re
import execjsurl = 'https://python學(xué)習(xí)交流:660193417/main/character/liyue?char=1'
html_data = requests.get(url).text
js_text = re.findall('window.__NUXT__=(.*);', html_data)[0]
result = execjs.eval(js_text)
# pprint.pprint(result)
charList = result['data'][0]['charList']
for char in charList:cover1 = char['cover1']title = char['title']intro = char['intro']audio_list = char['cv'][0]['audio']print(title, intro, cover1, audio_list)