Python是一种强大的编程语言,可用于许多不同的应用程序,包括破解密码。在这篇文章中,我们将使用Python编写程序,以破解当当阅读。
import requests import re url = "https://e.dangdang.com/ebook/api/reading.do" r = requests.get(url) content = r.text pattern = re.compile(r'"token":"(.+?)"') token = re.findall(pattern, content)[0] headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3', 'X-Device-Id': '1234567890', 'token': token, 'Referer': 'https://e.dangdang.com/ebook/read/initReader.action?bookId=1909989362&chapterId=8905711&pageNum=1&skinId=0&skinType=0&zoom=1.2&mediaType=-1', } for pageNum in range(1, 11): params = ( ('bookId', '1909989362'), ('chapterId', '8905711'), ('pageNum', pageNum), ('skinId', '0'), ('skinType', '0'), ('zoom', '1.2'), ('mediaType', '-1') ) response = requests.get('https://e.dangdang.com/ebook/api/read.m', headers=headers, params=params) print(response.content.decode('unicode_escape'))
这个程序使用了Python的requests和re模块。首先,我们使用requests库获得当当阅读网站的响应。接着,我们在响应的正文中使用正则表达式,提取token值。
接下来,我们使用该token值构造HTTP请求头,并循环访问1到10页的内容。构造HTTP请求时,我们使用了页面的参数,包括bookId、chapterId、pageNum等等。
最后,我们使用Python的print函数输出每一页的内容。如果您将此程序运行在控制台中,您将看到每一页的原始HTML代码(不是格式化的)。