python爬虫突破图片验证码，模拟登陆古诗词网

练楚媛 2024-11-14 百科资讯 452 次浏览 0个评论

内容：

图/文：迷神

对Python的热爱，尤其是Python爬虫，常常让我们遇到图片验证码的困扰。本次，我们将模拟登陆古诗词网，一探其背后的秘密。

[插入图片：古诗词登陆界面]

首先，我们进行第一次的登陆尝试，并借助谷歌浏览器的调试工具，观察提交的参数。

[插入图片：提交参数截图]

我们发现，code是验证码，email是账号，pwd是密码，from为空，denglu是固定的参数。而由于古诗词网使用的是.net程序，所以__VIEWSTATE和__VIEWSTATEGENERATOR每次登录都会变化，需要在登录界面获取。

[插入图片：核心参数截图]

现在，我们来看看突破图片验证码，模拟登陆古诗词网的核心代码。这主要涉及到获取两个参数以及验证码的识别。

[插入图片：核心代码截图]

这就是我们的全部内容。需要注意的是，验证码的识别成功率并不是100%，可能需要多次尝试。同时，我们可以使用s = requests.session()来保持登录会话状态，这样在登录后，就可以随心所欲地进行操作了。

需要完整代码的，私信回复：古诗词，即可获取。

转载请注明来自海勃湾区刘松霖工作室，本文标题：《python爬虫突破图片验证码，模拟登陆古诗词网》

练楚媛 0篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！

鸡蛋卷怎么做好吃