带cookie验证解决方法

news/2024/5/18 11:49:09 标签: cookie, 爬虫

示例:

不带cookie


cookie结果;


分析cookie:示例


无论是什么设备,第一次访问该站,都会弹出一个521的错误状态码,与此同时还会返回一个Cookie。

浏览器接受到状态码与Cookie,会再次进行一次请求,因为接收到了Set-Cookie,所以第二次的Request Headers会附上之前接收到cookie


这样的请求才是成功的。

这个防爬虫的方法非常基础,利用了普通爬虫与浏览器对于Status Code的处理方式不同。

你要爬取,只需要先请求一次,获得一个Cookie并保存,然后之后所有的请求都附上这个保存下来的Cookie,这样就行了。

爬虫的要诀在于:尽力模仿用户使用浏览器的行为。


http://www.niftyadmin.cn/n/1095143.html

相关文章

Andorid Dialog 显示宽度设置

dialog.getWindow().setLayout(200, LayoutParams.WRAP_CONTENT);转载于:https://www.cnblogs.com/daxin/p/5057429.html

让图片任意旋转

前几天做了一个让图片旋转任意角度的功能,今天跟大家分享一下。。 1、首先把力图片加载进来。 //strPagePath为图片的路径System.Drawing.Image ImgPointer null;if (File.Exists(strPagePath))ImgPointer System.Drawing.Image.FromFile(strPagePath);//加载图片…

爬虫iframe blocked解决

pyspider爬虫遇到iframe blocked的时候;需要绕过iframe跨域问题,直接爬取iframe框架url:上边为iframe框架封的数据,我们找到iframe框架内的url,直接爬取该url数据:爬取该url数据:解决iframe的问题&#xff…

《需求分析与系统设计》读书笔记2

继续阅读,这段时间阅读了《需求分析与系统设计》的四到六章,对这本的中心思想了解更见深入,对作者关于软件开发中的需求分析阶段的思想有了一定的认识。作者对需求分析的方法和遇到问题的解决方法都有着自己读到的见解,这些作者提…

知识图谱入门 (五) 知识存储

欢迎大家关注我的博客 http://pelhans.com/ ,所有文章都会第一时间发布在那里哦~ 知识存储,即获取到的三元组和schema如何存储在计算机中。本节从以Jena为例,对知识在数据库中的导入、存储、查询、更新做一个简要的介绍,而后对主流…

Java寫聊天小程序

歷程 1. 寫出界面 2. 用socket實現通信 转载于:https://www.cnblogs.com/genslow/p/3838284.html

spark 函数(python)

RDD的概念 RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD。从编程的角度来看,RDD可以简单看成是一个数组。和普通数组的区别是,RDD中的数据是分区存储的,这样不同分区的数据就可以分布在不同的机器上&#xf…

[ring3反作弊篇] 基于EBP遍历调用栈及模块名

http://blog.csdn.net/wangningyu/article/details/44569803转载于:https://www.cnblogs.com/zengkefu/p/5066367.html