BaiduCrawler A crawler crawling baidu searching results by means of constantly changing proxies. 爬取百度搜索结果中c-abstract里的数据,并使用不断更换代理ip的方式绕过百度反爬虫策略,从而实现对数以10w计的词条的百度搜索结果进行连续爬取。 ###爬取策略 有3个策略: 每当出现download_error,更换一个IP 每爬取200条文本,更换一个IP 每爬取20,000次,更新一次IP资源池