python爬虫怎么做？-周公解梦-零零导航工具

您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识

python爬虫怎么做？

爬虫,数据,图片python爬虫怎么做？

发布时间：2016-12-08加入收藏来源：互联网点击：

因为爬虫这种技术，既不需要你系统地精通一门语言，也不需要多么高深的数据库技术，高效的姿势就是从实际的项目中去学习这些零散的知识点，你能保证每次学到的都是最需要的那部分。

当然唯一麻烦的是，在具体的问题中，如何找到具体需要的那部分学习资源、如何筛选和甄别，是很多初学者面临的一个大问题。

回答于 2019-09-11 08:43:50

爬虫实际就是自动化的去做网络后获得想要的数据。

做网络爬虫通常可以用Python、Java、C等，甚至有人用Go和Nodejs等做爬虫，语言并不是最重要的，爬取理念并实现（即怎么爬到）才是重要的，只是Python开发快，符合做爬虫快速开发的需求且生态较好所以更多人使用。

下面讲讲我自学爬虫后总结的方法:

1.首先是网络请求，大致会了解使用到http、https协议，请求方法大致为GET/POST/PUT/HEAD/DELETE等，而Python中会使用到默认库如urllib，而使用久了会发现并不pythonic，所以你会发现一个非内置却胜似内置的requests，自动化测试用的selenium等。紧接着你会需要格式化你要的文本，例如json、正则re、dom解析beautifulsoup、xml及xpath等；

2.取得数据后你会考虑让数据落地操作，这时候会考虑redis、mq、kafka等队列及缓存系统亦或常见如MySQL、Oracle、sqlite、mongodb、hbase、elasticsearch等数据库；

3.而在这移动时代，你会发现你开始需要的数据不止在PC端，还在手机端，APP端，因此你开始需要尝试抓包软件(中间人攻击)，如fiddler、阿里的Anyproxy、Python的Mitmproxy等，并采用Appium、adb、按键精灵等进行模拟操作从而实现自动化，当然你也可以尝试对APP进行反编译等操作；

4.而后你发现你的爬虫爬取速度开始不能满足你的需求，所以你开始学习尝试使用异步、多线程/多进程、分布式，开始使用爬虫框架Scrapy、spider等来爬取一些大同小异的站点；

5.正当你爬的欢愉时反爬虫开始捂住你大笑的嘴，你会碰到头部信息识别、动态网页、ajax异步请求、JS压缩代码混淆、自定义字体库、验证码、IP封锁（动态代理、拨号代理等）、账号登录（封号）、蜜罐投毒等等五花八门的手段，这时候也只能看谁手段硬了；

6.在与移动端交互中，数据可视化下，你会开始需要使用web框架如Flask/Django/Springboot等写接口，而可视化会用到常见的echarts、D3.js等进行图表渲染；

好了，本次吹水暂时到这里，手机敲字实在是累，所以你还想了解其他的？那就下次再说吧[灵光一闪]

4/4 首页上一页 2 3 4

上一篇：根管治疗的费用是多少？

下一篇：返回列表

爬虫数据图片

相关链接
公司需建个网站，用于记录单据的信息和数据统计等，用ASP 2020-12-06 谁有洛天依黑化图片？ 2020-12-06 图片后期如何入门？ 2020-12-06 有没有初音未来的漂亮图片？ 2020-12-06 python做爬虫合适吗？ 2020-12-06 数据分析中，定性变量如何量化，比较好的方法有哪些？ 2020-12-06 搞笑领域的文章该咋么写？只有段子和图片吗？ 2020-12-06 红米手机里面的短信数据丢失怎么恢复？ 2020-12-06 你们有哪些动漫漂亮的图片？ 2020-12-06 游戏公司数据挖掘20W+和某四大行软件研发中心15W、哪 2020-12-06

网友回复（共有 0 条回复）

李镇西	窦桂梅	魏书生	高考作文	中考作文	励志故事	鬼故事
民间故事	神话故事	历史故事	诗歌大全	经典散文	人教版:部编本:一年级语文
人教版:部编本:二年级语文		人教版:部编本:三年级语文		人教版课标本第一册:一年级语文上册

您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识

回答于 2019-09-11 08:43:50

相关链接