搜索

分享

QQ空间 QQ好友新浪微博微信

想写代码，特别是爬虫代码，怎么学习？

昵称11935121 2018-06-29

展开全文

不清楚你为什么想学习爬虫代码，可能是好奇或者是出于学习的目的吧。爬虫说的明白、清楚一点，就是解析网页，获取数据，后续就是数据处理的过程。目前来说，网上也有现成的爬虫软件，像八爪鱼，Forespider等，如果你急着爬取数据，而又不懂编程的话，这些软件你可以学学，官网都有详细的教程和例子，花费几个小时就能掌握。至于你想学习代码的话，目前主流的编程语言，像python，java，php，nodejs等都可以做爬虫，也有现成的包或框架，你直接使用就行，要学的内容主要如下：

1.熟悉基本的网页知识。像前端的html，css，js等，我们要爬去的数据大部分都存储在网页中，你需要对网页结构和基本标签有个基本了解，没必要熟练所掌握，大概看得明白就行，如果你还没有一点基础的话，建议花费个一两天时间学习一下，网上的教程很多，你可以学习一下，如菜鸟教程http://www.runoob.com/html/html-tutorial.html等：

2.再着就是要会使用浏览器的开发者工具，大部分情况下，网页的数据都是静态的，在网页源码中，但有些情况下，数据是异步加载的的，动态的，可能是一个json文件，这个时候你就需要会抓包分析，找到真实数据的URL，获取数据：

3.学一门编程语言。如果你没有基础的话，我建议学习python，简单易学，容易上手，开发效率高，生态环境良好，社区活跃，有大量的第三方包可以使用，像专门爬虫的包urllib,urllib2,requests等，都很好学，花个个把小时，你就会基本使用：

4.基本入门后，你就可以试着学习爬虫框架了，可以提高你的开发效率，不用重复造轮子，很快就能搭建一个爬虫系统，像python的scrapy框架等，其他语言也都会提供爬虫框架，你可以深入的学习一下，一定会对你有大的帮助：

我总结的就是这几点，我也才入门爬虫，学习的时间不长，主要是需要网上的数据做分析才学的，至于后面如何分析和处理数据，也才开始慢慢接触，只要你用心学习，多做个例子，多调试调试代码，很快就能掌握爬虫的，对于爬取网上大部分数据来说，绝对没有问题，希望以上分享的内容能对你有所帮助吧，可以共同探讨、学习。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：昵称11935121 > 《未命名》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

昵称11935121

关注对话

TA的最新馆藏

新手扫盲, 教你汽车AC键应该如何用!
你是哪种睡姿，就是哪种人，神准！
做人不要“穷老实”，在这三个方面要学会“硬”一点
易经学习-八卦解析掌诀图掐指神算秘诀大全！
你知道旗袍的腿部两边为何要开叉吗？说出来你可能不信！
从手机批量转移照片和视频到电脑的4种方法，最后一种最实用！

喜欢该文的人也喜欢更多

热门阅读换一换