分享

爬虫学习路线大纲

 江海博览 2024-03-06 发布于浙江
是程序员呐
是程序员呐
2024-02-27 14:13

今天分享下基础爬虫或者小规模爬虫,应该掌握哪些技能、需要如何学起!

【文末有获取方式】

【文末有获取方式】

爬虫学习路线大纲

Python 基础

  • 环境搭建
    • Python安装
    • 开发工具 - PyCharm,VS Code
  • 变量
    • 定义变量
    • 命名规则
    • 基本数据类型
  • 基本数据结构
    • 字符串
    • 列表
    • 字典
    • 集合
    • 元组
  • 流程控制
    • 条件
    • 循环
  • 函数
    • 调用函数
    • 定义函数
    • 函数参数
    • lambda 函数
  • 面向对象编程
    • 类和对象
    • 访问限制
    • 装饰器
爬虫学习路线大纲

数据采集与解析

  • HTTP 基本原理
    • URI 和 URL 统一资源定位符
    • HTTP&HTTPS 请求与响应
    • HTML 组成原理
  • WEB 基本原理
    • JavaScript&HTML&CSS
    • 节点树与节点
    • Web 加载原理
    • 静动态 Web 页面
  • Socket 库
    • 基于 socket 协议的爬虫
  • Requests 库
    • requests 库的使用
    • cookie 与 session
    • 模拟登录
    • 请求头模拟
    • IP 代理
  • 正则表达式
    • re 模块的使用
    • 基本字符串、数字等匹配规则
    • 贪婪与非贪婪匹配
  • Xpath
    • 执行原理
    • 节点操作
    • 元素操作
爬虫学习路线大纲
爬虫学习路线大纲
爬虫学习路线大纲

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多