七夕过后，我依然单身，于是我用Python爬了你们单身的原因

千锋Python学堂 2019-08-13

展开全文

前两天偶然在微博看到这样的一个关于520，七夕，情人节等等的普法教育。。。！相信前几天的七夕很多小仙女都收到了来自对方的爱意！

七夕过后，我依然单身，于是我用Python爬了你们单身的原因

可是还有很多伙伴连发红包的机会都没有。。。

七夕过后，我依然单身，于是我用Python爬了你们单身的原因

我就是这类，没收到爱意，也没机会送出爱意的这类！我也不知道我为什么还单着！哈哈哈，我想知道，这么多单着的人，你们单着是因为什么！爬虫！爬虫！爬虫！

大家说说，单着的这么多人，有分析过为什么如此优秀的你却还是单身呢？

一、需求背景

今天逛微博的时候发现一个有趣的话题#90后单身原因TOP3#

七夕之际，一份针对全国90后青年婚恋观进行抽样调查公布了结果。结果显示，一线城市单身占比持续领先。90后单身原因TOP3：圈子小、工作忙、对爱情幻想过于完美。

单身的三大原因：圈子小、工作忙、对爱情幻想过于完美！

我倒觉得这三个原因都似乎并不合理，难道单身的原因难道不是因为穷吗？哭唧唧。。。

二、功能描述

好奇这个调查是怎么来的？真实性有待考证，刚好这几天我们也学习了如何爬取微博话题，今天就来分析一下为何很多同学如此优秀却依然单身！

三、技术方案

模拟登录微博
爬取话题
保存文件
数据清洗
数据分析

四、模拟登录

模拟登录之前讲爬取#周杰伦超话#的时候已经讲过了，这里就不再重复，直接贴出代码！

七夕过后，我依然单身，于是我用Python爬了你们单身的原因

五、爬取话题

1.找到话题加载数据url

七夕过后，我依然单身，于是我用Python爬了你们单身的原因

https://m.weibo.cn/api/container/getIndex?containerid=100103type%3D61%26q%3D%2390%E5%90%8E%E5%8D%95%E8%BA%AB%E5%8E%9F%E5%9B%A0TOP3%23%26t%3D0&isnewpage=1&extparam=pos%3D41%26c_type%3D31%26realpos%3D40%26flag%3D0%26filter_type%3Drealtimehot%26cate%3D0%26display_time%3D1565179797&luicode=10000011&lfid=106003type%3D25%26t%3D3%26disable_hot%3D1%26filter_type%3Drealtimehot&page_type=searchall

2.代码模拟请求数据

我们依然使用requests库来爬取数据，这次猪哥在请求的时候增加了一个参数：timeout，这样做是为了防止请求某个一直没有应答导致堵死其他请求！

七夕过后，我依然单身，于是我用Python爬了你们单身的原因