点亮周围，城市夜间灯光数据的抓取

张春强2022 2018-04-16

展开全文

网课来啦！！！

开课通知

关于循环我们有两次正式的课程，循环后的post命令介绍是循环的进一步应用。我们将一些本来手工劳动的事情分解成简单的重复劳动，让计算机帮我们去跑，所以说循环是任何计算机语言的基础。Stata的循环虽然简洁但功能强大，其可以对数字进行循环、对变量、文件、local等任何东西循环，Stata因循环而完美。

今天的课程包括如下几个重点：

（1）如何对多个变量进行循环（把变量名放在一个local里面）；

（2）如何对一个变量的多个取值进行循环（把变量的取值列表放在一个local里面）；

（3）如何对多个文件进行循环（获得文件名并放入local）；

（4）如何跳转到循环开始的位置：一个循环可以看作是一对花括号“{}”，有时候我们需要跳转到循环开始的位置，比如我们要计算一群公司的beta，但是规定必须有20周以上的交易才能计算beta，此时假定在循环中遇到某公司的交易周数只有10个，当前一轮的循环不应该执行下去，但是我们应该跳转到循环开始的位置，前一个花括号的前面，进行下一家公司的计算。再比如我们要抓取某一家公司的公告页面，公告页面的url里面有page=1或page=2代表第一页或第二页，但是我们不知道究竟有多少页，只能每次判断，假定到page=37页的时候发现到头了，就需要从循环中跳转出来，即跳转到循环结尾，后一个花括号的后面。

（5）对日期进行循环；

（6）对Excel文件的多个sheet进行循环（重点是你怎么得到sheet名的列表。。。）。

有问题看过来：）

有问题，不要怕！点击推文底部“阅读原文”下载爬虫俱乐部用户问题登记表并按要求填写后发送至邮箱statatraining@163.com,我们会及时为您解答哟~

喜大普奔~爬虫俱乐部的github主站正式上线了！我们的网站地址是：https://stata-club.，粉丝们可以通过该网站访问过去的推文哟~

好消息：爬虫俱乐部即将推出研究助理供需平台，如果您需要招聘研究助理(Research Assistant or Research Associate)，可以将您的需求通过我们的公众号发布；如果您想成为一个RA，可以将您的简历发给我们，进入我们的研究助理数据库。帮我们写优质的推文可以提升您被知名教授雇用的胜算呀！

福利在这里

错过报名的小伙伴不要心慌，不要着急哦，我们的直播课程是有回放滴，欢迎继续报名呀!报名链接：

https://ke.qq.com/course/286526#tuin=9735fd2d

接下来是今天的推文！！！

抓取地址：www.udparty.com

抓取对象：1992-2013年22年的夜间灯光数据

一、为什么要抓取这个数据

夜间灯光影像作为一种较为特殊的能够有效监测夜间灯光的遥感影像，逐渐被学者深入研究，夜间灯光数据逐渐被应用于各行各业。如今夜间灯光数据主要被应用于城市化水平研究、人口研究、灾害研究以及社会发展研究等方面。

二、数据来源

夜间灯光影像是美国DMSP卫星上的OLS传感器所获取的，下载来源于https://ngdc./eog/dmsp/downloadV4composites.html，主要产品为平均可见光、稳定光源和云自由覆盖与平均光线x Pct数据。网站提供了1992年-2013年共22年间数据，自带坐标为WGS1984坐标系，此外，随着卫星传感器的更替，出现了一年有两个传感器测得的不同数据的情况。

三、抓取数据

查看数据网站的URL：

https://ngdc./eog/dmsp/downloadV4composites.html