分享

Python抓网页生成Excel文件

 mastereye 2018-09-06

Python抓网页生成Excel文件

python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

贴代码

  1. #-*- encoding:utf-8 -*-
  2. import sys
  3. import locale
  4. import string
  5. import traceback
  6. import datetime
  7. import urllib2
  8. from pyquery import PyQuery as pq
  9. # 确定运行环境的encoding
  10. reload(sys);
  11. sys.setdefaultencoding('utf8');
  12. f = open('gongsi.csv', 'w');
  13. for i in range(1,24):
  14. d = pq(url="http://www./cgcms/Enterprise/lingYu?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  15. itemsa=d('dl dt a') #取title元素
  16. itemsb=d('dl dd') #取title元素
  17. for j in range(0,len(itemsa)):
  18. f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  19. #end for
  20. #end for
  21. f.close();


接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多