分享

python爬取双色球20年来的历史开奖数据

 独角戏jlahw6jw 2024-07-28

心血来潮,打算把双色球历史开奖数据喂给大模型,让大模型替我预测一下每期双色球的开奖结果。

所以第一步,就是搞定训练的数据源。

百度一下,输入双色球开奖结果,看到了中彩网,直接F12打开调试模式

python爬取双色球20年来的历史开奖数据

get请求,不用登录,这就很方便了。

写python代码

import requestsimport json# 动态参数,需要根据实际情况填充dynamic_timestamp = '1720075528388' # 例如从当前时间生成dynamic_tt = '0.6040359491107643' # 可能是一个随机数或时间戳# 请求URLurl = f'https://jc.zhcw.com/port/client_json.php?callback=jQuery1122009121818915345226_{dynamic_timestamp}&transactionType=10001001&lotteryId=1&issueCount=0&startIssue=2003001&endIssue=2024075&startDate=&endDate=&type=1&pageNum=1&pageSize=5000&tt={dynamic_tt}&_=1720075528388'# 请求头headers = { 'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate, br, zstd', 'Accept-Language': 'zh,zh-CN;q=0.9', 'Cache-Control': 'no-cache', 'Connection': 'keep-alive', 'Cookie': 'PHPSESSID=r8r42jpq7tcs3rk46mc1gjei03; Hm_lvt_692bd5f9c07d3ebd0063062fb0d7622f=1720075529; Hm_lpvt_692bd5f9c07d3ebd0063062fb0d7622f=1720075529; _ga_9FDP3NWFMS=GS1.1.1720075529.1.0.1720075529.0.0.0; Hm_lvt_12e4883fd1649d006e3ae22a39f97330=1720075530; Hm_lpvt_12e4883fd1649d006e3ae22a39f97330=1720075530; _ga=GA1.2.692943629.1720075530; _gid=GA1.2.1494209071.1720075530; _gat_UA-66069030-3=1', 'Host': 'jc.zhcw.com', 'Pragma': 'no-cache', 'Referer': 'https://www.zhcw.com/', 'Sec-Ch-Ua': ''Not/A)Brand';v='8', 'Chromium';v='126', 'Google Chrome';v='126'', 'Sec-Ch-Ua-Mobile': '?1', 'Sec-Ch-Ua-Platform': ''Android'', 'Sec-Fetch-Dest': 'script', 'Sec-Fetch-Mode': 'no-cors', 'Sec-Fetch-Site': 'same-site', 'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Mobile Safari/537.36'}# 发送GET请求response = requests.get(url, headers=headers)# 检查响应状态码if response.status_code == 200: print('请求成功') # 处理响应数据 # 移除包裹在JSON数据外的JavaScript代码,只保留JSON数据部分 json_data = response.text.split('(')[1].split(')')[0] # 将JSON数据转换为Python字典 data_dict = json.loads(json_data) # 访问'data'键下的列表 data_list = data_dict['data'] # 打印'data'列表中的每一项 for item in data_list: for info in item['winnerDetails']: if info['awardEtc'] == '1': print('期号:' + item['issue'], '开奖日期:' + item['openTime'], '红球:' + item['frontWinningNum'], '蓝球:' + item['backWinningNum'])else: print(f'请求失败,状态码:{response.status_code}')

打印结果

python爬取双色球20年来的历史开奖数据

数据这不就来了嘛,明天就训练模型,试试效果。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多