万普插件库

jQuery插件大全与特效教程

python爬取双色球20年来的历史开奖数据

心血来潮,打算把双色球历史开奖数据喂给大模型,让大模型替我预测一下每期双色球的开奖结果。

所以第一步,就是搞定训练的数据源。

百度一下,输入双色球开奖结果,看到了中彩网,直接F12打开调试模式

get请求,不用登录,这就很方便了。

写python代码

import requests
import json

# 动态参数,需要根据实际情况填充
dynamic_timestamp = '1720075528388'  # 例如从当前时间生成
dynamic_tt = '0.6040359491107643'  # 可能是一个随机数或时间戳

# 请求URL
url = f'https://jc.zhcw.com/port/client_json.php?callback=jQuery1122009121818915345226_{dynamic_timestamp}&transactionType=10001001&lotteryId=1&issueCount=0&startIssue=2003001&endIssue=2024075&startDate=&endDate=&type=1&pageNum=1&pageSize=5000&tt={dynamic_tt}&_=1720075528388'

# 请求头
headers = {
    'Accept': '*/*',
    'Accept-Encoding': 'gzip, deflate, br, zstd',
    'Accept-Language': 'zh,zh-CN;q=0.9',
    'Cache-Control': 'no-cache',
    'Connection': 'keep-alive',
    'Cookie': 'PHPSESSID=r8r42jpq7tcs3rk46mc1gjei03; Hm_lvt_692bd5f9c07d3ebd0063062fb0d7622f=1720075529; Hm_lpvt_692bd5f9c07d3ebd0063062fb0d7622f=1720075529; _ga_9FDP3NWFMS=GS1.1.1720075529.1.0.1720075529.0.0.0; Hm_lvt_12e4883fd1649d006e3ae22a39f97330=1720075530; Hm_lpvt_12e4883fd1649d006e3ae22a39f97330=1720075530; _ga=GA1.2.692943629.1720075530; _gid=GA1.2.1494209071.1720075530; _gat_UA-66069030-3=1',
    'Host': 'jc.zhcw.com',
    'Pragma': 'no-cache',
    'Referer': 'https://www.zhcw.com/',
    'Sec-Ch-Ua': '"Not/A)Brand";v="8", "Chromium";v="126", "Google Chrome";v="126"',
    'Sec-Ch-Ua-Mobile': '?1',
    'Sec-Ch-Ua-Platform': '"Android"',
    'Sec-Fetch-Dest': 'script',
    'Sec-Fetch-Mode': 'no-cors',
    'Sec-Fetch-Site': 'same-site',
    'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Mobile Safari/537.36'
}

# 发送GET请求
response = requests.get(url, headers=headers)

# 检查响应状态码
if response.status_code == 200:
    print("请求成功")
    # 处理响应数据
    # 移除包裹在JSON数据外的JavaScript代码,只保留JSON数据部分
    json_data = response.text.split('(')[1].split(')')[0]

    # 将JSON数据转换为Python字典
    data_dict = json.loads(json_data)

    # 访问"data"键下的列表
    data_list = data_dict['data']

    # 打印"data"列表中的每一项
    for item in data_list:
        for info in item['winnerDetails']:
            if info['awardEtc'] == '1':
                print('期号:' + item['issue'], '开奖日期:' + item['openTime'], '红球:' + item['frontWinningNum'],
                      '蓝球:' + item['backWinningNum'])
else:
    print(f"请求失败,状态码:{response.status_code}")

打印结果

数据这不就来了嘛,明天就训练模型,试试效果。

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言