爬虫代码

感谢大佬的爬虫代码,稍微修改了一下,目前只爬取了2019年的数据,不知道什么原因,总共运行了4天左右才爬取完毕。
需要爬取其他年份的可以自己修改代码运行,只需要将对应的年份修改一下即可。

数据下载

因为这些数据都是公开的,所以我也把自己下载好的数据公开,需要的可以直接下载。
注:此数据是2019年的数据。总共657207条数据
数据格式

  1. 有积分的可以给点:https://download.csdn.net/download/qq_36947168/72016224
  2. 没积分的可以百度云下载:
    链接:https://pan.baidu.com/s/1x4AfITEVaYPp2CRIyLG0jg
    提取码:rauu

另外如果有需要数据库表结构和数据的也可以留言,看到了就回。
数据库存储的数据

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐