justinzm / gopup

数据接口:百度、谷歌、头条、微博指数,宏观数据,利率数据,货币汇率,千里马、独角兽公司,新闻联播文字稿,影视票房数据,高校名单,疫情数据…
http://www.gopup.cn
2.55k stars 389 forks source link
covid19-data data data-analysis data-science datasets economic-data gopup index-data python

gopup (python3)

建议安装方法

pip install gopup

升级方法

pip install gopup --upgrade

GoPUP 支持Python 3.7+,旨在使获取数据尽可能方便,主要用于学术研究目的。

GoPUP 项目所采集的数据皆来自公开的数据源,不涉及任何个人隐私数据和非公开数据。 同时本项目提供的数据接口及相关数据仅用于学术研究,任何个人、机构及团体使用本项目的数据接口及相关数据请注意商业风险。

部分接口需要TOKEN,官网注册获取TOKEN

文档:中文文档

快速开始

import gopup as gp
df = gp.weibo_index(word="疫情", time_type="1hour")
print(df)

数据仓库

版本更新

0.3.8 
指数数据:迭代百度指数

0.3.6
生活数据: 老黄历
信息数据: 中国电竞价值排行榜 

0.3.5
生活数据: 车站信息、车次时刻表

0.3.4
信息数据: 历史上的今日、百度风云榜、微博热搜榜、微信热词榜、知乎热搜榜、豆瓣排行榜

0.3.3 
指数数据:搜狗指数趋势数据

0.3.2 
中国宏观数据: 工业增加值增长、财政收入、社会消费品零售总额、信贷数据、外商直接投资数据(FDI)
迭代百度迁入与迁出地详情

0.3.1
迭代微博数据采集

0.3.0
中国宏观数据:国内生产总值数据、居民消费价格指数(CPI)、工业品出厂价格指数(PPI)、采购经理人指数(PMI)、存款准备金率数据、货币供应量数据、外汇储备数据

0.2.9.1
迭代百度指数解析问题

0.2.9
迭代头条指数改为算数指数,分为头条、抖音两套指数

0.2.8
全国高校:全国高等学校详情数据
百度迁徙数据:迁入与迁出地详情、迁徙规模

0.2.7
诗词数据:唐代诗人、唐诗数据
迭代百度搜索指数、百度资讯指数、百度媒体指数

0.2.6
中国油价数据:汽柴油历史调价信息、调价日的地区油价历史数据

0.2.5.1108
宏观经济:货币汇率数据

0.2.5
百度指数数据:百度需求图谱、百度人群画像年龄分布、百度人群画像性别分布、百度人群画像兴趣分布

0.2.4
全国高等学校名单:全国普通高等学校名单、全国成人高等学校名单

0.2.3
头条指数数据:头条指数数据、头条相关性分析、头条情感分析、头条地域分析、头条城市分析、头条年龄分析、头条性别分析、头条用户阅读兴趣分类
谷歌指数数据:谷歌指数数据、谷歌事实查证

0.1.9
影视数据:电影票房数据、影院票房、电视剧播映指数、综艺播映指数、艺人商业价值、艺人流量价值

0.1.8
新经济公司:千里马公司、独角兽公司、倒闭公司、商业特许经营公司

0.1.4
利率数据:Shibor数据、Shibor报价数据、Shibor均值数据、LPR数据

0.1.1
宏观经济:中国宏观经济

0.1.0 
规范说明文档格式
指数数据:微博指数、百度指数
疫情数据:网易疫情数据、丁香园疫情数据、百度疫情数据、百度迁徙数据、疫情历史数据