数据库
1、中国省级官员数据库
在王贤彬和徐现祥的努力下,中心收集1978-2008年间了中国省区市党政正职领导人简历,整理成Excel格式数据。如有需要,请下载。
2、中国方言数据库
肖泽凯根据《汉语方言大词典》中2113个县及以上观测单元所使用的汉语方言,构建了278个地级及以上城市的方言多样性指数。徐现祥、刘毓芸、肖泽凯(2014)采用这个指数考察了方言多样性对经济增长的影响。如有需要,请下载。
3、中国资本主义工商业改造历史资料
中国在1950s进行了资本主义工商业改造,本数据整理了相关基本情况。如有需要,请下载。
4. 中国各省区市增长目标数据
中国经济增长目标数据库由中山大学岭南学院徐现祥教授团队依据各级政府的工作报告文本以及五年规划文本整理所得。这是一项持续的接力工作,梁剑雄、高元骅、李书娟和陈邱惠等先后参与这项工作。目前发布的是2000-2018年间中国各省区的经济增长速度目标数据。如有需要,请下载。
5. 中国地级行政审批中心数据
中国地级行政审批中心数据库由中山大学岭南学院徐现祥教授团队,依据各地行政审批中心官方主页的公示信息整理构建。目前发布的是截至2015年12月,333个地级行政审批中心相关数据,主要包括行政审批中心设立时间、进驻部门数量、进驻事项数量、进驻窗口数量等变量。如有需要,请下载。
6.新闻文本数据库(2000–2024)
实验室整理了超过 300 万条新闻文本的数据库。涵盖31家权威经济新闻报刊关于经济主题的新闻报道,数据信息包括新闻标题、作者、时间、全文等多维度信息。
7.央行沟通数据库(2000–2024)
实验室整理了超过 500 条央行沟通文本的数据库。涵盖口头沟通包括讲话、采访、时报文章、新闻发布会等文本,书面沟通包括《中国货币政策执行报告》等报告。数据信息包括沟通事项、时间、官员、全文等多维度信息。
8.政府采购数据库(2015–2023)
实验室整理了超过 300 万条政府采购信息的数据库。涵盖全国各级政府签订和公布的所有采购合同信息。相关变量包括合同名称、合同签订时间、合同金额、采购人、采购人所在地址、供应商企业及其所在地等信息。
9.中国营商环境数据库(2018–2023)
实验室整理了超过3万条中国营商环境信息的数据库。连续开展6轮全国实地调研,持续追踪记录我国“放管服”改革的新进展和新问题。调研对象涵盖全国 30 省、156市的503个政务服务中心,面对面访谈3.2万家市场主体,真实记录市场主体的声音。
10.土地交易数据(2000-2022)
实验室整理了2000-2022年的土地交易数据,相关变量包括成交地块位置、出让金、面积、年限等。
11.地级市财政收支明细(2003-2022)
实验室整理了2003-2022年的地级市财政收支明细数据,相关变量包括一般公共预算收入、税收收入、增值税收入、企业所得税收入、个人所得税收入、一般公共预算支出科学支出、教育支出、社会保障和就业支出、医疗卫生支出等。
12.政府工作报告原文
实验室整理了中央政府1954-2024年、省和地级市政府2002-2024年的政府工作报告原文。所有文件格式均为TXT,可以批量循环喂给AI或者大语言模型进行处理。