[数据]市级常用面板数据整合1949-2016

所有资料都有简单介绍,要注明是否原创、侵删。
回复
头像
hellohappy
网站管理员
网站管理员
帖子: 329
注册时间: 2018年11月18日, 14:27
Has thanked: 1 time
Been thanked: 7 time

#1 [数据]市级常用面板数据整合1949-2016

未读文章 hellohappy » 2021年5月09日, 16:27

简介:
    数据来源和原始数据见这三个链接:国家统计局中国城市统计年鉴区域经济统计年鉴。本数据由站长自己整理,转发请留本站链接。

    整个整合过程使用了vbs和sql两个工具。合并的过程当时没做详细记录。但基本流程可以参考这个帖子

整合的注意事项如下:
Spoiler
Show
    1. 所有的变量名都在'变量名所属的分类'文件夹里面的对应excel中有。

    2. 中国城市统计年鉴只收录了46个变量。数据跨年度为1984-2016,涉及城市数约320个
       区域经济统计年鉴共收录了129个变量。数据跨年度为1999-2015,涉及城市数约334个
       国家统计局网站的年度统计数据收录了全部39个变量。数据跨年度为1949-2016,涉及城市数约36个

    3. 所有数据的年份都是实际年份而不是发布的年份,比如《2017年中国城市统计年鉴》的所有数据的year都记录为2016

    4. 中国城市统计年鉴只收集了全市(地区),没有收集市辖区(市区)的数据。

    5. (1)excel版本包括两个sheet表,一个按照地区时间排序,一个按照时间地区排序。
       (2)excel每个sheet表中都有两条黄色的纵列,用于区分中国城市统计年鉴变量、区域经济统计年鉴变量、国家统计局年度统计变量。
          也即:     中国城市统计年鉴变量 |黄色纵列| 区域经济统计年鉴变量 |黄色纵列| 国家统计局年度统计变量
       (3)sheet'按地区、时间排'的最后三列为计算GDP平减指数的过程
       (4)较为重要的指标已经用边框框起来了,方便查看

    6. dta 版本是直接根据excel版本的'按地区、时间排序'的sheet导入的。
       ps:由于这三个统计来源有些变量会重名,所以stata会自动帮重复的命名为字母。直接看变量的注释即可区分

    7. (1)关于以2010年为基期的GDP平减指数的计算,这个变量都是用中国区域经济统计年鉴的数据来计算的。
       (2)只有中国区域经济统计年鉴里面有 GDP指数 这个变量。年鉴里面没有明说他是怎么算的,我查找了一下资料,他应该是按上一年的
         价格为基础,以上一年为100,计算出来的实际GDP的值。所以按我的理解他就可以用来计算GDP平减指数。
       (3)以数据最多的那一年为基期,因为只要中间有一年是空的。后面(或前面)整个GDP平减指数就算不出来了。
       (4)下面是统计信息
           年份    非空数目(个)
           1999    0
           2000    311
           2001    322
           2002    324
           2003    325
           2004    327
           2005    326
           2006    329
           2007    326
           2008    329
           2009    330
           2010    332
           2011    329
           2012    329
           2013    329
           2014    11
      (5)我用了2010年为基期,公式:
         今年GDP平减指数 = 今年名义GDP / 2010年为基期的实际GDP
         上年为基期的实际GDP = 上一年名义GDP * 今年GDP指数
         上上年为基期的实际GDP = (上上一年名义GDP * 上年GDP指数) * 今年GDP指数        
          (实际应该为约等于,毕竟不是每年价格都不变)
    8. 附上各个统计来源的主要变量差异(基于变量的抽样检查):
       (1)中国城市统计年鉴:
          以此为标准数据
       (2)区域经济统计年鉴:
          省的统计数值一般大于中国城市统计年鉴
          直辖市与中国城市统计年鉴差异不大
         其他差异不大
       (3)国家统计局网站的年度统计数据:
          没有省级的数值
          直辖市的数值通常大于中国城市统计年鉴,
          其他差异不大

下载:
数据汇总:
    xlsx格式:
    stata格式:
市级年度面板.zip
(2.75 MiB) 尚未被下载
数据缺失分析:
其他细节数据来源:
省级信息表.xls
(49 KiB) 尚未被下载
统计说明:
统计说明.txt
(2.32 KiB)
统计说明.txt
(2.32 KiB) 尚未被下载

hellohappy

谢谢老板~

使用微信扫描二维码完成支付


Link:
Hide post links
Show post links


回复