[原创]stata录入面板数据

这里只有作者精心编写的研究经历!
回复
头像
hellohappy
网站管理员
网站管理员
帖子: 269
注册时间: 2018年11月18日, 14:27
Been thanked: 1 time

#1 [原创]stata录入面板数据

未读文章 hellohappy » 2019年5月22日, 07:02



目录:
    前言:
    方法:
        数据格式要求:
        命令安装:
        命令:
        录入效果:
    命令下载:
        原作者地址:
        我提供的下载:
    其他:


前言:

    使用stata录入面板数据时候,一般要求数据的形式为横轴是变量名,纵列包括时间和个体维度。如果你的数据本身就满足这个条件,那就直接导入excel即可(这个请自行搜索,或者你摸索一下就会了)。但是,万一数据的横轴是时间或者个体,而不是标准的stata数据录入格式,怎么办?

方法:

    网上找了许久,找到了一个可用的命令readWind,命令非官方也未发布,所以需要手工安装或者github安装。

    数据格式要求:

        这个命令是用来录入Wind终端的股票数据的,只要满足这样的数据类型都可以录入。
            1.横轴为时间维度
            2.纵轴为个体维度
            3.整个数据表的数据是同一个变量
            4.变量名都在第一行,数据从第二行第三列开始。
        tip:如果你的数据部署横轴为时间,而是横轴为个体,你可以用excel转置一下。如果你的数据没有两列的个体维度变量,你可以自己随便加一列空行,然后起个名字就好。其实就是,转换成下面对应的样子就行。
       如下两个数据例子:
stata录入面板数据类型举例1.png
stata录入面板数据类型举例1.png (8.61 KiB) 查看 216 次
stata录入面板数据类型举例1.png
stata录入面板数据类型举例1.png (8.61 KiB) 查看 216 次
stata录入面板数据类型.png

    命令安装:

        命令的安装有两种方法,一种是先安装github命令,再下载作者的命令;一种就是手动下载下来,直接复制到 ado 目录(ado目录通常在c盘)下 plus 目录下的 r 目录下。推荐后者。
stata录入面板数据readWind命令手动安装.png

    命令(excel名称必须为英文):

Code: 全选

cd "这里写你的目录路劲"
readWind, var(EXCEL名称) timeType(时间类型) t0(样本起始时间) [split splitN(样本分割数) erase]
命令的帮助
Show
Title

    readWind - Read the data downloaded from the Wind into Stata in a long form

Syntax

        readWind , var(name of excel) timeType(time type) t0(start time of the sample) [split splitN(k) erase]

Description

    var
        var is the name of the excel.

    timeType
        timeType refers to whether the downloaded sample is annual, quarterly or monthly, so its value is y/q/m.

    t0
        Sample start time, for example, if you choose to download it from January 1995, then this t0 will write 1995m1. Quarterly and monthly correspond to 1995q1 and 1995 respectively..

    split splitN (n)
        erase are optional. When the column of data is too large, the speed of data format conversion is relatively slow. So we adopt a compromise method to divide the sample into n small samples, and then process them in turn and merge them together.  The recommended value of n is between 1/10 and 1/20 of the number of the data columns.

Example
 
    . readWind, var(ROE) timeType(q) t0(1995q1)
 
    . readWind, var(ROE) timeType(q) t0(1995q1) split splitN(10) erase


    录入效果:

        命令和结果分别如下:
        readWind, var(Inward_Flow) timeType(y) t0(1970)

stata录入面板数据效果1.png
stata录入面板数据效果1.png (75.7 KiB) 查看 213 次
stata录入面板数据效果1.png
stata录入面板数据效果1.png (75.7 KiB) 查看 213 次

        readWind, var(ROE) timeType(q) t0(1995q1)

stata录入面板数据效果2.png
stata录入面板数据效果2.png (54.74 KiB) 查看 213 次
stata录入面板数据效果2.png
stata录入面板数据效果2.png (54.74 KiB) 查看 213 次

命令下载:
    原作者的代码由于没有判断变量类型,如果你的个体维度变量被识别为数值而不是字符串可能会报错,所以你可以下我的版本。以后有空其实可以改写一下这个readWind命令,改写成任意的个体维度变量个数(而不是必须两个)和任意的生成名字(默认生成名字为个体维度1:stkcd;个体维度2:comp;时间维度:time;变量名:文件名)。
    原作者地址:

        原作者这里如果你只需要readWind命令,只用下载 readWind.ado 和 readWind.sthlp 。
        https://github.com/zhbsis/TwoSort

    我提供的下载(推荐):

readWind.zip
(2.6 KiB)
readWind.zip
(2.6 KiB) 尚未被下载

其他:

    原作者自己也写了一篇文章介绍他的命令。
 

Link:
Hide post links
Show post links


回复