pysal.model.spreg.SURerrorGM

class pysal.model.spreg.SURerrorGM(bigy, bigX, w, regimes=None, nonspat_diag=True, spat_diag=False, vm=False, name_bigy=None, name_bigX=None, name_ds=None, name_w=None, name_regimes=None)[源代码]

基于极大似然估计SUR误差的用户类

参数:
bigy : 有因变量向量的字典,一个用于

每个方程

bigX : 解释变量矩阵字典,

每个方程一个

w : 空间权重对象
regimes : 列表

n值列表,并将每个观测值映射到一个区域。假定与“x”对齐。

nonspat_diag : 布尔值;非空间诊断的标志,默认值为假
spat_diag : 布尔值;空间诊断标志,默认值=假(待实现)
vm : 布尔值;lambda和sigma的渐近方差标志,

默认值=假(待实现)

name_bigy : 每个方程的因变量名称字典

默认值为“无”,但应指定在使用sur-stackxy时完成。

name_bigX : 字典,每个字典都有解释变量的名称

公式默认值=无,但当使用sur-stackxy时应指定。

name_ds : 字符串;数据集的名称
name_w : 字符串;权重文件的名称
name_regimes : 字符串;输出中使用的状态变量的名称

实例

首先导入pysal以加载空间分析工具。

>>> import pysal

使用pysal.open()打开有关NCOVR美国县凶杀案(3085个地区)的数据。这是与nat形状文件关联的dbf。注意pysal.open()也可以读取csv格式的数据。

>>> db = pysal.open(pysal.examples.get_path("NAT.dbf"),'r')

待估算模型的规格可作为列表提供。每个方程应单独列出。方程1以hr80为因变量,ps80和ue80为外生回归量。对于方程2,hr90是因变量,ps90和ue90是外生回归量。

>>> y_var = ['HR80','HR90']
>>> x_var = [['PS80','UE80'],['PS90','UE90']]
>>> yend_var = [['RD80'],['RD90']]
>>> q_var = [['FP79'],['FP89']]

SUR方法要求将数据作为字典提供。Pysal提供了工具sur_dictxy,从变量列表中创建这些字典。下面的一行将创建四个字典,分别包含因变量(bigy)、回归量(bigx)、因变量名(bigyvars)和回归量名(bigxvars)。所有这些都将从数据库(db)和上面创建的变量列表(y_var和x_var)中创建。

>>> bigy,bigX,bigyvars,bigXvars = pysal.model.spreg.sur_utils.sur_dictxy(db,y_var,x_var)

为了运行一个空间误差模型,我们需要指定空间权重矩阵。为此,我们可以打开一个已经存在的gal文件或创建一个新的gal文件。在这个例子中,我们将从nat.shp创建一个新的,并将其转换为标准化的行。

>>> w = pysal.queen_from_shapefile(pysal.examples.get_path("NAT.shp"))
>>> w.transform='r'

我们现在可以运行回归,然后通过键入:print(reg.summary)得到输出的摘要。

或者,我们可以检查参数的betas和标准误差、渐近t和p值:

>>> reg = SURerrorGM(bigy,bigX,w=w,name_bigy=bigyvars,name_bigX=bigXvars,name_ds="NAT",name_w="nat_queen")
>>> reg.bSUR
{0: array([[ 3.9774686 ],
       [ 0.8902122 ],
       [ 0.43050364]]), 1: array([[ 2.93679118],
       [ 1.11002827],
       [ 0.48761542]])}
>>> reg.sur_inf
{0: array([[  0.37251477,  10.67734473,   0.        ],
       [  0.14224297,   6.25839157,   0.        ],
       [  0.04322388,   9.95985619,   0.        ]]), 1: array([[  0.33694902,   8.71583239,   0.        ],
       [  0.13413626,   8.27537784,   0.        ],
       [  0.04033105,  12.09032295,   0.        ]])}
属性:
n : 各断面观测数
n_eq : 方程个数
bigy : 有因变量向量的字典,一个用于

每个方程

bigX : 解释变量矩阵字典,

每个方程一个

bigK : n_eq x 1带解释变量数的数组

按方程

bigylag : 空间滞后因变量
bigXlag : 空间滞后解释变量
lamsur : ml-sur误差中的空间自回归系数
bSUR : β系数(单位:ml-sur-error)
varb : ml-sur误差中β系数的方差
sig : ml-sur误差中的误差方差协方差矩阵
bigE : 每个方程的残差向量n×n_方程矩阵
sur_inf : 回归系数的推论。误差,t,p
surchow : 回归系数Chow检验的元组列表

每个元组包含测试值、自由度、p值

name_bigy : 每个方程的因变量名称字典
name_bigX : 字典,每个字典都有解释变量的名称

方程式

name_ds : 字符串;数据集的名称
name_w : 字符串;权重文件的名称
name_regimes : 字符串;输出中使用的状态变量的名称
__init__(bigy, bigX, w, regimes=None, nonspat_diag=True, spat_diag=False, vm=False, name_bigy=None, name_bigX=None, name_ds=None, name_w=None, name_regimes=None)[源代码]

初始化自身。请参阅帮助(键入(self))以获得准确的签名。

方法

__init__ \(bigy,bigx,w[,状态,…]) 初始化自身。