pysal.model.spreg.SUR¶

class pysal.model.spreg.SUR(bigy, bigX, w=None, regimes=None, nonspat_diag=True, spat_diag=False, vm=False, iter=False, maxiter=5, epsilon=1e-05, verbose=False, name_bigy=None, name_bigX=None, name_ds=None, name_w=None, name_regimes=None)[源代码]¶

用于SUR估计的用户类，包括两步和迭代

参数:

参数:	bigy : 因式变量矢量字典 bigX : 用方程表示的解释变量矩阵字典（注，已包含常量项） w : 空间权重对象，默认值=无 regimes : 列表；默认值=无 n值列表，并将每个观测值映射到一个区域。假定与“x”对齐。 nonspat_diag : 布尔值；非空间诊断的标志，默认值为真 spat_diag : 布尔值；空间诊断标志，默认值为假 iter : 布尔值；是否使用迭代估计默认=假马克塞特 : 整数；最大迭代次数；默认值=5 ε : 浮点；结束迭代的精度标准默认值=0.00001 冗长的 : 布尔值；用于打印迭代次数和值的标志迭代开始和结束时的日志det（sig） name_bigy : 每个方程的因变量名称字典默认值为“无”，但应指定在使用sur-stackxy时完成。 name_bigX : 字典，每个字典都有解释变量的名称公式默认值=无，但当使用sur-stackxy时应指定。 name_ds : 字符串；数据集的名称 name_w : 字符串；权重文件的名称 name_regimes : 字符串；输出中使用的状态变量的名称

bigy : 因式变量矢量字典
bigX : 用方程表示的解释变量矩阵字典: （注，已包含常量项）
w : 空间权重对象，默认值=无
regimes : 列表；默认值=无: n值列表，并将每个观测值映射到一个区域。假定与“x”对齐。
nonspat_diag : 布尔值；非空间诊断的标志，默认值为真
spat_diag : 布尔值；空间诊断标志，默认值为假
iter : 布尔值；是否使用迭代估计: 默认=假
马克塞特 : 整数；最大迭代次数；默认值=5
ε : 浮点；结束迭代的精度标准: 默认值=0.00001
冗长的 : 布尔值；用于打印迭代次数和值的标志: 迭代开始和结束时的日志det（sig）
name_bigy : 每个方程的因变量名称字典: 默认值为“无”，但应指定在使用sur-stackxy时完成。
name_bigX : 字典，每个字典都有解释变量的名称: 公式默认值=无，但当使用sur-stackxy时应指定。
name_ds : 字符串；数据集的名称
name_w : 字符串；权重文件的名称
name_regimes : 字符串；输出中使用的状态变量的名称

实例

首先导入pysal.lib以加载空间分析工具。

>>> import pysal.lib

使用pysal.lib.io.open（）打开有关NCOVR美国县凶杀案（3085个地区）的数据。这是与nat形状文件关联的dbf。注意pysal.lib.io.open（）也可以读取csv格式的数据。

>>> db = pysal.lib.io.open(pysal.lib.examples.get_path("NAT.dbf"),'r')

待估算模型的规格可作为列表提供。每个方程应单独列出。在这个例子中，方程式1的因变量是hr80，而ps80和ue80是外生回归量。对于方程2，hr90是因变量，ps90和ue90是外生回归量。

>>> y_var = ['HR80','HR90']
>>> x_var = [['PS80','UE80'],['PS90','UE90']]

虽然此方法不需要，但我们可以加载一个权重矩阵文件，以便进行空间诊断。

>>> w = pysal.lib.weights.Queen.from_shapefile(pysal.lib.examples.get_path("NAT.shp"))
>>> w.transform='r'

SUR方法要求将数据作为字典提供。Pysal提供了工具sur_dictxy，从变量列表中创建这些字典。下面的一行将创建四个字典，分别包含因变量（bigy）、回归量（bigx）、因变量名（bigyvars）和回归量名（bigxvars）。所有这些都将从数据库（db）和上面创建的变量列表（y_var和x_var）中创建。

>>> bigy,bigX,bigyvars,bigXvars = pysal.model.spreg.sur_utils.sur_dictxy(db,y_var,x_var)

现在我们可以运行回归，然后通过键入“print（reg.summary）”来获得输出摘要。

>>> reg = SUR(bigy,bigX,w=w,name_bigy=bigyvars,name_bigX=bigXvars,spat_diag=True,name_ds="nat")
>>> print(reg.summary)
REGRESSION
----------
SUMMARY OF OUTPUT: SEEMINGLY UNRELATED REGRESSIONS (SUR)
--------------------------------------------------------
Data set            :         nat
Weights matrix      :     unknown
Number of Equations :           2                Number of Observations:        3085
Log likelihood (SUR):  -19902.966                Number of Iterations  :           1
----------
<BLANKLINE>
SUMMARY OF EQUATION 1
---------------------
Dependent Variable  :        HR80                Number of Variables   :           3
Mean dependent var  :      6.9276                Degrees of Freedom    :        3082
S.D. dependent var  :      6.8251
<BLANKLINE>
------------------------------------------------------------------------------------
            Variable     Coefficient       Std.Error     z-Statistic     Probability
------------------------------------------------------------------------------------
          Constant_1       5.1390718       0.2624673      19.5798587       0.0000000
                PS80       0.6776481       0.1219578       5.5564132       0.0000000
                UE80       0.2637240       0.0343184       7.6846277       0.0000000
------------------------------------------------------------------------------------
<BLANKLINE>
SUMMARY OF EQUATION 2
---------------------
Dependent Variable  :        HR90                Number of Variables   :           3
Mean dependent var  :      6.1829                Degrees of Freedom    :        3082
S.D. dependent var  :      6.6403
<BLANKLINE>
------------------------------------------------------------------------------------
            Variable     Coefficient       Std.Error     z-Statistic     Probability
------------------------------------------------------------------------------------
          Constant_2       3.6139403       0.2534996      14.2561949       0.0000000
                PS90       1.0260715       0.1121662       9.1477755       0.0000000
                UE90       0.3865499       0.0341996      11.3027760       0.0000000
------------------------------------------------------------------------------------
<BLANKLINE>
<BLANKLINE>
REGRESSION DIAGNOSTICS
                                     TEST         DF       VALUE           PROB
                         LM test on Sigma         1      680.168           0.0000
                         LR test on Sigma         1      768.385           0.0000
<BLANKLINE>
OTHER DIAGNOSTICS - CHOW TEST BETWEEN EQUATIONS
                                VARIABLES         DF       VALUE           PROB
                   Constant_1, Constant_2         1       26.729           0.0000
                               PS80, PS90         1        8.241           0.0041
                               UE80, UE90         1        9.384           0.0022
<BLANKLINE>
DIAGNOSTICS FOR SPATIAL DEPENDENCE
TEST                              DF       VALUE           PROB
Lagrange Multiplier (error)       2        1333.586        0.0000
Lagrange Multiplier (lag)         2        1275.821        0.0000
<BLANKLINE>
ERROR CORRELATION MATRIX
  EQUATION 1  EQUATION 2
    1.000000    0.469548
    0.469548    1.000000
================================ END OF REPORT =====================================

属性:

属性:	bigy : Y值字典 bigX : 带x值的字典 bigXX : 带x-t'x-r交叉产品的字典 bigXy : 带x'u t'y'u r交叉产品的字典 n_eq : 方程个数 n : 各断面观测数 bigK : 具有解释变量数量的向量（包括常量）对于每个方程 bOLS : 每个方程的OLS回归系数字典 olsE : n x n_eq数组，每个方程有ols残差 bSUR : 每个方程的SUR回归系数字典 varb : 方差协方差矩阵 sig : 方程间误差协方差的西格玛矩阵 ldetS1 : SUR模型的对数det（sigma） bigE : n x n_eq残差数组 sig_ols : OLS残差的西格玛矩阵（对角线） ldetS0 : 零模型的对数det（sigma）（OLS按公式） niter : 迭代次数（=0，对于iter=false） corr : 方程间误差相关矩阵 llik : 对数似然（包括常数pi） sur_inf : 标准误差渐近t和p值字典，每个方程一个 lrtest : 西格玛非对角元素的似然比检验（带测试、df、p值的元组） lmtest : 西格玛非对角元素的拉格朗日乘数检验（带测试、df、p值的元组） lmEtest : SUR误差空间自相关的拉格朗日乘子检验（带测试、df、p值的元组） lmlagtest : SUR空间滞后自相关的拉格朗日乘子检验（带测试、df、p值的元组） surchow : 回归系数Chow检验的元组列表每个元组包含测试值、自由度、p值 name_bigy : 每个方程的因变量名称字典 name_bigX : 字典，每个字典都有解释变量的名称方程式 name_ds : 字符串；数据集的名称 name_w : 字符串；权重文件的名称 name_regimes : 字符串；输出中使用的状态变量的名称

bigy : Y值字典
bigX : 带x值的字典
bigXX : 带x-t'x-r交叉产品的字典
bigXy : 带x'u t'y'u r交叉产品的字典
n_eq : 方程个数
n : 各断面观测数
bigK : 具有解释变量数量的向量（包括常量）: 对于每个方程
bOLS : 每个方程的OLS回归系数字典
olsE : n x n_eq数组，每个方程有ols残差
bSUR : 每个方程的SUR回归系数字典
varb : 方差协方差矩阵
sig : 方程间误差协方差的西格玛矩阵
ldetS1 : SUR模型的对数det（sigma）
bigE : n x n_eq残差数组
sig_ols : OLS残差的西格玛矩阵（对角线）
ldetS0 : 零模型的对数det（sigma）（OLS按公式）
niter : 迭代次数（=0，对于iter=false）
corr : 方程间误差相关矩阵
llik : 对数似然（包括常数pi）
sur_inf : 标准误差渐近t和p值字典，: 每个方程一个
lrtest : 西格玛非对角元素的似然比检验: （带测试、df、p值的元组）
lmtest : 西格玛非对角元素的拉格朗日乘数检验: （带测试、df、p值的元组）
lmEtest : SUR误差空间自相关的拉格朗日乘子检验: （带测试、df、p值的元组）
lmlagtest : SUR空间滞后自相关的拉格朗日乘子检验: （带测试、df、p值的元组）
surchow : 回归系数Chow检验的元组列表: 每个元组包含测试值、自由度、p值
name_bigy : 每个方程的因变量名称字典
name_bigX : 字典，每个字典都有解释变量的名称: 方程式
name_ds : 字符串；数据集的名称
name_w : 字符串；权重文件的名称
name_regimes : 字符串；输出中使用的状态变量的名称

__init__(bigy, bigX, w=None, regimes=None, nonspat_diag=True, spat_diag=False, vm=False, iter=False, maxiter=5, epsilon=1e-05, verbose=False, name_bigy=None, name_bigX=None, name_ds=None, name_w=None, name_regimes=None)[源代码]¶: 初始化自身。请参阅帮助（键入（self））以获得准确的签名。

方法

__init__ \（bigy，bigx[，w，状态，…]）初始化自身。