SlideShare uma empresa Scribd logo
2
Mais lidos
4
Mais lidos
5
Mais lidos
Tutorial de econometria espacial utilizando o STATA
Dr. Daniel de Abreu Uhr
Renan Porn Peres
Ricardo Capra Schuch
------------------------------------------------------------------------------------------------------------------
1. STATA: Análise espacial de dados
a) Instalação de pacotes ........................................................................................ 2
b) Baixando e utilizando o Shapefile ...................................................................... 3
i) No Stata ....................................................................................................... 3
ii) No Geoda ................................................................................................... 5
c) Gerando matriz de pesos .................................................................................... 6
i) SPATWMAT ................................................................................................... 6
ii) SPMAT .......................................................................................................... 7
iii) MATA …....................................................................................................... 7
d) Testando a dependência espacial ................................................................... 8
e) Regressão espacial .............................................................................................. 8
i) Especificação do modelo ......................................................................... 8
ii) Modelos de RegressãoEspacial ............................................................... 9
A) Modelos comdefasagens espaciais nos erros e na variável
dependente
B) Modelos comdefasagemespacial também nas variáveis
explicativas
C)Regressão Variável Instrumental
D) Regressões Espaciais utilizando a matriz gerada no SPATWMAT
f) Interpretando as saídas ....................................................................................... 11
-----------------------------------------------------------------------------------------------------------------
a)Instalar os pacotes necessários no STATA:
Definindo diretórios e processamento para lidarmos commatrizes espaciais
set more off
set matsize 1200
cd "C:UsersUserDesktopRS"
Para gerar um arquivo txt salvando o que foi feito
cap log using "spatialeconometrics", replace
Você deveinstalar alguns pacotes que irão ser uteis para rodar os comandos
de econometria espacial:
ssc install spmap
ssc install sppack
ssc install shp2dta
ssc install mif2dta
net install xsmle, all from(http://www.econometrics.it/stata)
findit sg162
Observação O pacote sg162 não esta disponível de modo isolado para o Brasil, por
isso usamos o comando findit para acha-lo e assim, baixar os pacotes que ele esta
contido.
Este comando atualiza os demais pacotes já existentes:
adoupdate
adoupdate, update
Baixando malhas geográficas
Para qualquer análise espacial é necessárioummapa da área de interesse,
assim precisamos baixar estes arquivos shp. de sites como ibge, ipea, etc. que
disponibilizam estes arquivospara download.
O IBGE oferece uma base de dados completa contendo shapefile de diversos
periodos emftp://geoftp.ibge.gov.br/malhas_digitais/
fftp://geoftp.ibge.gov.br/malhas_digitais/municipio_2005/escala_500mil/proj_policonica/arcview_shp/uf/rs/4
3mu500pc.zip
Outra opção é o IpeaGEO que já disponibiliza algumas malhas digitais que
podem ser baixadas pelo usuário.
Visualização dos arquivos
Só conseguimos visualizar arquivos .dbf com o programa Openofice
http://www.openoffice.org/download
i) No STATA:
Precisamos colocar o Shapefile (Arquivo.shp) para dentro do Stata (.dta):
shp2dta using “diretório do arquivo SHP”, database
(exemplo1.dta) coordinates (exemplo2.dta) genid (_ID)
Com isso, colocamos uma base de DTA comas informações do Shape para
dentro do sistema do STATA. Temos assim, dois arquivos DTA para esse Shape e
um identificador que será útil na plotagem dos mapas.
Pareando com seus dados:
Precisamos que o banco de dados esteja pareado com o banco gerado pelo
arquivo Shape. Para isso:
Nos interessa colocar 4 variáveis no banco exemplo1.dta gerado pelo arquivo
shape para o banco de variáveis (dbRS.dta). Estas são codigo id longitude e
latitude.
Assim salvamos estas 4 váriaveis emuma arquivo para juntarmos como o
banco de dados.
use "C:UsersUserDesktopRSbanco.dta"
merge m:m codigo using "C:UsersUserDesktopRScord.dta"
Result # of obs.
-----------------------------------------
matched 496 (_merge==3)
drop _merge
save “"C:UsersUserDesktopRSbase.dta"
clear all
Assim temos as mesmas variáveis que serão úteis para a criação das matrizes
de pesos e para geração de gráficos emambos os bancos: coordRS.dta e
base.dta
ii) Gerando a matriz de pesos espaciais através do GEODA:
Você deveter o arquivo shape de interessee o software Geoda para isso
Carregar Shapefile no Geoda-> Criar Pesos(Create Weights)->
Add Variable-> Código ou Nome da região-> Queen Contiguity
-> Create
Salve o a matriz de pesos (arquivo.gal) no diretóriode arquivos do STATA.
c) Criando Matriz de Pesos
Para fazermos inumeras análises espaciais, precisamos cria uma matriz de
pesos espaciais. Esta matriz especifica o grau da conexão entre uma unidade
espacial com outra. Especifica como unidades i e j se relacionam, um
exemplo: são vizinhos?
i) SPMAT é um dos comandos para a criação de matrizes contiguas. Para
criarmos matrizes por esse comando precisamos importar a shapefile e utilizar o
banco de coordenadas gerado por este processo, como já vimos antes. Veja
alguns exemplos:
spmat cont WC using "C:UsersUserDesktopRScoordRS.dta", id( _ID )
spmat import WG using "C:UsersUserDesktopRS43mu500gc.gal", geoda
O comando SPMAT pode ser utilizado para a criação de matrizes distâncias.
Veja:
spmat idistance WIr _X _Y, id( _ID ) normalize(row)
spmat idistance WId _X _Y, id( _ID ) dfunction(dhaversine)
Para excluir a matriz gerada usamos o seguinte comando:
spmat drop W
Exportar a matriz de pesos em dta:
spmat save W using "filename.dta"
Para visualizar a matriz de pesos devemos salva-la emtxt:
spmat export W using "filename.txt"
O código de ID na matriz correspondeao do Geoda.
Descrição da matriz:
spmat summarize WC
spmat sum WC, links detail
spmat graph WG
Para observarmos os autovalores
spmat eigenvalues WC
ii) SPATWMAT é um dos comandos mais utilizados para a criação de matrizes.
Utiliza as coordenadas do banco de dados para a criação da matriz e
conecta todas as unidades, no nosso caso os vizinhos, via distância. Veja:
spatwmat, name(W) xcoord(_X) ycoord(_Y) band(0 1) standardize
A matriz de pesos, W, é a inversa da distância da matriz padronizada, de
modo que a soma é 1. Os itens xcoord e ycoord especifica quais variáveis
contema localização em coordenadas das localizações.
No item band especificamos a distancia máxima, no nosso exemplo usamos 10
milhas. Vamos dar uma olhada nesta matriz:
mat list W
Podemos também usar a matriz gerada pelo software Geoda, para
isso devemos usar o comando
sort _ID
Com o objetivo de ordenar conforme a variável _ID do Geoda, que
está no banco de dados, pois a matriz gerada a partir do Geoda utiliza a linha
em que está o objeto analisado para identificação.
spatwmat using "C:UsersUserDesktopRSgeod.dta" ,name(Wg) standardize
iii) Para alterarmos uma Matriz: Temos que usar o MATA
Passando a Matriz da memória do spmat para a memória do MATA:
spmat getmatrix WC A
mata: A
link útil de operações no mata: http://www.stata.com/support/faqs/data-
management/element-by-element-operations-on-matrices/
d) Verificando a dependência espacial:
Alguns Gráficos para verificar se os dados estão concentrados
Carregando o banco de variáveis:
use base, clear
Agora, vamos descrever as variáveis de interesse
describe _ID furto_veic
i) Gerando um mapa de corrupção para o Rio Grande do Sul:
spmap furto_veic using coordRS, id(_ID) legend(symy(*2) symx(*2)
size(*2)) clnumber(5) fcolor(Greens) legstyle(2) title("Furto de
veiculos no Rio Grande do Sul", size(*0.8)) note("Pelotas, Rio
Grande do Sul 2014 neighorhood data")
O pacote spmap tem muitas opções, aproveitepara checar:
help spmap
ii) Diagnóstico Espacial
A) Teste do Índice de Moran
Verificar se as variáveis tem dependência espacial:
spatgsa furto_veic, w(Wg) moran
B) Teste do Índice Local de Dependência Espacial (LISA):
spatlsa furto_veic, w(W) moran id(_ID) sort
spatlsa furto_veic, weights(W) moran graph(moran) symbol(id) id(
Municipios )
spatlsa furto_veic, w(W) moran id(_ID) map(coordRS.dta)
xcoord(_Y) ycoord(_X) savegraph(spmap)
Podemos observar que o teste de Moran's I foi significativo, então há
dependência espacial.
C) Corrarelogramas emrelação à distância:
spatcorr furto_veic, bands(0(1)10) xcoord(_X) ycoord(_Y)
spatcorr furto_veic, bands(0(1)10) xcoord(_X) ycoord(_Y)
cumulative
spatcorr furto_veic, bands(0(1)10) xcoord(_X) ycoord(_Y) graph
e) Regressões Espaciais
i) Especificando o modelo
reg Y Xs, robust
Teste diagnóstico sobre os resultados da estimação OLS (dependência
espacial):
spatdiag, weights(W)
Este teste mostra que há um significante efeito espacial e seus resultados vão
nos auxiliar na escolha do modelo.
------------------------------------------------------------------------------------------------------------
reg furto_veic valor_adic_bruto carros_passag analfabetismo posse_entorp
fundo_mun_segpub deleg_polic_civil penitenciaria, robust
Linear regression Number of obs = 496
F( 7, 488) = 894.98
Prob > F = 0.0000
R-squared = 0.9489
Root MSE = 42.461
-----------------------------------------------------------------------------------
| Robust
furto_veic | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------------------+----------------------------------------------------------------
valor_adic_bruto | .000037 .0000237 1.56 0.119 -9.52e-06 .0000835
carros_passag | .0052716 .0012398 4.25 0.000 .0028355 .0077077
analfabetismo | .8713579 .3161347 2.76 0.006 .2502048 1.492511
posse_entorp | -.411659 .3012619 -1.37 0.172 -1.00359 .1802716
fundo_mun_segpub | -27.98689 14.73499 -1.90 0.058 -56.93875 .9649602
deleg_polic_civil | -15.99604 2.137453 -7.48 0.000 -20.19579 -11.79629
penitenciaria | -.026953 .0221671 -1.22 0.225 -.0705078 .0166019
_cons | -11.64398 2.65038 -4.39 0.000 -16.85155 -6.436417
-----------------------------------------------------------------------------------
spatdiag, weights(W)
Diagnostic tests for spatial dependence in OLS regression
Fitted model
------------------------------------------------------------
furto_veic = valor_adic_bruto + carros_passag + analfabetismo + posse_entorp +
fundo_mun_segpub + deleg_polic_civil + penitenciaria
------------------------------------------------------------
Weights matrix
------------------------------------------------------------
Name: W
Type: Distance-based (inverse distance)
Distance band: 0.0 < d <= 1.0
Row-standardized: Yes
------------------------------------------------------------
Diagnostics
------------------------------------------------------------
Test | Statistic df p-value
-------------------------------+----------------------------
Spatial error: |
Moran's I | 5.950 1 0.000
Lagrange multiplier | 29.974 1 0.000
Robust Lagrange multiplier | 21.559 1 0.000
|
Spatial lag: |
Lagrange multiplier | 12.441 1 0.000
Robust Lagrange multiplier | 4.025 1 0.045
------------------------------------------------------------
Ao observar estas saídas percebemos que tanto o erro esta correlacionado com o erro
dos vizinhos, bem como a variável dependente esta correlacionada com o furto de
veículos dos vizinhos, assim precisamos considerar ambas no modelo.
ii) Modelos de regressão espacial
A) Modelos com defasagens espaciais nos erros e na variável dependente
Efeito Global do Erro - ex: novo sistema de produção
Efeito Local do Erro - ex: poluição local
1) Regressão GMM SAR – Quando não tem erro espacial, emdois estágios.
O modelo é Y = dlWy + XB + u, o comando é dado por:
spreg gs2sls Y Xs, id(_ID) dlmat(W) het
2) Regressão ML SARAR - Quando não tem erro espacial
spreg ml Y Xs, id(_ID) dlmat(W)
3) Regressão GMM SEM – Quando não existe lag espacial poremhá erro
espacial autoregressivo.
O modelo é u = elWu + v, o comando é dado por:
spreg gs2sls Y Xs, id(_ID) elmat(WC) het
4) Regressão ML SEM - Quando não existe lag espacial poremhá erro espacial
autoregressivo.
spreg ml Y Xs, id(_ID) elmat(W)
Neste modelo, os erros associadoscomqualquer observalção são uma média
dos erros nas regiões vizinhasmais um componente de erro aleatório.
5) Regressão GMM SARAR (SAC)
Neste caso o modelo é dado por Y = dlWy + BX + u, u = elWu + v
spreg gs2sls Y Xs, id(_ID) dlmat(WC) elmat(WC) het
6) Regressão ML SARAR (SAC)
spreg ml Y Xs, id(_ID) dlmat(WC) elmat(WC)
Segundo o modelo um choque na região j afeta todas as outras regiões por
intermédio do multiplicador espacial do processo SAR da defasagem espacial,
amplificado pelo efeito multiplicador extra proporcionado pelo processo de
erro espacial.
Convémlembrar que a consequência de não incorporamos os componentes
Wy e Wu quando relevantes, gera estimativas viesadas e ineficientes em
amostras pequenas e inconsistentes emgrandes amostras.
B) Modelos com defasagem espacial também nas variáveis explicativas.
Para utilizarmos esses modelos precisamos gerar umlag espacial em uma
variável explicativa:
spmat lag double Wcar W carros_passag
1) Modelo Durbin GMM(SDM) – Não tem erro espacial
Neste caso o modelo é dado por Y = WY XB + WX + u
spreg gs2sls corrupção gini Wgini, id(_ID) dlmat(WC) het
2) Modelo Durbin ML(SDM) No spatial error
spreg ml corrupção gini Wgini, id(_ID) dlmat(WC)
3) Regressão Durbin do erro(SDEM)GMM – Semlag espacial na variável
dependente.
Neste caso o modelo é dado por Y = XB + WX + u, u = elW2u + v
spreg gs2sls corrupção gini Wgini, id(_ID) elmat(WC) het
4) Regressão Durbin do erro(SDEM)ML– Semlag espacial na variável
dependente.
spreg ml corrupção gini Wgini, id(_ID) elmat(WC)
5) Regressão GMM GSM
spreg gs2sls corrupção gini Wgini, id(_ID) dlmat(WC) elmat(WC)
het
6) Regressão ML GSM
spreg ml corrupção gini Wgini, id(_ID) dlmat(WC) elmat(WC)
---------------------------------------------------------------
spreg ml furto_veic valor_adic_bruto carros_passag Wcarros
analfabetismo Wanalfab posse_entorp fundo_mun_segpub Wfundsp
deleg_polic_civil Wpen penitenciaria, id(_ID) dlmat(WC) elmat(WC)
spreg ml furto_veic valor_adic_bruto carros_passag analfabetismo posse_entorp
fundo_mun_segpub deleg_polic_civil penitenciaria Wcarros Wanalfab Wfundsp
Wpen, id(_ID) dlmat(WC) elmat(WC)
------------------------------------------------------------------------------
C) Regressão Variável Instrumental
spivreg corrupção (gini = txdesemp), id(_ID) dlmat(WC) elmat(WC)
het
predict pol
D) Regressões Espaciais utilizando a matriz gerada no SPATWMAT
O comando spatreg é um pouco limitado, porem é bom saber
Modelo de Erro Espacial:
spatreg corrupção gini , weights(W) eigenval(E) model(error)
Modelo de Lag Espacial:
spatreg corrupção gini, weights(W) eigenval(E) model(lag)
f) Interpretando as saídas
cap log close

Mais conteúdo relacionado

PDF
Análise de Pontos em R
PDF
Autocorrelação espacial
PDF
Análise Espacial Baseada em Localização
PDF
Regressão Espacial
PDF
Prática de Regressão Espacial
PDF
Análise de dependência espacial em R
PDF
Autocorrelação espacial - Prática no GEODA
PDF
Análise Espacial de Eventos Pontuais
Análise de Pontos em R
Autocorrelação espacial
Análise Espacial Baseada em Localização
Regressão Espacial
Prática de Regressão Espacial
Análise de dependência espacial em R
Autocorrelação espacial - Prática no GEODA
Análise Espacial de Eventos Pontuais

Mais procurados (20)

PDF
Atividade de reforço 1° ano
PDF
Ciências 6º ano ar
PDF
Provas 9º ano
DOCX
PDF
Exercicios de estatistica resolvido.3
PDF
Atividade classificação dos carbonos na cadeia carbônica – 3º ano
PDF
7º ano ciências plantas
PDF
CNT - 3ª série - 3º bimestre - Professor.pdf
PDF
Cadeias principal
PDF
MATEMÁTICA - RAZÕES TRIGONOMÉTRICAS - AULA 1
DOCX
avaliação 9 ano química
DOC
Gabarito física
PDF
D17 (9º ano mat.) - identificar a localização de números racionais na reta...
PDF
Manual básico de uso de stata
DOC
Avaliação 1º ano 1º bimestre(física 1º c)
DOC
Exercícios extras_processos de eletrização e lei de coulomb
PDF
Resolução da lista 1 quadriláteros
DOC
Exercicios+de+notacao+cientifica[1] +com+gabarito
DOC
1 exercícios de potenciação
PDF
Exercícios substancias e misturas.pdf
Atividade de reforço 1° ano
Ciências 6º ano ar
Provas 9º ano
Exercicios de estatistica resolvido.3
Atividade classificação dos carbonos na cadeia carbônica – 3º ano
7º ano ciências plantas
CNT - 3ª série - 3º bimestre - Professor.pdf
Cadeias principal
MATEMÁTICA - RAZÕES TRIGONOMÉTRICAS - AULA 1
avaliação 9 ano química
Gabarito física
D17 (9º ano mat.) - identificar a localização de números racionais na reta...
Manual básico de uso de stata
Avaliação 1º ano 1º bimestre(física 1º c)
Exercícios extras_processos de eletrização e lei de coulomb
Resolução da lista 1 quadriláteros
Exercicios+de+notacao+cientifica[1] +com+gabarito
1 exercícios de potenciação
Exercícios substancias e misturas.pdf
Anúncio

Destaque (20)

PDF
Econometria endogeneidade
PDF
ODI Tutorial - Modelo de Dados
PDF
Aula 3 ppgdee.ppt
PDF
Análise exploratória e modelação com r parte 2
PDF
Primeira apr
PDF
Análise exploratória e modelação com r parte 3
PDF
Contabilidade para entidades sem fins lucrativos capítulo 6
PDF
Regressão Linear Múltipla
PDF
Apostila basica de_cartografia_arc_gis102
PDF
Recursos do Ambiente R para a Análise de Clusters
PDF
Prática de Regressão no SPSS
PDF
Informática Aplicada ao Planejamento Territorial - Apresentação
PDF
Series de tiempo integradas
PDF
Elaboração de Mapas no QGIS
DOC
Análise de correlação
PDF
Análise de Agrupamentos e Regionalização
PPT
Aula 1 parte_2
PPTX
Mapas temáticos - Aula 01
PDF
Series de Tiempo en R parte I (Series estacionarias)
PDF
Caderno de Exercícios – Estatística com solução
Econometria endogeneidade
ODI Tutorial - Modelo de Dados
Aula 3 ppgdee.ppt
Análise exploratória e modelação com r parte 2
Primeira apr
Análise exploratória e modelação com r parte 3
Contabilidade para entidades sem fins lucrativos capítulo 6
Regressão Linear Múltipla
Apostila basica de_cartografia_arc_gis102
Recursos do Ambiente R para a Análise de Clusters
Prática de Regressão no SPSS
Informática Aplicada ao Planejamento Territorial - Apresentação
Series de tiempo integradas
Elaboração de Mapas no QGIS
Análise de correlação
Análise de Agrupamentos e Regionalização
Aula 1 parte_2
Mapas temáticos - Aula 01
Series de Tiempo en R parte I (Series estacionarias)
Caderno de Exercícios – Estatística com solução
Anúncio

Semelhante a Tutorial de econometria espacial utilizando o stata (20)

PDF
Dados espaciais em R (2020)
PDF
Introdução à visualização espacial em R
PDF
Dados espaciais em R - 2023 - UFABC - Geoprocessamento
PDF
Introdução a Geoestatistica
PDF
Dados espaciais em R
PDF
Operações com dados espaciais (Vetor) em R
PDF
Capacitacao bdg macro_zee_ma
PDF
Atividade prática - Introdução ao QGis, parte 1
PDF
Análise exploratória estatístico-espacial, Mapas de Kernel e Proximidade - QG...
PDF
Análise Espacial baseada em Localização - Prática no QGis - 2024
PDF
Interpolação e Geoestatística em R
PDF
Interpolação e Geoestatística - QGis, Geoda e R
PDF
Atividade prática - Introdução ao QGis - parte 2
PDF
Arcgis 10 2_2_passo_a_passo_elaborando_mapeamento_volume_13
PDF
Arcgis 10.2.2 passo a passo elaborando meu primeiro mapeamento volume 1 (1)
PDF
Dados espaciais
PDF
Sql4 devs geodatabases
PDF
Diagnóstico ambiental - Mapeamento de fotos e de uso e ocupação do solo
PPT
C - Modelos regress espacial - dados de área.ppt
PDF
Dados espaciais em R (2020)
Introdução à visualização espacial em R
Dados espaciais em R - 2023 - UFABC - Geoprocessamento
Introdução a Geoestatistica
Dados espaciais em R
Operações com dados espaciais (Vetor) em R
Capacitacao bdg macro_zee_ma
Atividade prática - Introdução ao QGis, parte 1
Análise exploratória estatístico-espacial, Mapas de Kernel e Proximidade - QG...
Análise Espacial baseada em Localização - Prática no QGis - 2024
Interpolação e Geoestatística em R
Interpolação e Geoestatística - QGis, Geoda e R
Atividade prática - Introdução ao QGis - parte 2
Arcgis 10 2_2_passo_a_passo_elaborando_mapeamento_volume_13
Arcgis 10.2.2 passo a passo elaborando meu primeiro mapeamento volume 1 (1)
Dados espaciais
Sql4 devs geodatabases
Diagnóstico ambiental - Mapeamento de fotos e de uso e ocupação do solo
C - Modelos regress espacial - dados de área.ppt

Último (9)

PDF
Economia e Macroenomia, Economia Monetária
PPTX
Gestão da controladoriadeneg-190321185028.pptx
PDF
DOC-20250806-WA0031._20250806_135655_0000.pdf
PDF
EC II - AT02. MACROECONOMIA.Pdf important
PPTX
Estrutura de Capital das Empresas na Óptica Financeira
PDF
Aulas 1 e 2_ Economia de Recursos Energéticos.pdf
PPTX
IRPF2025Coletivadeimprensaimposto de renda 2.pptx
PPTX
AULA 5_JOGOS-PRÉ DESPORTIVOS_260822.pptx
PPTX
ESCRITURACAO CONTABIL em contabilidade basica
Economia e Macroenomia, Economia Monetária
Gestão da controladoriadeneg-190321185028.pptx
DOC-20250806-WA0031._20250806_135655_0000.pdf
EC II - AT02. MACROECONOMIA.Pdf important
Estrutura de Capital das Empresas na Óptica Financeira
Aulas 1 e 2_ Economia de Recursos Energéticos.pdf
IRPF2025Coletivadeimprensaimposto de renda 2.pptx
AULA 5_JOGOS-PRÉ DESPORTIVOS_260822.pptx
ESCRITURACAO CONTABIL em contabilidade basica

Tutorial de econometria espacial utilizando o stata

  • 1. Tutorial de econometria espacial utilizando o STATA Dr. Daniel de Abreu Uhr Renan Porn Peres Ricardo Capra Schuch ------------------------------------------------------------------------------------------------------------------ 1. STATA: Análise espacial de dados a) Instalação de pacotes ........................................................................................ 2 b) Baixando e utilizando o Shapefile ...................................................................... 3 i) No Stata ....................................................................................................... 3 ii) No Geoda ................................................................................................... 5 c) Gerando matriz de pesos .................................................................................... 6 i) SPATWMAT ................................................................................................... 6 ii) SPMAT .......................................................................................................... 7 iii) MATA …....................................................................................................... 7 d) Testando a dependência espacial ................................................................... 8 e) Regressão espacial .............................................................................................. 8 i) Especificação do modelo ......................................................................... 8 ii) Modelos de RegressãoEspacial ............................................................... 9 A) Modelos comdefasagens espaciais nos erros e na variável dependente B) Modelos comdefasagemespacial também nas variáveis explicativas C)Regressão Variável Instrumental D) Regressões Espaciais utilizando a matriz gerada no SPATWMAT f) Interpretando as saídas ....................................................................................... 11 -----------------------------------------------------------------------------------------------------------------
  • 2. a)Instalar os pacotes necessários no STATA: Definindo diretórios e processamento para lidarmos commatrizes espaciais set more off set matsize 1200 cd "C:UsersUserDesktopRS" Para gerar um arquivo txt salvando o que foi feito cap log using "spatialeconometrics", replace Você deveinstalar alguns pacotes que irão ser uteis para rodar os comandos de econometria espacial: ssc install spmap ssc install sppack ssc install shp2dta ssc install mif2dta net install xsmle, all from(http://www.econometrics.it/stata) findit sg162 Observação O pacote sg162 não esta disponível de modo isolado para o Brasil, por isso usamos o comando findit para acha-lo e assim, baixar os pacotes que ele esta contido. Este comando atualiza os demais pacotes já existentes: adoupdate adoupdate, update Baixando malhas geográficas Para qualquer análise espacial é necessárioummapa da área de interesse, assim precisamos baixar estes arquivos shp. de sites como ibge, ipea, etc. que disponibilizam estes arquivospara download. O IBGE oferece uma base de dados completa contendo shapefile de diversos periodos emftp://geoftp.ibge.gov.br/malhas_digitais/
  • 3. fftp://geoftp.ibge.gov.br/malhas_digitais/municipio_2005/escala_500mil/proj_policonica/arcview_shp/uf/rs/4 3mu500pc.zip Outra opção é o IpeaGEO que já disponibiliza algumas malhas digitais que podem ser baixadas pelo usuário. Visualização dos arquivos Só conseguimos visualizar arquivos .dbf com o programa Openofice http://www.openoffice.org/download i) No STATA: Precisamos colocar o Shapefile (Arquivo.shp) para dentro do Stata (.dta): shp2dta using “diretório do arquivo SHP”, database (exemplo1.dta) coordinates (exemplo2.dta) genid (_ID)
  • 4. Com isso, colocamos uma base de DTA comas informações do Shape para dentro do sistema do STATA. Temos assim, dois arquivos DTA para esse Shape e um identificador que será útil na plotagem dos mapas. Pareando com seus dados: Precisamos que o banco de dados esteja pareado com o banco gerado pelo arquivo Shape. Para isso: Nos interessa colocar 4 variáveis no banco exemplo1.dta gerado pelo arquivo shape para o banco de variáveis (dbRS.dta). Estas são codigo id longitude e latitude. Assim salvamos estas 4 váriaveis emuma arquivo para juntarmos como o banco de dados. use "C:UsersUserDesktopRSbanco.dta" merge m:m codigo using "C:UsersUserDesktopRScord.dta" Result # of obs. ----------------------------------------- matched 496 (_merge==3) drop _merge save “"C:UsersUserDesktopRSbase.dta" clear all Assim temos as mesmas variáveis que serão úteis para a criação das matrizes de pesos e para geração de gráficos emambos os bancos: coordRS.dta e base.dta
  • 5. ii) Gerando a matriz de pesos espaciais através do GEODA: Você deveter o arquivo shape de interessee o software Geoda para isso Carregar Shapefile no Geoda-> Criar Pesos(Create Weights)-> Add Variable-> Código ou Nome da região-> Queen Contiguity -> Create Salve o a matriz de pesos (arquivo.gal) no diretóriode arquivos do STATA. c) Criando Matriz de Pesos Para fazermos inumeras análises espaciais, precisamos cria uma matriz de pesos espaciais. Esta matriz especifica o grau da conexão entre uma unidade espacial com outra. Especifica como unidades i e j se relacionam, um exemplo: são vizinhos? i) SPMAT é um dos comandos para a criação de matrizes contiguas. Para criarmos matrizes por esse comando precisamos importar a shapefile e utilizar o banco de coordenadas gerado por este processo, como já vimos antes. Veja alguns exemplos: spmat cont WC using "C:UsersUserDesktopRScoordRS.dta", id( _ID ) spmat import WG using "C:UsersUserDesktopRS43mu500gc.gal", geoda O comando SPMAT pode ser utilizado para a criação de matrizes distâncias. Veja: spmat idistance WIr _X _Y, id( _ID ) normalize(row) spmat idistance WId _X _Y, id( _ID ) dfunction(dhaversine) Para excluir a matriz gerada usamos o seguinte comando: spmat drop W Exportar a matriz de pesos em dta: spmat save W using "filename.dta" Para visualizar a matriz de pesos devemos salva-la emtxt: spmat export W using "filename.txt" O código de ID na matriz correspondeao do Geoda. Descrição da matriz: spmat summarize WC
  • 6. spmat sum WC, links detail spmat graph WG Para observarmos os autovalores spmat eigenvalues WC ii) SPATWMAT é um dos comandos mais utilizados para a criação de matrizes. Utiliza as coordenadas do banco de dados para a criação da matriz e conecta todas as unidades, no nosso caso os vizinhos, via distância. Veja: spatwmat, name(W) xcoord(_X) ycoord(_Y) band(0 1) standardize A matriz de pesos, W, é a inversa da distância da matriz padronizada, de modo que a soma é 1. Os itens xcoord e ycoord especifica quais variáveis contema localização em coordenadas das localizações. No item band especificamos a distancia máxima, no nosso exemplo usamos 10 milhas. Vamos dar uma olhada nesta matriz: mat list W Podemos também usar a matriz gerada pelo software Geoda, para isso devemos usar o comando sort _ID Com o objetivo de ordenar conforme a variável _ID do Geoda, que está no banco de dados, pois a matriz gerada a partir do Geoda utiliza a linha em que está o objeto analisado para identificação. spatwmat using "C:UsersUserDesktopRSgeod.dta" ,name(Wg) standardize iii) Para alterarmos uma Matriz: Temos que usar o MATA Passando a Matriz da memória do spmat para a memória do MATA: spmat getmatrix WC A mata: A link útil de operações no mata: http://www.stata.com/support/faqs/data- management/element-by-element-operations-on-matrices/
  • 7. d) Verificando a dependência espacial: Alguns Gráficos para verificar se os dados estão concentrados Carregando o banco de variáveis: use base, clear Agora, vamos descrever as variáveis de interesse describe _ID furto_veic i) Gerando um mapa de corrupção para o Rio Grande do Sul: spmap furto_veic using coordRS, id(_ID) legend(symy(*2) symx(*2) size(*2)) clnumber(5) fcolor(Greens) legstyle(2) title("Furto de veiculos no Rio Grande do Sul", size(*0.8)) note("Pelotas, Rio Grande do Sul 2014 neighorhood data") O pacote spmap tem muitas opções, aproveitepara checar: help spmap ii) Diagnóstico Espacial A) Teste do Índice de Moran Verificar se as variáveis tem dependência espacial: spatgsa furto_veic, w(Wg) moran B) Teste do Índice Local de Dependência Espacial (LISA): spatlsa furto_veic, w(W) moran id(_ID) sort spatlsa furto_veic, weights(W) moran graph(moran) symbol(id) id( Municipios ) spatlsa furto_veic, w(W) moran id(_ID) map(coordRS.dta) xcoord(_Y) ycoord(_X) savegraph(spmap) Podemos observar que o teste de Moran's I foi significativo, então há dependência espacial.
  • 8. C) Corrarelogramas emrelação à distância: spatcorr furto_veic, bands(0(1)10) xcoord(_X) ycoord(_Y) spatcorr furto_veic, bands(0(1)10) xcoord(_X) ycoord(_Y) cumulative spatcorr furto_veic, bands(0(1)10) xcoord(_X) ycoord(_Y) graph e) Regressões Espaciais i) Especificando o modelo reg Y Xs, robust Teste diagnóstico sobre os resultados da estimação OLS (dependência espacial): spatdiag, weights(W) Este teste mostra que há um significante efeito espacial e seus resultados vão nos auxiliar na escolha do modelo. ------------------------------------------------------------------------------------------------------------ reg furto_veic valor_adic_bruto carros_passag analfabetismo posse_entorp fundo_mun_segpub deleg_polic_civil penitenciaria, robust Linear regression Number of obs = 496 F( 7, 488) = 894.98 Prob > F = 0.0000 R-squared = 0.9489 Root MSE = 42.461 ----------------------------------------------------------------------------------- | Robust furto_veic | Coef. Std. Err. t P>|t| [95% Conf. Interval] ------------------+---------------------------------------------------------------- valor_adic_bruto | .000037 .0000237 1.56 0.119 -9.52e-06 .0000835 carros_passag | .0052716 .0012398 4.25 0.000 .0028355 .0077077 analfabetismo | .8713579 .3161347 2.76 0.006 .2502048 1.492511 posse_entorp | -.411659 .3012619 -1.37 0.172 -1.00359 .1802716 fundo_mun_segpub | -27.98689 14.73499 -1.90 0.058 -56.93875 .9649602
  • 9. deleg_polic_civil | -15.99604 2.137453 -7.48 0.000 -20.19579 -11.79629 penitenciaria | -.026953 .0221671 -1.22 0.225 -.0705078 .0166019 _cons | -11.64398 2.65038 -4.39 0.000 -16.85155 -6.436417 ----------------------------------------------------------------------------------- spatdiag, weights(W) Diagnostic tests for spatial dependence in OLS regression Fitted model ------------------------------------------------------------ furto_veic = valor_adic_bruto + carros_passag + analfabetismo + posse_entorp + fundo_mun_segpub + deleg_polic_civil + penitenciaria ------------------------------------------------------------ Weights matrix ------------------------------------------------------------ Name: W Type: Distance-based (inverse distance) Distance band: 0.0 < d <= 1.0 Row-standardized: Yes ------------------------------------------------------------ Diagnostics ------------------------------------------------------------ Test | Statistic df p-value -------------------------------+---------------------------- Spatial error: | Moran's I | 5.950 1 0.000 Lagrange multiplier | 29.974 1 0.000 Robust Lagrange multiplier | 21.559 1 0.000 | Spatial lag: | Lagrange multiplier | 12.441 1 0.000 Robust Lagrange multiplier | 4.025 1 0.045 ------------------------------------------------------------ Ao observar estas saídas percebemos que tanto o erro esta correlacionado com o erro dos vizinhos, bem como a variável dependente esta correlacionada com o furto de veículos dos vizinhos, assim precisamos considerar ambas no modelo.
  • 10. ii) Modelos de regressão espacial A) Modelos com defasagens espaciais nos erros e na variável dependente Efeito Global do Erro - ex: novo sistema de produção Efeito Local do Erro - ex: poluição local 1) Regressão GMM SAR – Quando não tem erro espacial, emdois estágios. O modelo é Y = dlWy + XB + u, o comando é dado por: spreg gs2sls Y Xs, id(_ID) dlmat(W) het 2) Regressão ML SARAR - Quando não tem erro espacial spreg ml Y Xs, id(_ID) dlmat(W) 3) Regressão GMM SEM – Quando não existe lag espacial poremhá erro espacial autoregressivo. O modelo é u = elWu + v, o comando é dado por: spreg gs2sls Y Xs, id(_ID) elmat(WC) het 4) Regressão ML SEM - Quando não existe lag espacial poremhá erro espacial autoregressivo. spreg ml Y Xs, id(_ID) elmat(W) Neste modelo, os erros associadoscomqualquer observalção são uma média dos erros nas regiões vizinhasmais um componente de erro aleatório. 5) Regressão GMM SARAR (SAC) Neste caso o modelo é dado por Y = dlWy + BX + u, u = elWu + v spreg gs2sls Y Xs, id(_ID) dlmat(WC) elmat(WC) het 6) Regressão ML SARAR (SAC) spreg ml Y Xs, id(_ID) dlmat(WC) elmat(WC) Segundo o modelo um choque na região j afeta todas as outras regiões por intermédio do multiplicador espacial do processo SAR da defasagem espacial, amplificado pelo efeito multiplicador extra proporcionado pelo processo de erro espacial. Convémlembrar que a consequência de não incorporamos os componentes Wy e Wu quando relevantes, gera estimativas viesadas e ineficientes em amostras pequenas e inconsistentes emgrandes amostras.
  • 11. B) Modelos com defasagem espacial também nas variáveis explicativas. Para utilizarmos esses modelos precisamos gerar umlag espacial em uma variável explicativa: spmat lag double Wcar W carros_passag 1) Modelo Durbin GMM(SDM) – Não tem erro espacial Neste caso o modelo é dado por Y = WY XB + WX + u spreg gs2sls corrupção gini Wgini, id(_ID) dlmat(WC) het 2) Modelo Durbin ML(SDM) No spatial error spreg ml corrupção gini Wgini, id(_ID) dlmat(WC) 3) Regressão Durbin do erro(SDEM)GMM – Semlag espacial na variável dependente. Neste caso o modelo é dado por Y = XB + WX + u, u = elW2u + v spreg gs2sls corrupção gini Wgini, id(_ID) elmat(WC) het 4) Regressão Durbin do erro(SDEM)ML– Semlag espacial na variável dependente. spreg ml corrupção gini Wgini, id(_ID) elmat(WC) 5) Regressão GMM GSM spreg gs2sls corrupção gini Wgini, id(_ID) dlmat(WC) elmat(WC) het 6) Regressão ML GSM spreg ml corrupção gini Wgini, id(_ID) dlmat(WC) elmat(WC) --------------------------------------------------------------- spreg ml furto_veic valor_adic_bruto carros_passag Wcarros analfabetismo Wanalfab posse_entorp fundo_mun_segpub Wfundsp deleg_polic_civil Wpen penitenciaria, id(_ID) dlmat(WC) elmat(WC) spreg ml furto_veic valor_adic_bruto carros_passag analfabetismo posse_entorp fundo_mun_segpub deleg_polic_civil penitenciaria Wcarros Wanalfab Wfundsp Wpen, id(_ID) dlmat(WC) elmat(WC) ------------------------------------------------------------------------------
  • 12. C) Regressão Variável Instrumental spivreg corrupção (gini = txdesemp), id(_ID) dlmat(WC) elmat(WC) het predict pol D) Regressões Espaciais utilizando a matriz gerada no SPATWMAT O comando spatreg é um pouco limitado, porem é bom saber Modelo de Erro Espacial: spatreg corrupção gini , weights(W) eigenval(E) model(error) Modelo de Lag Espacial: spatreg corrupção gini, weights(W) eigenval(E) model(lag) f) Interpretando as saídas cap log close