SlideShare uma empresa Scribd logo
Curso de Análise Estatística
Nova Abordagem
Prof. Dr. Clóvis de Araújo Peres
cperes@medprev.epm.br
FILOSOFIA DO CURSO
• É um curso de estatística que não exige conhecimento prévio e os
conceitos são introduzidos através de exemplificação prática, dando
ênfase na intuição e não na argumentação matemática.
• O curso é dividido em duas partes:
• Na primeira parte serão discutidos conceitos fundamentais de
estatística descritiva e inferencial, que permitem ao aluno entender
a essência do pensamento estatístico.
• Na segunda parte iremos realizar a análise estatística completa de
projetos de pesquisa desde o planejamento até a conclusão. Os
projetos são escolhidos de forma a contemplar o ensino de
diferentes técnicas de análise estatística.
• É importante que o aluno participe de todas as etapas de discussões
com perguntas relacionadas com a sua área de atuação.
• O material didático distribuído é apenas um guia do roteiro do curso.
Perguntas que serão respondidas neste
curso
I - O que é Estatística?
II -De que forma a Estatística interage com a pesquisa científica ou
observacional (analítica ou descritiva)?
III - Com que tipo de informação (dados) a Estatística trabalha?
IV - Quais são as diferentes formas de obtenção de dados ?
V - Que conceitos são fundamentais para se entender o conjunto de
dados gerados por uma pesquisa por amostragem ou simples
levantamento de dados?
VI - Que conceitos são fundamentais para se analisar
estatisticamente dados gerados por levantamentos amostrais?
Programa do Curso
Parte 1: Definições e conceitos básicos.
I - Definição de Estatística;
II - Interação entre a estatística e o método científico;
III - Tipos de variáveis geradoras de dados;
IV - Planejamento da pesquisa : diferentes formas de obtenção de dados;
V - Descrição de um conjunto de dados obtidos por levantamentos
populacionais, amostrais ou experimentos controlados através de:
medidas-resumo, tabelas e gráficos apropriados para cada situação;
VI - Conceitos essenciais para se entender a análise estatística inferencial:
erro amostral e intervalo de confiança.
Parte 2: Aplicações dos conceitos apresentados na primeira
parte em problemas práticos de interesse dos alunos.
I – DEFINIÇÃO DE ESTATÍSTICA
É um campo de estudos que produz metodologia para:
 Decidir qual é o melhor Plano para a realização de uma Pesquisa
científica ou observacional (analítica ou descritiva);
Organizar e Sumarizar dados obtidos por classificação, contagem ou
mensuração, ou transformações destes, e
 Fazer inferências sobre populações de unidades (indivíduos, objetos,
animais) quando apenas uma parte (amostra) é estudada
(classificada, contada ou medida).
Sub-áreas da Estatística:
(1) Planejamento de experimentos e técnicas de amostragem;
(2) Estatística Descritiva;
(3) Estatística Inferencial.
II- Interação entre a estatística e a pesquisa científica
Análise Estatística
Descritiva
Análise Inferencial
Conclusões
Formulação de novos
objetivos
Objetivos da
pesquisa
Planejamento de uma pesquisa
que será realizada por
levantamentos populacionais ou
por amostragem
Observações
Dados
III - TIPOS DE VARIÁVEIS GERADORAS DE DADOS
Categóricas Numéricas
Nominal
(classificação)
Ordinal
(classificação)
Discreta
(contagem)
Contínua
(mensuração)
sexo, raça,
região, grupo
sangüíneo
pressão
sangüínea
(baixa,
normal, alta)
Número de
acidentes,
número de
filhos
Peso, altura,
pressão
sangüínea
III - TIPOS DE VARIÁVEIS GERADORAS DE DADOS
Idade Sexo Hemoglobina Tipo de urticária Duração
34 masc 14,2 física curta
58 masc 14,4 física longa
31 fem 15,1 idiopática média
49 masc 10,9 idiopática média
39 fem 14,4 física longa
33 masc 14,1 física curta
35 fem 14,0 idiopática longa
IV – Planejamento da Pesquisa
4.1 – Pesquisa por levantamentos populacionais
• Contínuos – quando os eventos vão sendo registrados à
medida que ocorrem .
Ex : registros de óbitos, nascimentos, casamentos
• Periódicos – são aqueles que acontecem ciclicamente.
Ex: censos populacionais que ocorrem a cada 10 anos.
• Ocasionais – são aqueles realizados sem preocupação de
continuidade ou periodicidade pré estabelecidas.
Obs: A análise estatística recomendada consiste na construção
de tabelas e gráficos acompanhadas de comentários. Análise
descritiva ou exploratória dos dados.
.2 – Pesquisa por amostras : técnicas de amostragem e planejamento de experime
Objetivos
da pesquisa
Comparações de diferentes
grupos
Caracterização de populações
segundo fatores de interesse
• Comparação entre diferentes
tratamentos para insuficiência
respiratória
Estudo de bioequivalência entre drogas
• Condições de vida das famílias da
região metropolitana de São Paulo
• Grau de satisfação dos usuários
da SABESP quanto ao
fornecimento de água
Tipos de
Planejamento
Esquemas de
Amostragem
Tipos de Planejamento
• Completamente Aleatorizado (amostras não pareadas);
• Blocos Completos Aleatorizados (amostras pareadas);
• “Cross-Over”.
Esquemas de Amostragem
• Amostra Casual Simples;
• Amostra Estratificada;
• Amostra em Estágios Múltiplos.
IV – Planejamento da Pesquisa
4.3 - Estudos Epidemiológicos : Descritivos e Analíticos
Descritivos
• Não têm hipóteses definidas;
• Fornecem informações sobre o padrão de ocorrência de
doenças de acordo com características populacionais.
Analíticos
• Têm hipóteses definidas e permitem testá-las:
• Coortes;
• Caso controle;
• Transversal.
IV – Planejamento da Pesquisa
IV – Planejamento da Pesquisa
Estudos Epidemiológicos Analíticos
São, em geral, necessários quando informações
preliminarmente coletadas indicam que um estudo
epidemiológico mais detalhado deve ser conduzido para
testar uma hipótese particular.
• COORTES
Em estudos de coorte prospectivo todos os indivíduos
incluídos são não doentes e divididos em 2 grupos,
expostos e não expostos. O coorte é seguido por um
período de tempo e taxas de incidência da doença são
comparadas entre expostos e não expostos.
Este estudo também pode ser conduzido
retrospectivamente selecionando dois grupos de indivíduos
expostos e não expostos comparando-se taxas de
incidência da doença em um período de tempo passado.
Estudos Epidemiológicos Analíticos
• CASO-CONTROLE
Em estudos de caso-controle um grupo de doentes (casos)
e um grupo de não doentes (controles) são selecionados. A
proporção de indivíduos que foram expostos por um
período de tempo é calculada nos grupos e comparadas.
• TRANSVERSAL
Em estudos transversais ou de prevalência, exposição a
fatores de risco e de ocorrência da doença são avaliados
simultaneamente num ponto no tempo em um grupo de
indivíduos. Taxas de prevalência da doença são
comparadas entre expostos e não expostos.
IV – Planejamento da Pesquisa
Regressão logística para estimar taxas de
prevalência de doença entre expostos e
não expostos, assim como as razões
dessas taxas.
Transversal
Regressão logística para estimar “odds
ratio”.
Riscos de ocorrência da doença somente são
possíveis a partir de algumas informações
populacionais.
Caso-controle
Regressão logística para estimar riscos de
ocorrência da doença, riscos relativos ,
“odds ratio”.
Coorte
Modelos de Análise Estatística
Tipos de Estudos
IV – Planejamento da Pesquisa
Estudos Epidemiológicos Analíticos
Exemplo 1:Ensaio Clínico Completamente Aleatorizado
Teste do efeito do Metoprolol em pacientes de 65 a 74
anos que tiveram Infarto Agudo do Miocárdio.
Comentários:
1. Os pacientes foram alocados a cada um dos grupos, placebo e
metoprolol, completamente aleatorizado;
2. Foram seguidos por 3 meses e registrado o estado vital;
3. Estudo prospectivo;
4. Amostras não-pareadas.
Exemplo 2: Estudo de Caso-Controle
Relação da Presença de Câncer entre mães e filhas
Comentários:
1. Estudo Retrospectivo;
2. Duas amostras independentes de filhas, com presença e
ausência de Câncer;
3. Amostras não-pareadas;
4. Estudo da relação entre duas variáveis categóricas binárias.
Exemplo 3: Estudo sobre Diabetes Gestacional
Comparação de 3 grupos de gestantes - normais (N), tolerância
diminuída (TD) e diabéticas (D) em relação a hemoglobina
glicosilada (HbA).
Comentários:
1. Estudo completamente
aleatorizado (amostra casual
simples em cada estrato);
2. Amostras não-pareadas;
3. Estudo da relação entre uma
variável numérica e uma
categórica.
Exemplo 4 : Estudo sobre perda de peso (kg) em
pessoas obesas, segundo Dieta e Terapia
Comentários:
1. Estudo completamente
aleatorizado;
2. Oito amostras não pareadas
de tamanho 5;
3. Estudo da relação entre
duas variáveis categóricas
e uma numérica.
Exemplo 5: Estudo sobre Pielonefrite
Comentários:
1. Amostras pareadas;
2. Estudo da relação entre duas variáveis categóricas.
Exemplo 6: Experimento "Cross-Over"
Comentários:
1) Cada indivíduo é submetido às 2 drogas em períodos diferentes;
2) Este experimento permite verificar:
• concordância de respostas;
• comparação das drogas em termos de positividade da resposta – Qui-
quadrado de Mc Nemar.
Tabela comumente apresentada de forma inadequada.
Comparação de duas drogas
V – Análise exploratória de dados
Os conceitos serão apresentados de acordo com o seguinte esquema:
a) Variável numérica
1) medidas de variabilidade e de posição;
2) representação gráfica: distribuição de freqüência e Boxplot;
3) ajuste de uma curva de freqüência com distribuição normal.
b) Variável categórica
1) medidas de variabilidade e de posição;
2) representação gráfica: gráfico de barras e pizza.
• Variável numérica :
Exemplo 1: Duas amostras de 20 indivíduos
1) medidas de variabilidade e de posição
Amostra 1:
Estatura mínima: 140 cm
Estatura máxima: 180 cm
Amostra 2:
Estatura mínima: 150 cm
Estatura máxima: 170 cm
Questão 2:
Quanto a variabilidade individual de uma amostra é maior do que a outra?
Resposta:
Resposta:
Questão 1:
Em qual das duas amostras os indivíduos variam mais em relação à estatura?
Resposta:
Resposta:
CONCEITOS:
CONCEITOS:
• Variável numérica :
Exemplo 2: Duas amostras de 6 indivíduos
(os valores abaixo representam a estatura, em cm)
1) medidas de variabilidade e de posição
Amostra 1: 150, 151, 153, 155, 158, 160
Amostra 2: 150, 155, 155, 155, 155, 160
Questão 1: Em qual das duas amostras os indivíduos variam mais
em relação à estatura?
Resposta:
Resposta:
Questão 2: Quanto a variabilidade de uma amostra é maior que a
da outra?
Resposta:
Resposta:
CONCEITOS:
CONCEITOS:
• Variável numérica :
2) Representação gráfica
a) Histograma (distribuição de freqüência empírica)
• Variável numérica :
b) Boxplot : (forma de agrupar dados através dos percentis)
Exemplo : Estudo sobre Diabetes Gestacional - Comparação de 3 grupos de
gestantes, normais, tolerância diminuídas e diabéticas em relação a hemoglobina
glicosilada (HbA).
Boxplot do nível de Hemoglobina
glicosilada, segundo grupo de gestantes.
Tol_Diminuída
Normal
Diabética
HbA
11
10
9
8
7
6
5
• Variável numérica :
3) Noções sobre DISTRIBUIÇÃO NORMAL
PROPRIEDADES DA DISTRIBUIÇÃO NORMAL
 68% dos valores individuais estão entre  -  e  + 
 80% dos valores individuais estão entre  - 1,28 e  + 1,28
 90% dos valores individuais estão entre  - 1,64 e  + 1,64
 95% dos valores individuais estão entre  - 1,96 e  + 1,96
 98% dos valores individuais estão entre  - 2,33 e  + 2,33
 99% dos valores individuais estão entre  - 2,58 e  + 2,58
 99,7% dos valores individuais estão entre  - 3 e  + 3
• Variável numérica :
 4) Curva normal ajustada à distribuição de freqüência empírica
• Variável categórica :
1) medidas de variabilidade e de posição
Exemplo:
Duas amostras de 20 indivíduos onde cada um é classificado em relação ao sexo.
Questão 1:
Em qual das duas amostras os indivíduos variam mais em relação ao
sexo?
Resposta:
Resposta:
CONCEITOS:
CONCEITOS:
• Variável categórica:
2) Representação gráfica: gráfico de barras e pizza
Distribuição de Chefes de
Famílias segundo gênero
0
20
40
60
80
100
masculino feminino
Fonte : PED-Dez/1999
Percentual
VI - Conceitos essenciais para se entender a análise
estatística inferencial: erro amostral e intervalo de
confiança.
Essência da Estatística Inferencial
Considere uma população de indivíduos representada por uma
variável numérica (Albumina Sérica).
VI - Conceitos essenciais para se entender a análise
estatística inferencial: erro amostral e intervalo de
confiança.
Questão de interesse
Queremos estimar por meio de uma amostra de
tamanho n a média populacional µ.
VI - Considerações sobre a solução
a) Tipo de Amostra: Amostra probabilística;
b) Para qualquer tamanho de amostra n a média da
amostra é “sempre” diferente da média µ da população;
c) A distância entre a média da amostra e a média da
população é chamada de Erro Amostral (EA).
VI - Considerações sobre a solução
d) Fatos Intuitivos
d) Fatos Intuitivos
• Para uma determinada população com uma determinada variância,
quanto maior for o tamanho da amostra menor será o EA
• Para um determinado tamanho de amostra quanto mais espalhada
for a população em torno da média (variância), maior será o EA
• Portanto podemos escrever que o erro amostral (EA) é
proporcional ao quociente
ais
proporcion
te
inversamen
n
EA 


ais
proporcion
e
diretament
Var
EA 


Ou
VI - Considerações sobre a solução - ESTIMAÇÃO
ESTIMAÇÃO
Parte 2: Aplicações dos conceitos apresentados na primeira
parte em problemas práticos de interesse dos alunos.
Nesta parte, cada projeto de pesquisa (problema) será
analisado estatisticamente seguindo as etapas:
a) Formulação do objetivo;
b) Descrição do experimento;
c) Protocolo experimental;
d) Análise descritiva;
e) Análise inferencial;
f) Conclusão.
Estudo sobre a influência do Índice de Massa Corpórea, Idade
e Hábito de Fumar na Pressão Sistólica (análise estatística da
relação entre uma variável resposta numérica e várias variáveis
explicativas numéricas).
A - OBJETIVO
Estimar um modelo matemático (função) que relaciona a
pressão sistólica com o índice de massa corpórea (IMC), idade e
hábito de fumar.
B - DESCRIÇÃO DO EXPERIMENTO
Para atingir o objetivo foi selecionada uma amostra de 32
indivíduos do sexo masculino com idade acima de 40 anos que
foram avaliados com relação à Pressão Sistólica (mm de Hg), IMC
calculado como , Idade (anos) e Hábito de Fumar (Sim e Não).
Referência: Applied Regression Analysis
Kleinbaum / Kupper
PROBLEMA 10
C - PROTOCOLO EXPERIMENTAL
Para cada um dos indivíduos foi anotado a pressão sistólica
(PS), IMC, idade e hábito de fumar, esses dados encontram-se na
planilha abaixo.
PLANILHA UTILIZADA:
I
n
d
i
v
í
d
u
o P
S I
M
C I
d
a
d
e F
u
m
a
1 1
3
5 2
0
.
2 4
5 N
Ã
O
2 1
2
2 2
2
.
9 4
1 N
Ã
O
3 1
3
0 2
1
.
8 4
9 N
Ã
O
4 1
4
8 2
6
.
5 5
2 N
Ã
O
5 1
4
6 2
0
.
9 5
4 S
I
M
6 1
2
9 1
9
.
6 4
7 S
I
M
9 1
4
4 1
6
.
6 4
4 S
I
M
1
0 1
8
0 3
2
.
6 6
4 S
I
M
    
2
7 1
2
0 1
9
.
6 4
3 N
Ã
O
2
8 1
2
6 2
0
.
8 4
3 S
I
M
2
9 1
6
1 2
6
.
7 6
3 N
Ã
O
3
0 1
7
0 2
9
.
1 6
3 S
I
M
3
1 1
5
2 2
7
.
9 6
2 N
Ã
O
3
2 1
6
4 2
8
.
2 6
5 N
Ã
O
PROBLEMA 10
D - ANÁLISE DESCRITIVA
0
20
40
60
80
100
120
140
160
180
200
0.0 5.0 10.0 15.0 20.0 25.0 30.0 35.0
IMC (Kg/cm2)
Pressão
Sistólica
(mm
de
Hg)
Gráfico 1: IMC  Pressão Sistólica
PROBLEMA 10
Gráficos de Dispersão
Gráfico 2: Idade  Pressão Sistólica
0
20
40
60
80
100
120
140
160
180
200
0 20 40 60 80
Idade (anos)
Pressão
Sistólica
(mm
de
Hg)
PROBLEMA 10
D - ANÁLISE DESCRITIVA
Gráfico 3: “Boxplot” da Pressão Sistólica segundo
hábito de fumar
Hábito de Fumar
Sim (n = 17)
Não (n = 15)
Pressão
Sistólica
(mm
de
Hg)
190
180
170
160
150
140
130
120
110
PROBLEMA 10
Gráfico Boxplot
D - ANÁLISE DESCRITIVA
Saída do STATA
 Stata: regress ps imc idade fuma
. regress ps imc2 idade fuma
Source | SS df MS Number of obs = 32
-------------+------------------------------ F( 3, 28) = 29.71
Model | 4889.82577 3 1629.94192 Prob > F = 0.0000
Residual | 1536.14298 28 54.8622494 R-squared = 0.7609
-------------+------------------------------ Adj R-squared = 0.7353
Total | 6425.96875 31 207.289315 Root MSE = 7.4069
------------------------------------------------------------------------------
ps | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
imc | 1.222134 .6398629 1.91 0.066 -.088566 2.532834
idade | 1.212715 .3238192 3.75 0.001 .5494009 1.876028
fuma | 9.945568 2.656056 3.74 0.001 4.504883 15.38625
_cons | 45.10319 10.76487 4.19 0.000 23.05235 67.15404
------------------------------------------------------------------------------
A Equação da reta de Mínimos Quadrados é :
Fuma
95
9
Idade
21
1
IMC
1.22
5.10
4
PS 





 .
.
PROBLEMA 10

Mais conteúdo relacionado

PPTX
USJT-2022-ANDADOS-teor01-analise_exploratoria.pptx
PDF
estatistica aula 1.pdf
PPTX
estatistica aula. grafico de pesquesisa alimentar
PPT
Aula de Gráficos - Bioestatistica
PPT
bioestatística - 1 parte
PPT
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
PPT
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
PDF
Introdução à estatística 01 alunos
USJT-2022-ANDADOS-teor01-analise_exploratoria.pptx
estatistica aula 1.pdf
estatistica aula. grafico de pesquesisa alimentar
Aula de Gráficos - Bioestatistica
bioestatística - 1 parte
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Introdução à estatística 01 alunos

Semelhante a Estatistica_basica_planejamento_experimento.ppt (20)

PPTX
aula_analiseDeDados.pptx
PDF
Apostila bioestatistica 2018
PPT
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
PPTX
Aula 1 - Bioestatistica em area da saude medicina enfermagem, fisioterapia, ...
PPTX
Bioestatistica para mestrado na area de enfermagem , farmacia, biomedicina, m...
PPT
Aula de Organização de dados em Introdução a Estatística
PPT
Aula 022 - Introdução à Estatística: Organização de Dados.ppt
PPT
Organização de dados matematica 8 ano.ppt
PPT
Introdução a estatistica, noções basicas de estatistica.
PPT
Organização de daaaaaaaaaaaaados (1).ppt
PDF
1-bioestatstica-140320051658-phpapp02.pdf
PPT
Estatística Descritiva
PPTX
Estatistica Basica para Saude Aula 1
PPTX
Pesquisa Quantitativa: aspectos teóricos e computacionais
DOCX
Adaptação Curricular
PDF
Bioestatistica
PDF
Apostila estatística 1
PDF
Apostila estatistica
PDF
AULA 01 - Analise exploratória de dados.pdf
PPT
Bioestatística
aula_analiseDeDados.pptx
Apostila bioestatistica 2018
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Aula 1 - Bioestatistica em area da saude medicina enfermagem, fisioterapia, ...
Bioestatistica para mestrado na area de enfermagem , farmacia, biomedicina, m...
Aula de Organização de dados em Introdução a Estatística
Aula 022 - Introdução à Estatística: Organização de Dados.ppt
Organização de dados matematica 8 ano.ppt
Introdução a estatistica, noções basicas de estatistica.
Organização de daaaaaaaaaaaaados (1).ppt
1-bioestatstica-140320051658-phpapp02.pdf
Estatística Descritiva
Estatistica Basica para Saude Aula 1
Pesquisa Quantitativa: aspectos teóricos e computacionais
Adaptação Curricular
Bioestatistica
Apostila estatística 1
Apostila estatistica
AULA 01 - Analise exploratória de dados.pdf
Bioestatística
Anúncio

Último (10)

DOC
Saude Frutal qqqqqqqqqqqqqqqqqqqqqqqqqqq
PPTX
Slide Gêneros textuais: resenha crítica.ppxt
PPT
Aula 5 - Percepção e Tomada de Decisão Individual.ppt
PDF
POP-28-Administracao-de-medicacao-intramuscular.pdf
PDF
Óptica geométrica - Vidal.pdfhuuuhhuui
PDF
Investigação Operacional história completa
PDF
Previsão de Paradas em Máquinas Industriais
PDF
DIAGNOSTICO DE AVARIAS EM AUTOMATISMOS INDUSTRIAIS.pdf
PDF
01 Anticoag + fibrinol Abr 24 - prof MAISA DIA 020424.pdf
PDF
712893401-Geografia-em-perspectiva-3.pdf
Saude Frutal qqqqqqqqqqqqqqqqqqqqqqqqqqq
Slide Gêneros textuais: resenha crítica.ppxt
Aula 5 - Percepção e Tomada de Decisão Individual.ppt
POP-28-Administracao-de-medicacao-intramuscular.pdf
Óptica geométrica - Vidal.pdfhuuuhhuui
Investigação Operacional história completa
Previsão de Paradas em Máquinas Industriais
DIAGNOSTICO DE AVARIAS EM AUTOMATISMOS INDUSTRIAIS.pdf
01 Anticoag + fibrinol Abr 24 - prof MAISA DIA 020424.pdf
712893401-Geografia-em-perspectiva-3.pdf
Anúncio

Estatistica_basica_planejamento_experimento.ppt

  • 1. Curso de Análise Estatística Nova Abordagem Prof. Dr. Clóvis de Araújo Peres cperes@medprev.epm.br
  • 2. FILOSOFIA DO CURSO • É um curso de estatística que não exige conhecimento prévio e os conceitos são introduzidos através de exemplificação prática, dando ênfase na intuição e não na argumentação matemática. • O curso é dividido em duas partes: • Na primeira parte serão discutidos conceitos fundamentais de estatística descritiva e inferencial, que permitem ao aluno entender a essência do pensamento estatístico. • Na segunda parte iremos realizar a análise estatística completa de projetos de pesquisa desde o planejamento até a conclusão. Os projetos são escolhidos de forma a contemplar o ensino de diferentes técnicas de análise estatística. • É importante que o aluno participe de todas as etapas de discussões com perguntas relacionadas com a sua área de atuação. • O material didático distribuído é apenas um guia do roteiro do curso.
  • 3. Perguntas que serão respondidas neste curso I - O que é Estatística? II -De que forma a Estatística interage com a pesquisa científica ou observacional (analítica ou descritiva)? III - Com que tipo de informação (dados) a Estatística trabalha? IV - Quais são as diferentes formas de obtenção de dados ? V - Que conceitos são fundamentais para se entender o conjunto de dados gerados por uma pesquisa por amostragem ou simples levantamento de dados? VI - Que conceitos são fundamentais para se analisar estatisticamente dados gerados por levantamentos amostrais?
  • 4. Programa do Curso Parte 1: Definições e conceitos básicos. I - Definição de Estatística; II - Interação entre a estatística e o método científico; III - Tipos de variáveis geradoras de dados; IV - Planejamento da pesquisa : diferentes formas de obtenção de dados; V - Descrição de um conjunto de dados obtidos por levantamentos populacionais, amostrais ou experimentos controlados através de: medidas-resumo, tabelas e gráficos apropriados para cada situação; VI - Conceitos essenciais para se entender a análise estatística inferencial: erro amostral e intervalo de confiança. Parte 2: Aplicações dos conceitos apresentados na primeira parte em problemas práticos de interesse dos alunos.
  • 5. I – DEFINIÇÃO DE ESTATÍSTICA É um campo de estudos que produz metodologia para:  Decidir qual é o melhor Plano para a realização de uma Pesquisa científica ou observacional (analítica ou descritiva); Organizar e Sumarizar dados obtidos por classificação, contagem ou mensuração, ou transformações destes, e  Fazer inferências sobre populações de unidades (indivíduos, objetos, animais) quando apenas uma parte (amostra) é estudada (classificada, contada ou medida). Sub-áreas da Estatística: (1) Planejamento de experimentos e técnicas de amostragem; (2) Estatística Descritiva; (3) Estatística Inferencial.
  • 6. II- Interação entre a estatística e a pesquisa científica Análise Estatística Descritiva Análise Inferencial Conclusões Formulação de novos objetivos Objetivos da pesquisa Planejamento de uma pesquisa que será realizada por levantamentos populacionais ou por amostragem Observações Dados
  • 7. III - TIPOS DE VARIÁVEIS GERADORAS DE DADOS Categóricas Numéricas Nominal (classificação) Ordinal (classificação) Discreta (contagem) Contínua (mensuração) sexo, raça, região, grupo sangüíneo pressão sangüínea (baixa, normal, alta) Número de acidentes, número de filhos Peso, altura, pressão sangüínea
  • 8. III - TIPOS DE VARIÁVEIS GERADORAS DE DADOS Idade Sexo Hemoglobina Tipo de urticária Duração 34 masc 14,2 física curta 58 masc 14,4 física longa 31 fem 15,1 idiopática média 49 masc 10,9 idiopática média 39 fem 14,4 física longa 33 masc 14,1 física curta 35 fem 14,0 idiopática longa
  • 9. IV – Planejamento da Pesquisa 4.1 – Pesquisa por levantamentos populacionais • Contínuos – quando os eventos vão sendo registrados à medida que ocorrem . Ex : registros de óbitos, nascimentos, casamentos • Periódicos – são aqueles que acontecem ciclicamente. Ex: censos populacionais que ocorrem a cada 10 anos. • Ocasionais – são aqueles realizados sem preocupação de continuidade ou periodicidade pré estabelecidas. Obs: A análise estatística recomendada consiste na construção de tabelas e gráficos acompanhadas de comentários. Análise descritiva ou exploratória dos dados.
  • 10. .2 – Pesquisa por amostras : técnicas de amostragem e planejamento de experime Objetivos da pesquisa Comparações de diferentes grupos Caracterização de populações segundo fatores de interesse • Comparação entre diferentes tratamentos para insuficiência respiratória Estudo de bioequivalência entre drogas • Condições de vida das famílias da região metropolitana de São Paulo • Grau de satisfação dos usuários da SABESP quanto ao fornecimento de água Tipos de Planejamento Esquemas de Amostragem
  • 11. Tipos de Planejamento • Completamente Aleatorizado (amostras não pareadas); • Blocos Completos Aleatorizados (amostras pareadas); • “Cross-Over”. Esquemas de Amostragem • Amostra Casual Simples; • Amostra Estratificada; • Amostra em Estágios Múltiplos. IV – Planejamento da Pesquisa
  • 12. 4.3 - Estudos Epidemiológicos : Descritivos e Analíticos Descritivos • Não têm hipóteses definidas; • Fornecem informações sobre o padrão de ocorrência de doenças de acordo com características populacionais. Analíticos • Têm hipóteses definidas e permitem testá-las: • Coortes; • Caso controle; • Transversal. IV – Planejamento da Pesquisa
  • 13. IV – Planejamento da Pesquisa Estudos Epidemiológicos Analíticos São, em geral, necessários quando informações preliminarmente coletadas indicam que um estudo epidemiológico mais detalhado deve ser conduzido para testar uma hipótese particular. • COORTES Em estudos de coorte prospectivo todos os indivíduos incluídos são não doentes e divididos em 2 grupos, expostos e não expostos. O coorte é seguido por um período de tempo e taxas de incidência da doença são comparadas entre expostos e não expostos. Este estudo também pode ser conduzido retrospectivamente selecionando dois grupos de indivíduos expostos e não expostos comparando-se taxas de incidência da doença em um período de tempo passado.
  • 14. Estudos Epidemiológicos Analíticos • CASO-CONTROLE Em estudos de caso-controle um grupo de doentes (casos) e um grupo de não doentes (controles) são selecionados. A proporção de indivíduos que foram expostos por um período de tempo é calculada nos grupos e comparadas. • TRANSVERSAL Em estudos transversais ou de prevalência, exposição a fatores de risco e de ocorrência da doença são avaliados simultaneamente num ponto no tempo em um grupo de indivíduos. Taxas de prevalência da doença são comparadas entre expostos e não expostos. IV – Planejamento da Pesquisa
  • 15. Regressão logística para estimar taxas de prevalência de doença entre expostos e não expostos, assim como as razões dessas taxas. Transversal Regressão logística para estimar “odds ratio”. Riscos de ocorrência da doença somente são possíveis a partir de algumas informações populacionais. Caso-controle Regressão logística para estimar riscos de ocorrência da doença, riscos relativos , “odds ratio”. Coorte Modelos de Análise Estatística Tipos de Estudos IV – Planejamento da Pesquisa Estudos Epidemiológicos Analíticos
  • 16. Exemplo 1:Ensaio Clínico Completamente Aleatorizado Teste do efeito do Metoprolol em pacientes de 65 a 74 anos que tiveram Infarto Agudo do Miocárdio. Comentários: 1. Os pacientes foram alocados a cada um dos grupos, placebo e metoprolol, completamente aleatorizado; 2. Foram seguidos por 3 meses e registrado o estado vital; 3. Estudo prospectivo; 4. Amostras não-pareadas.
  • 17. Exemplo 2: Estudo de Caso-Controle Relação da Presença de Câncer entre mães e filhas Comentários: 1. Estudo Retrospectivo; 2. Duas amostras independentes de filhas, com presença e ausência de Câncer; 3. Amostras não-pareadas; 4. Estudo da relação entre duas variáveis categóricas binárias.
  • 18. Exemplo 3: Estudo sobre Diabetes Gestacional Comparação de 3 grupos de gestantes - normais (N), tolerância diminuída (TD) e diabéticas (D) em relação a hemoglobina glicosilada (HbA). Comentários: 1. Estudo completamente aleatorizado (amostra casual simples em cada estrato); 2. Amostras não-pareadas; 3. Estudo da relação entre uma variável numérica e uma categórica.
  • 19. Exemplo 4 : Estudo sobre perda de peso (kg) em pessoas obesas, segundo Dieta e Terapia Comentários: 1. Estudo completamente aleatorizado; 2. Oito amostras não pareadas de tamanho 5; 3. Estudo da relação entre duas variáveis categóricas e uma numérica.
  • 20. Exemplo 5: Estudo sobre Pielonefrite Comentários: 1. Amostras pareadas; 2. Estudo da relação entre duas variáveis categóricas.
  • 21. Exemplo 6: Experimento "Cross-Over" Comentários: 1) Cada indivíduo é submetido às 2 drogas em períodos diferentes; 2) Este experimento permite verificar: • concordância de respostas; • comparação das drogas em termos de positividade da resposta – Qui- quadrado de Mc Nemar. Tabela comumente apresentada de forma inadequada. Comparação de duas drogas
  • 22. V – Análise exploratória de dados Os conceitos serão apresentados de acordo com o seguinte esquema: a) Variável numérica 1) medidas de variabilidade e de posição; 2) representação gráfica: distribuição de freqüência e Boxplot; 3) ajuste de uma curva de freqüência com distribuição normal. b) Variável categórica 1) medidas de variabilidade e de posição; 2) representação gráfica: gráfico de barras e pizza.
  • 23. • Variável numérica : Exemplo 1: Duas amostras de 20 indivíduos 1) medidas de variabilidade e de posição Amostra 1: Estatura mínima: 140 cm Estatura máxima: 180 cm Amostra 2: Estatura mínima: 150 cm Estatura máxima: 170 cm Questão 2: Quanto a variabilidade individual de uma amostra é maior do que a outra? Resposta: Resposta: Questão 1: Em qual das duas amostras os indivíduos variam mais em relação à estatura? Resposta: Resposta: CONCEITOS: CONCEITOS:
  • 24. • Variável numérica : Exemplo 2: Duas amostras de 6 indivíduos (os valores abaixo representam a estatura, em cm) 1) medidas de variabilidade e de posição Amostra 1: 150, 151, 153, 155, 158, 160 Amostra 2: 150, 155, 155, 155, 155, 160 Questão 1: Em qual das duas amostras os indivíduos variam mais em relação à estatura? Resposta: Resposta: Questão 2: Quanto a variabilidade de uma amostra é maior que a da outra? Resposta: Resposta: CONCEITOS: CONCEITOS:
  • 25. • Variável numérica : 2) Representação gráfica a) Histograma (distribuição de freqüência empírica)
  • 26. • Variável numérica : b) Boxplot : (forma de agrupar dados através dos percentis) Exemplo : Estudo sobre Diabetes Gestacional - Comparação de 3 grupos de gestantes, normais, tolerância diminuídas e diabéticas em relação a hemoglobina glicosilada (HbA). Boxplot do nível de Hemoglobina glicosilada, segundo grupo de gestantes. Tol_Diminuída Normal Diabética HbA 11 10 9 8 7 6 5
  • 27. • Variável numérica : 3) Noções sobre DISTRIBUIÇÃO NORMAL PROPRIEDADES DA DISTRIBUIÇÃO NORMAL  68% dos valores individuais estão entre  -  e  +   80% dos valores individuais estão entre  - 1,28 e  + 1,28  90% dos valores individuais estão entre  - 1,64 e  + 1,64  95% dos valores individuais estão entre  - 1,96 e  + 1,96  98% dos valores individuais estão entre  - 2,33 e  + 2,33  99% dos valores individuais estão entre  - 2,58 e  + 2,58  99,7% dos valores individuais estão entre  - 3 e  + 3
  • 28. • Variável numérica :  4) Curva normal ajustada à distribuição de freqüência empírica
  • 29. • Variável categórica : 1) medidas de variabilidade e de posição Exemplo: Duas amostras de 20 indivíduos onde cada um é classificado em relação ao sexo. Questão 1: Em qual das duas amostras os indivíduos variam mais em relação ao sexo? Resposta: Resposta: CONCEITOS: CONCEITOS:
  • 30. • Variável categórica: 2) Representação gráfica: gráfico de barras e pizza Distribuição de Chefes de Famílias segundo gênero 0 20 40 60 80 100 masculino feminino Fonte : PED-Dez/1999 Percentual
  • 31. VI - Conceitos essenciais para se entender a análise estatística inferencial: erro amostral e intervalo de confiança. Essência da Estatística Inferencial Considere uma população de indivíduos representada por uma variável numérica (Albumina Sérica).
  • 32. VI - Conceitos essenciais para se entender a análise estatística inferencial: erro amostral e intervalo de confiança. Questão de interesse Queremos estimar por meio de uma amostra de tamanho n a média populacional µ.
  • 33. VI - Considerações sobre a solução a) Tipo de Amostra: Amostra probabilística; b) Para qualquer tamanho de amostra n a média da amostra é “sempre” diferente da média µ da população; c) A distância entre a média da amostra e a média da população é chamada de Erro Amostral (EA).
  • 34. VI - Considerações sobre a solução d) Fatos Intuitivos d) Fatos Intuitivos • Para uma determinada população com uma determinada variância, quanto maior for o tamanho da amostra menor será o EA • Para um determinado tamanho de amostra quanto mais espalhada for a população em torno da média (variância), maior será o EA • Portanto podemos escrever que o erro amostral (EA) é proporcional ao quociente ais proporcion te inversamen n EA    ais proporcion e diretament Var EA    Ou
  • 35. VI - Considerações sobre a solução - ESTIMAÇÃO ESTIMAÇÃO
  • 36. Parte 2: Aplicações dos conceitos apresentados na primeira parte em problemas práticos de interesse dos alunos. Nesta parte, cada projeto de pesquisa (problema) será analisado estatisticamente seguindo as etapas: a) Formulação do objetivo; b) Descrição do experimento; c) Protocolo experimental; d) Análise descritiva; e) Análise inferencial; f) Conclusão.
  • 37. Estudo sobre a influência do Índice de Massa Corpórea, Idade e Hábito de Fumar na Pressão Sistólica (análise estatística da relação entre uma variável resposta numérica e várias variáveis explicativas numéricas). A - OBJETIVO Estimar um modelo matemático (função) que relaciona a pressão sistólica com o índice de massa corpórea (IMC), idade e hábito de fumar. B - DESCRIÇÃO DO EXPERIMENTO Para atingir o objetivo foi selecionada uma amostra de 32 indivíduos do sexo masculino com idade acima de 40 anos que foram avaliados com relação à Pressão Sistólica (mm de Hg), IMC calculado como , Idade (anos) e Hábito de Fumar (Sim e Não). Referência: Applied Regression Analysis Kleinbaum / Kupper PROBLEMA 10
  • 38. C - PROTOCOLO EXPERIMENTAL Para cada um dos indivíduos foi anotado a pressão sistólica (PS), IMC, idade e hábito de fumar, esses dados encontram-se na planilha abaixo. PLANILHA UTILIZADA: I n d i v í d u o P S I M C I d a d e F u m a 1 1 3 5 2 0 . 2 4 5 N Ã O 2 1 2 2 2 2 . 9 4 1 N Ã O 3 1 3 0 2 1 . 8 4 9 N Ã O 4 1 4 8 2 6 . 5 5 2 N Ã O 5 1 4 6 2 0 . 9 5 4 S I M 6 1 2 9 1 9 . 6 4 7 S I M 9 1 4 4 1 6 . 6 4 4 S I M 1 0 1 8 0 3 2 . 6 6 4 S I M      2 7 1 2 0 1 9 . 6 4 3 N Ã O 2 8 1 2 6 2 0 . 8 4 3 S I M 2 9 1 6 1 2 6 . 7 6 3 N Ã O 3 0 1 7 0 2 9 . 1 6 3 S I M 3 1 1 5 2 2 7 . 9 6 2 N Ã O 3 2 1 6 4 2 8 . 2 6 5 N Ã O PROBLEMA 10
  • 39. D - ANÁLISE DESCRITIVA 0 20 40 60 80 100 120 140 160 180 200 0.0 5.0 10.0 15.0 20.0 25.0 30.0 35.0 IMC (Kg/cm2) Pressão Sistólica (mm de Hg) Gráfico 1: IMC  Pressão Sistólica PROBLEMA 10 Gráficos de Dispersão
  • 40. Gráfico 2: Idade  Pressão Sistólica 0 20 40 60 80 100 120 140 160 180 200 0 20 40 60 80 Idade (anos) Pressão Sistólica (mm de Hg) PROBLEMA 10 D - ANÁLISE DESCRITIVA
  • 41. Gráfico 3: “Boxplot” da Pressão Sistólica segundo hábito de fumar Hábito de Fumar Sim (n = 17) Não (n = 15) Pressão Sistólica (mm de Hg) 190 180 170 160 150 140 130 120 110 PROBLEMA 10 Gráfico Boxplot D - ANÁLISE DESCRITIVA
  • 42. Saída do STATA  Stata: regress ps imc idade fuma . regress ps imc2 idade fuma Source | SS df MS Number of obs = 32 -------------+------------------------------ F( 3, 28) = 29.71 Model | 4889.82577 3 1629.94192 Prob > F = 0.0000 Residual | 1536.14298 28 54.8622494 R-squared = 0.7609 -------------+------------------------------ Adj R-squared = 0.7353 Total | 6425.96875 31 207.289315 Root MSE = 7.4069 ------------------------------------------------------------------------------ ps | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- imc | 1.222134 .6398629 1.91 0.066 -.088566 2.532834 idade | 1.212715 .3238192 3.75 0.001 .5494009 1.876028 fuma | 9.945568 2.656056 3.74 0.001 4.504883 15.38625 _cons | 45.10319 10.76487 4.19 0.000 23.05235 67.15404 ------------------------------------------------------------------------------ A Equação da reta de Mínimos Quadrados é : Fuma 95 9 Idade 21 1 IMC 1.22 5.10 4 PS        . . PROBLEMA 10