SlideShare una empresa de Scribd logo
Universidad Politécnica Estatal del Carchi
Comercio Internacional, Integración, Administración y
              Economía Empresarial.




Escuela: Comercio Exterior y Negociación Comercial
                  Internacional



              “Estadística Inferencial”


           “MODULO DEL ESTUDIANTE”

                    Msc. Jorge Pozo


                        Autor:
                      Jonathan Haro




    Nivel: sexto                      Paralelo: “A”
                   Marzo-Agosto 2012
                    Tulcán-Ecuador
Contenido
Modulo De Estadistica ...........................................................................................................8
CAPITULO I ...............................................................................................................................8
    1.1Introducción ......................................................................................................................8
    1.2 Definición De Estadística ...............................................................................................9
    1.3 Clasificación De La Estadística ...................................................................................10
    Estdistica Descriptiva ..........................................................................................................10
    Frecuencia: ...........................................................................................................................10
    1.1       Distribución De Frecuencias Absolutas Y Relativas ...........................................10
    1.2       Tabla De Frecuencias: ............................................................................................11
    1.3       Frecuencia Absoluta ................................................................................................11
    1.4       Frecuencia Relativa:................................................................................................12
    1.5       Forma De Cálculo ....................................................................................................13
    1.6       Frecuencia Acumulada ...........................................................................................13
    1.7       Gráficas .....................................................................................................................15
    1.8       Histograma ...............................................................................................................15
    1.9       Histograma Y Polígono De Frecuencias. .............................................................16
    1.10      Para Trazar El Histograma, La Secuencia De Operaciones Es: .......................16
    1.11      Medidas De Tendencia Central .............................................................................19
    Definiciones ........................................................................................................................19
    Las Medidas De Tendencia Central Más Comunes Son: .........................................19

    Media Aritmética                    O Promedio..................................................................................20
    Definición: ...........................................................................................................................20
    Características De La Media Aritmética: .....................................................................20
    1.12      Formula .....................................................................................................................21
    1.13      Mediana (Med) ........................................................................................................23
    1.14      Definición: .................................................................................................................23
    1.15      Características De La Mediana..............................................................................23
    1.16      Formas De Cálculo ..................................................................................................24
    1.17      Mediana Para Datos No Agrupados: ....................................................................24
    1.18      Mediana Para Datos Agrupados: ..........................................................................25
    1.19      Ejemplo 2: .................................................................................................................26
2      Moda .................................................................................................................................30
    2.1       Características De La Moda...................................................................................30
    2.2       Formas De Cálculo: .................................................................................................30
2.3        Datos Agrupados: ....................................................................................................31
    2.4        Cuartiles ....................................................................................................................32
    2.5        Cálculo De Los Cuartiles ........................................................................................32
    2.6        Cálculo De Los Cuartiles Para Datos Agrupados ...............................................33
    2.7        Ejercicios De Cuartiles ............................................................................................33
    Deciles .................................................................................................................................34
    Cálculo De Los Deciles ....................................................................................................34
    Ejercicio De Deciles ..........................................................................................................35
    Percentiles ..........................................................................................................................37
       Cálculo De Los Percentiles ............................................................................................37
Organizador Grafico De Las Medidas De Tendencia Central ...........................................39
CAPITULO II ............................................................................................................................43
    Medidas De Dispersión .......................................................................................................43
    2.8        Rango, Amplitud Total O Recorrido ......................................................................43
    2.9        Definicion ..................................................................................................................43
    2.10       Caracterìsticas .........................................................................................................44
    2.11       Características Del Rango......................................................................................44
    2.12       Formula .....................................................................................................................44
    2.13       Formas De Cálculo. .................................................................................................44
3      La Varianza ......................................................................................................................45
    3.1        Definicion ..................................................................................................................45
    3.2        Forma De Cálculo ....................................................................................................46
    3.3        Desviación Media ....................................................................................................47
    3.4        Definición ..................................................................................................................47
    3.5        Desviación Típica ....................................................................................................49
    3.6        Cálculo De La Desviación Típica Para Datos No Agrupados En Clases .........50
    3.7   Cálculo De La Desviación Típica Para Datos Agrupados En Clases Y
    Agrupados Por Frecuencias...............................................................................................50
4 .................................................................................................................................................51
5      Pasos Para Descargar E Instalar El Spss ....................................................................52
    5.1        Pasos Para Resolver El Caso En Spss: ...............................................................55
6 .................................................................................................................................................62
7      Organizador Grafico De Las Medidas De Dispersión .................................................63
8      CAPITULO III ...................................................................................................................65
    8.1        Tema: Muestreo .......................................................................................................65
    Definicion ............................................................................................................................65
8.2       Muestreo Probabilístico: .........................................................................................66
    8.3       Sistemático ...............................................................................................................67
    8.4       Estratégico ................................................................................................................67
    8.5       Muestreo No Probabilístico: ...................................................................................68
    8.6       Casual. ......................................................................................................................68
    8.7       Intencional ................................................................................................................68
    8.8       Cuotas. ......................................................................................................................68
    8.9       Determinar El Tamaño De La Muestra .................................................................69
    8.10      Ejemplos: ..................................................................................................................70
    8.11      Población Finita........................................................................................................72
9     Campana De Gaus ..........................................................................................................74
    9.1       Ejemplos De La Campana De Gaus: ....................................................................74
    9.2       1.) Calcular La Probabilidad Del Evento ...............................................................74
    9.3       2.) Calcular La Probabilidad Del Evento ...............................................................75
    9.4       Desarrollo..................................................................................................................76
10         Variables .......................................................................................................................78
    10.1      Definición De Variable .............................................................................................78
    10.2      Ejemplo De Variables:.............................................................................................79
    10.3      Clasificación De Las Variables: .............................................................................79
    10.4      Variable Dependiente:.............................................................................................79
    10.5      Variable Independiente: ..........................................................................................80
11         CAPITULO IV...............................................................................................................83
    11.1      1.3.2. Tema: Estadística Inferencial ......................................................................83
    11.2      Correlación ...............................................................................................................83
    11.3      Coeficiente De Correlación.. ..................................................................................83
    11.4      Relación Lineal.........................................................................................................84
    11.5      Coeficiente De Correlación De Pearson ...............................................................86
    11.6      Interpretación.. .........................................................................................................87
    11.7      Calcular El R De Pearson.......................................................................................87
12         Coeficiente De Correlación De Rangos De Sperman.............................................87
    12.1      Coeficiente Intelectual .............................................................................................88
    12.2      Coeficiente R De Pearson ......................................................................................89
14         Regresión Lineal ..........................................................................................................89
    14.1      Definición De Correlación Lineal ...........................................................................90
    14.2      El Coeficiente De Correlación Lineal De Pearson R ...........................................96
    14.3      Definición Y Características Del Concepto De Regresión Lineal......................98
14.4      Organizador Grafico De Correlacion Y Regrecion Lineal ...............................104
 14.5      Ejercicios De Correlacion Y Regrecion Lineal ..................................................105
15      Características De Las Hipótesis ............................................................................111
 15.1 Ejemplo: El Contrabando En Ecuador Es Menor Que El Contrabando En
 Colombia .............................................................................................................................111
 15.2      Clasificación De Las Hipótesis .............................................................................112
 15.3      Hipótesis De Investigacion ...................................................................................112
 15.4      Hipotesis Nula ........................................................................................................112
 15.5      Hipotesis Alternativa ..............................................................................................112
 15.6      Hipotesis Estadistica .............................................................................................112
 15.7      Ejemplo De Hipótesis: ...........................................................................................112
 15.8      Hipótesis De Un Valor O Dato Pronósticado: ...................................................113
 15.9      Hipótesis Correlacionadas:...................................................................................113
 15.10 Hipótesis De Diferencia Entre Grupos: ...............................................................114
 15.11 Hipótesis Causales: ...............................................................................................114
 15.12 Hipótesis Nula (Ho): .............................................................................................114
 15.13 Hipótesis Alternativa (Ha): ...................................................................................115
 15.14 Hipótesis Estadística: ...........................................................................................116
 15.15 Hipótesis Estadísticas De Estimación:...............................................................116
 15.16 Hipótesis Estadísticas De Correlación: ..............................................................116
 15.17 Hipótesis Estadisticas De La Diferencia De Medias U Otros Valores: ..........116
 15.18 Ejemplos De Hipotesis: ........................................................................................116
 15.19 Hipótesis Descriptiva ............................................................................................116
 15.20 Pasos Para La Prueba De Hipotesis.................................................................118
 15.21 Prueba De Diferencias De Medias .....................................................................121
16      “T“De Student .............................................................................................................127
 16.1      Características .......................................................................................................127
 16.2      Grado De Libertad: ................................................................................................127
 16.4      Formulacion De Hipotesis ....................................................................................128
17      Prueba De Ji- Cuadrado O                             .............................................................................133
 17.1      Propiedades De Las Distribuciones Ji-Cuadrado..............................................133
 17.2      Frecuencias Observadas ......................................................................................138
 17.3      Frecuencias Esperadas (De Ho) .........................................................................138
18      Conclusiónes ..............................................................................................................142
19      Recomendaciones .....................................................................................................143
20      10. Financieros Y Técnicos. .....................................................................................144
21      9. Cronograma De Tareas ........................................................................................144
22      Anexos ........................................................................................................................146
 22.1      Organizador Grafico De La Estadistica Descriptiva E Inferencial ...................147
 22.2 Tema: Proyecto De Aplicación Al Comercio Exterior Aplicando Correlación,
 Regresión Lineal Simple Aplicando, Prueba De Hipótesis, T-Student Y Chi2 Con
 Ayuda Del Programa Spss. ..............................................................................................151
 22.3      1.2 Problema ..........................................................................................................151
 22.4      1.3 Objetivos...........................................................................................................151
 22.5      Objetivo General ....................................................................................................151
 22.6      Objetivos Específicos ............................................................................................151
 22.7      3. Justificación ........................................................................................................152
 1.5       Marco Teórico.......................................................................................................153
 22.8      El Spss ....................................................................................................................153
 22.9      Correlación Lineal ..................................................................................................154
 22.10         Técnicas De Correlación...................................................................................155
 22.11         Relaciones Lineales Entre Variables ..............................................................155
 22.12         Diagrama De Dispersión ...................................................................................157
 22.13         Coeficiente De Correlación Rectilínea De Pearson ......................................157
 22.14         Correlación .........................................................................................................157
 22.15         Desarrollo ............................................................................................................158
 22.16         Regresión Lineal ................................................................................................160
 22.17         Fases Del Modelo De Regresión Lineal .........................................................160
 22.18         El Modelo De Regresión Lineal .......................................................................160
 22.19         Relación Lineal ...................................................................................................161
 22.20         Desarrollo ............................................................................................................163
 22.21         Encontrar La Ecuación ......................................................................................165
 22.22         Prueba De Hipótesis..........................................................................................168
 22.23         Hipótesis Nula Y Alternativa .............................................................................168
 22.24         Selección Del Nivel De Significancia ..............................................................169
 22.25         Error Tipo I Y Error Tipo Ii.................................................................................170
 22.26         Pasos De Una Prueba De Hipótesis ...............................................................170
 22.27         Formular La Hipótesis Alternativa Ha ..............................................................170
 22.28         T De Student ......................................................................................................171
 22.29         Propiedades: ......................................................................................................171
 22.30         Chi- Cuadrado ....................................................................................................174
 22.31         Pruebas Paramétricas .......................................................................................174
22.32   Pruebas No Paramétricas.................................................................................174
22.33   Varianza ..............................................................................................................179
22.34   Variable Dependiente O Variable Respuesta. ...............................................180
22.35   Nivel O Tratamiento Del Factor:. .....................................................................180
22.36   Unidad Experimental .........................................................................................180
22.37   Error Experimental .............................................................................................180
22.38   Aleatorización:. ...................................................................................................180
22.39   Abstract ...............................................................................................................182
22.40   Evaluaciones De Estadistica Inferencial ........... ¡Error! Marcador no definido.
MODULO DE ESTADISTICA
                                      CAPITULO I
1.1 INTRODUCCIÓN

Los profesionales de la educación, como parte de su quehacer profesional,
realizan investigación científica: evaluación de la calidad de la educación,
someten a prueba diferentes métodos de comprensión lectora, estudian
problemas del aprendizaje, entre otros. Es así, que contamos con Internet,
como fuente general de información, que permite disponer de información
educativa, por ejemplo, sobre evaluaciones muéstrales, que realiza el
Ministerio de Educación y que está disponible en la página web.

Una vez que conoce tanto la forma de recoger información como la forma de
presentar a la misma, sea en forma de tablas o con el tratamiento realizado
para elaborar una tabla de frecuencias, ahora es conveniente seguir con las
características que permiten describir a un conjunto de datos que se recogen
de un problema a investigarse.

La Estadística es una disciplina que utiliza recursos matemáticos para
organizar y resumir una gran cantidad de datos obtenidos de la realidad, e
inferir conclusiones respecto de ellos. Por ejemplo, la estadística interviene
cuando se quiere conocer el estado sanitario de un país, a través de ciertos
parámetros como la tasa de morbilidad o mortalidad de la población.

En este caso la estadística describe la muestra en términos de datos
organizados y resumidos, y luego infiere conclusiones respecto de la población.

Aplicada a la investigación científica, también infiere cuando provee los medios
matemáticos para establecer si una hipótesis debe o no ser rechazada. La
estadística puede aplicarse a cualquier ámbito de la realidad, y por ello es
utilizada en física, química, biología, medicina, astronomía, psicología,
sociología, lingüística, demografía, etc.
1.2 DEFINICIÓN DE ESTADÍSTICA

La estadística es la ciencia formada por un conjunto de teorías y técnicas
cuantitativas, que tiene por objeto la organización, presentación, descripción,
resumen y comparación de conjuntos de datos numéricos, obtenidos de
poblaciones en su conjunto de individuos o fenómenos o bien de muestras que
representan las poblaciones estudiadas, así como el estudio de su variación,
propiedades, relaciones, comportamiento probabilístico de dichos datos y la
estimación, inferencia o generalización de los resultados obtenidos de
muestras, respecto a las poblaciones que aquéllas representan. La estadística
en la investigación científica, dada la necesidad de manejar y tratar en ellas
grandes      cantidades,      progresivamente       crecientes,   de    datos”.
(http://www.AulaFacil.com)

Irma Nocedo de León et al (2001), anotan que “la estadística es la ciencia
encargada de suministrar las diferentes técnicas y procedimientos que permiten
desde organizar la recolección de datos hasta su elaboración, análisis e
interpretación. Abarca dos campos fundamentales la estadística descriptiva y la
estadística inferencial. (http://www.Wikipedia: Estadísticas.)
1.3 CLASIFICACIÓN DE LA ESTADÍSTICA

Dependiendo de cómo se analizan los datos, la Estadística se clasifica como:

       ESTDISTICA DESCRIPTIVA

Estadística Descriptiva.- Rama de la estadística que trata sobre la
descripción y análisis estadístico de una población, que resume y presenta
datos obtenidos de la población o de una muestra, mediante métodos
adecuados. Tiene como objetivo caracterizar los datos, de manera gráfica o
analítica, para resaltar las propiedades de los elementos bajo estudio.
(http://www.Wikipedia: Estadísticas.)

       FRECUENCIA:

Es el número de veces que se repite un dato.

       Es el número de repeticiones que presenta una observación. Se
         representa por ni. http://www.mitecnologico.com
       Es el número de veces que aparece cualquier valor de la variable. Se
         representa por fi. En algunos libros de texto nos la encontraremos
         representada por ni. http://www.quequieredecir.com.

1.1    DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y RELATIVAS

Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y
resumir los datos obtenidos en la investigación de campo, para ello se
concentran en tablas de frecuencia y éstas pueden ser:

a) Absoluta.

b) Relativa.

c) Acumulada.

Con el análisis de las frecuencias podemos determinar la tendencia de la
variable en estudio que como ya se dijo, ésta puede ser nominal, ordinal o
cuantitativa y sus respectivas escalas de medición: nominal, ordinal o por
intervalos, respectivamente.
EJEMPLO: La maestra de orientación del Plantel 11 dio una conferencia al
grupo 603 sobre las características y bondades de las carreras de Ingeniería,
Química Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un
cuestionario donde especificaron además de los datos personales, la carrera
de preferencia. Se obtuvieron los siguientes resultados:             I, A, M, Q, Q, M,
A, I, M, Q, A, Q, I, Q, M,

                      Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,

                      M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q,

1.2     Tabla De Frecuencias:

Carrera que prefieren los alumnos del grupo 603 del Plantel 11 del Colegio de
Bachilleres.




Encuesta realizada por la maestra de orientación del Plantel 11, el 12 de
septiembre de 1993.

       El número de columnas de una tabla es variable y depende de la
        información que se quiera registrar.

       En nuestro ejemplo podemos suprimir la columna 2 que representa el
        conteo de la variable el cual se puede realizar en otras hojas de trabajo.

       En la tercera columna se registra la frecuencia.


1.3 FRECUENCIA ABSOLUTA
En una muestra estadística, número de veces que aparece un determinado
carácter. http://nuestrosalud.com/ frecuencia-absoluta.html
El número de los miembros de una serie estadística, que es al intervalo
determinado de los significados de la cantidad variable dada casual; en
particular, el número de los casos con dado o los valores dados del elemento
durante todo el tiempo de las observaciones. http://www.quequieredecir.org.

                          FRECUENCIAS ABSOLUTAS
                          Simple (Ni) Acumulada (Ni)
                             Ni              Ni
                             n2            ni+n2
                             n3          ni+n2+n3
                              .               .
                              .               .
                             Nn                n


1.4    FRECUENCIA RELATIVA:
       Cociente entre la frecuencia absoluta y el número de casos de una
         muestra. http://www.quequieredecir.org/frecuencia/


       La frecuencia relativa es el cociente entre la frecuencia absoluta de un
         determinado     valor     y    el     número        total   de   datos.
         http://www.mitecnologico.com



                                 FRECUENCIA RELATIVA
                                 Simple      Acumulada
                                 hi=n1|n         h1
                                 h2=n2|n       h1+h2
                                    .                   .
                                    .                   .
                                 hn= nn/n                h
1.5   FORMA DE CÁLCULO


EJEMPLO

La puntuación obtenida en un examen que se aplicó a 100 obreros de la fábrica
de vidrio el Fanal, es la que se muestra en la siguiente tabla de frecuencias: 46

Resultados del examen aplicado a 100 obreros de la fábrica de vidrio el

Fanal.




Investigación realizada por el jefe del departamento de capacitación de la
fábrica de vidrio el Fanal, el 5 de septiembre de 1993.



1.6   FRECUENCIA ACUMULADA


La frecuencia acumulada (Fi) es otra característica de la muestra que nos
permitirá determinar la posición de un caso particular que nos interese en
comparación con el total de los elementos. ((Levin Richard & Rubin David))

DEFINICIÓN:

Su definición matemática es:
Al calcular la frecuencia acumulada (F1) podemos determinar su frecuencia
relativa acumulada (Fr) en la forma ya explicada mediante la ecuación (1), esto
es: n




Regresemos al problema (11) de las llamadas telefónicas y calculemos la
frecuencia acumulada (f1) y la frecuencia relativa acumulada (Fr). Frecuencia
acumulada (Fi) de una clase es la que se obtiene sumando las frecuencias de
las clases anteriores con la frecuencia de ésta.




La frecuencia acumulada para la 4ta. Clase es F = 45; de este valor se infiere
que hasta esta clase corresponden 45 de las 60 observaciones realizadas.
También se infiere que a esta clase corresponden un número menor o igual a
43 llamadas telefónicas. La frecuencia relativa de esta clase es F = 0.75. Este
valor significa que hasta esta clase corresponde el 75% de todas las llamadas.
1.7   GRÁFICAS




Al representar en una gráfica la información concentrada en la tabla de
frecuencias, ésta es un recurso visual que nos permite tener una idea clara,
precisa, global y rápida acerca de las observaciones de una muestra o
población. Existen muchos tipos de gráficas en las que se pueden representar
la frecuencia absoluta (fi), relativa (fr) y acumulada (Fi) y con ellas podemos
estimar algunos valores con la simple observación.

1.8   HISTOGRAMA




Es uno de los medios expresada en % con mayor frecuencia, es una
representación gráfica de la distribución de frecuencias.

Se utilizan para representar tablas de frecuencias con datos agrupados en
intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de
un rectángulo cuya altura es proporcional a la frecuencia correspondiente.
http://www.monografias.com/ conceptos-de-estadistica.shtml

En estadística, un histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados. En el eje vertical se representan las
frecuencias, y en el eje horizontal los valores de las variables, normalmente
señalando las marcas de clase. http://es.wikipedia.org/wiki/Histograma




1.9    HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.

       El histograma es la forma más usual para analizar las características
         observables de una variable continua (http://www.monografias.shtml)




       Histograma es la representación gráfica en el plano coordenado de las
         características concentradas en la tabla de frecuencias de una variable
         continua. (http://www.monografia.com/estadistica)

1.10 Para trazar el histograma, la secuencia de operaciones es:

1. En los ejes coordenados del plano cartesiano representamos los datos de la
siguiente forma:

         a) En el eje de las abscisas (horizontal) se representan las clases con
         sus límites reales de clase y las marcas de clase (Mi) de cada intervalo.

         b) En el eje de las ordenadas (vertical) representamos las frecuencias
         absolutas en que ocurre la variable.

Analicemos El Siguiente Problema:

Al gerente general de la empresa “Conductores Monterrey” le interesa conocer
la antigüedad de sus trabajadores, por lo que le indica al gerente de personal
que realice un análisis del problema.

El gerente de personal recabó de los expedientes la siguiente información
sobre los años de antigüedad:
13, 19, 22, 14, 13, 16, 19, 21
                           23, 11, 27, 25, 17, 17, 13, 20
                           23, 17, 26, 20, 24, 15, 20, 21
                           23, 17, 29, 17, 19, 14, 20, 20
                           10, 22, 18, 25, 16, 23, 19, 20
                           21, 17, 18, 24, 21, 20, 19, 26

Con esta información decidió representarlos en una gráfica (histograma).
Recuerda la secuencia de operaciones que establecimos:

1. Ordenamos los datos en sentido creciente:

10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18,

18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21,

22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29.

2. Calculamos el rango R, para ello determinamos los valores mayor y
menor de las puntuaciones.

X n = 29

Xi = 10

3. Calculamos R = X n – X1 = 29 – 10 = 19

R = 19

4. Calculamos el número de clases (K), para ello determinamos (n)

N = 48; K = 1 + 3.322 log48 = 1 + 3.322 (1.68) = 1 + 5.58 = 6.58 K = 7

5. Determinamos la amplitud de cada clase (A)

R = 19 = 2.7K 7

Se han redondeado los valores de K y A porque el número de clases y la
amplitud de la clase nunca serán fraccionarios.
6. Determinamos cada intervalo de clase y para ello calculamos los límites de
clase y los registramos en la primera columna de la tabla.




7. Trazamos los ejes del plano coordenado, fijamos una escala para cada eje y
representamos en el vertical las frecuencias y en el eje horizontal las clases.

La mayor frecuencia es f4 = 16 por lo que con la escala establecida en cm.
Marcamos 16 divisiones en el eje vertical. En el eje horizontal no es necesario
iniciar por el cero, en nuestro ejemplo podemos iniciar a partir de 9, indicando
que se trunca una parte del eje horizontal.
1.11 MEDIDAS DE TENDENCIA CENTRAL

DEFINICIONES


      También se conocen como medidas de ubicación. Para que entienda
 estos conceptos remítase al texto en la parte introductoria del capítulo (Levin
 Richard & Rubin David).


      Las medidas de tendencia central (media, mediana y moda) sirven como
 puntos de referencia para interpretar las calificaciones que se obtienen en una
 prueba. ((Kazmier & Díaz Mata, 1993:)


       1. Sirve como un método para comparar o interpretar cualquier puntaje
           en relación con el puntaje central o típico.


       2. Mostrar en qué lugar se ubica la persona promedio o típica del grupo.



       3. Sirve como un método para comparar el puntaje obtenido por una
           misma persona en dos diferentes ocasiones.


       4. Sirve como un método para comparar los resultados medios
           obtenidos por dos o más grupos.



LAS MEDIDAS DE TENDENCIA CENTRAL MÁS COMUNES SON:

      La media aritmética: comúnmente conocida como media o promedio.
        Se representa por medio de una letra M o por una X con una línea en la
        parte superior.
      La mediana: la cual es el puntaje que se ubica en el centro de una
        distribución. Se representa como Md.
      La moda: que es el puntaje que se presenta con mayor frecuencia en
        una distribución. Se representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la
mejor y más útil. Sin embargo, cuando en una distribución se presentan casos
cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es
recomendable utilizar la mediana o la moda. (Porque dadas las características
de la media, esta es afectada por los valores extremos). La media aritmética es
considerada como la mejor medida de tendencia central, por las siguientes
razones: Los puntajes contribuyen de manera proporcional al hacer el cómputo
de la media. Es la medida de tendencia central más conocida y utilizada.


                   MEDIA ARITMÉTICA             O PROMEDIO


DEFINICIÓN:
    Es aquella medida que se obtiene al dividir la suma de todos los valores
      de una variable por la frecuencia total. En palabras más simples,
      corresponde a la suma de un conjunto de datos dividida por el número
      total de dichos datos. (Kazmier & Díaz Mata)


    Es el valor resultante que se obtiene al dividir la sumatoria de un
      conjunto de datos sobre el número total de datos. Solo es aplicable para
      el tratamiento de datos cuantitativos. ((Levin Richard & Rubin David)).




CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA:


   1. Es una medida totalmente numérica o sea sólo puede calcularse en

      datos de características cuantitativas.

   2. En su cálculo se toman en cuenta todos los valores de la variable.

   3. Es lógica desde el punto de vista algebraico.

   4. La media aritmética es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan

      clases abiertas.

   6. La media aritmética es única, o sea, un conjunto de datos numéricos

      tiene una y solo una media aritmética.


1.12 FORMULA




Dónde:
n= Media Aritmética Muestral
Xi = Valor Típico Especifico
N = Tamaño De La Muestra
Σ = sumatoria.

FORMAS DE CÁLCULO:
Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas:
4, 7, 7, 2, 5, 3 n = 6 (número total de datos)




La media aritmética de las notas de esa asignatura es 4,8. Este número
representa el promedio.

Ejemplo 2: Cuando se tienen muchos datos es más conveniente agruparlos en
una tabla de frecuencias y luego calcular la media aritmética. El siguiente
cuadro con las medidas de 63 varas de pino lo ilustra.


     Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta
             5                10                 5       .       10 = 50
             6                15                 6       .       15 = 90
             7                20                 7       .       20 = 140
             8                12                 8       .       12 =   96
             9                 6                 9           .    6=     54
                    Frecuencia total = 63                               430




Se debe recordar que la frecuencia absoluta indica cuántas veces se repite
cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos
(si la frecuencia absoluta es 10, significa que el valor a que corresponde se
repite 10 veces).
1.13 MEDIANA (MED)

1.14 DEFINICIÓN:

    La mediana solamente establece el valor que se encuentra utilizando la
      posición central dentro del conjunto. (file:/A|/tendencentral.htm)


    Es el valor central de un conjunto de valores ordenados en forma
      creciente o decreciente. Dicho en otras palabras, la Mediana
      corresponde al valor que deja igual número de valores antes y después
      de él en un conjunto de datos agrupados. Según el número de valores
      que se tengan se pueden presentar dos casos: ((Webster).



Si el número de valores es impar, la Mediana corresponderá al valor central de
dicho conjunto de datos.

Si el número de valores es par, la Mediana corresponderá al promedio de los
dos valores centrales (los valores centrales se suman y se dividen por 2).

1.15 CARACTERÍSTICAS DE LA MEDIANA


1. En su cálculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.

4. No es lógica desde el punto de vista algebraico.



FORMULA:




Me= Li+ n/2 –FA
        ni (i)
1.16 FORMAS DE CÁLCULO

La forma más general de calcular la mediana es la siguiente:




1.17 Mediana Para Datos No Agrupados:

Los datos no agrupados son aquellos que no tienen una ordenación previa para
presentarlos; por ello, se debe realizar lo siguiente:

   a. Con los datos recogidos se procede a ordenarlos de manera ascendente
       o descendente
   b. Establece el dato que ocupa la posición central
   c. Identificar el valor del dato que ocupa la posición central que vendría a
       ser el valor mediano.

En este caso para encontrar el dato que ocupa la posición central debemos
identificar si se trata de un número de datos par o impar. Si se trata de datos
pares, haremos lo siguiente:     Me=10/2

Con cuyo resultado contaremos la posición desde el valor menor y desde el
valor mayor, por ejemplo, si tenemos los siguientes datos: 6, 9, 3, 7, 4, 8, 6, 9,
1, 2

Procedemos a ordenarlos: 1, 2, 3, 4, 6, 6, 7, 8, 9, 9, luego identificamos la
posición que ocupa el valor central: M=5

Significa que desde el valor menor ubicamos el dato número 5, que para el
caso es el valor 6, luego hacemos lo mismo desde el valor mayor y en este
caso la posición 5 está ocupada por el valor 6. Posteriormente establecemos el
promedio entre los valores encontrados y estamos encontrando el valor
mediano: Me=6+6/2 M=6
Por tanto 6 es el valor que se encuentra ocupando la posición central o el valor
que divide en dos partes iguales al conjunto.

Si se trata de datos impares, entonces encontramos la posición, haciendo lo
siguiente: Me= n+1/ 2

Supongamos los siguientes datos: 5, 8, 3, 9, 1, 5, 7, 3, 8, 6, 4.

Procedemos a ordenar los datos: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9

Ahora establecemos el dato que ocupa la posición central Me= n+1/ 2

Me=11+1/2 M=6

Identificamos el sexto valor, aquí no hay problema empezar por el menor o por
el mayor puesto que será un solo valor: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9.

Por simple observación llegamos a determinar que el valor mediano es:

Me= n+1/ 2 M=5

1.18 Mediana Para Datos Agrupados:

Para datos agrupados en una tabla de distribución de frecuencias, vamos a
llevar el siguiente procedimiento:

   a. Con la tabla de distribución de frecuencias, encontramos la frecuencia
       acumulada.
   b. Establecemos el dato que se encuentra ocupando la posición central.
       Para ello utilizamos la siguiente fórmula:


   c. Identificamos el intervalo mediano a través de la frecuencia acumulada y
       la posición encontrada.


   d. Aplicamos la fórmula de la mediana que es la siguiente:


       Me= Li+ n/2 – fa(i)
                 Ni
Dónde:

Li = límite real inferior del intervalo mediano.

n= número total de observaciones.

FA= frecuencia acumulada anterior al intervalo mediano.
ni = frecuencia absoluta simple del intervalo mediano.
i = tamaño o anchura del intervalo de clase.

Ejemplo 1

Realicemos el cálculo de la mediana en el siguiente ejercicio:




Me= 241+1/2

Me=121

Aplicamos la fórmula para encontrar el valor mediano:

Me= Li+ n/2 – fa (i) / ni




                                 Me= 43.5
1.19 Ejemplo 2:

El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a
menor, y corresponde a un conjunto de valores pares, por lo tanto, la Mediana
será el promedio de los valores centrales.

   21, 19, 18, 15, 13, 11, 10, 9, 5, 3




Ejemplo 3:




Lo cual significa que la mediana se ubica en la posición intermedia entre los
alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:

TABLA:


                   PUNTAJE                      ALUMNOS

                       62                           1

                       62                           2

                       62                           3

                       62                           4

                       62                           5

                       67                           6

                       67                           7

                       67                           8

                       67                           9
67   10

72   11

72   12

72   13

72   14

72   15

72   16

72   17

72   18

77   19

77   20

77   21

77   22

77   23

77   24

77   25

77   26

77   27

77   28

77   29

77   30

82   31

82   32
82                           33

                     82                           34

                     82                           35

                     82                           36

                     82                           37

                     82                           38

                     82                           39

                     82                           40

                     82                           41

                     82                           42

                     82                           43

                     82                           44

                     82                           45

                     82                           46

                     87                           47

                     87                           48

                     87                           49

                     87                           50


El alumno 25 obtuvo puntaje de 77

El alumno 26 obtuvo puntaje de 77

Entonces, como el total de alumnos es par debemos promediar esos puntajes:

Mediana= 77+77/2 = 144/2 =77
La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde
77 hacia abajo (alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron
puntaje de 77 hacia arriba (alumnos 26 hasta el 50 en el cuadro).


2     MODA

DEFINICIÓN.- Es la medida que indica cual dato tiene la mayor frecuencia en
un conjunto de datos; o sea, cual se repite más. Es el valor que se presenta
con mayor frecuencia en un conjunto de datos. A una distribución que tiene una
sola moda se le denomina un modal. Para un conjunto de datos poco
numerosos, en los que no se repite ningún valor, no existe moda. Cuando dos
valores no adyacentes tienen frecuencias máximas similares, se dice que la
distribución es bimodal. A las distribuciones de mediciones que tienen varias
modas se le denomina multimodales. ((Kazmier & Díaz Mata))

El valor que más a menudo se repite en un conjunto de datos. Está
representado por el punto más alto de la curva de distribución de un conjunto
de datos”. ((Levin Richard & Rubin David, 1996:p.140).)

2.1     CARACTERÍSTICAS DE LA MODA.

1. En su cálculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el método de
      designación de los intervalos de clases.
3. No está definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases
      abiertas.
5. No es afectada por valores extremos.

2.2     FORMAS DE CÁLCULO:

Para datos no agrupados, por simple observación se puede determinar el valor
o los valores de la moda, si es que existieran.

Si tenemos los siguientes valores: 4, 5, 7, 5, 8, 1, 3, 5, 6, 8, 5
Procedemos a ordenarlos para mayor facilidad de observación: 1, 3, 4, 5, 5, 5,
5, 6, 7, 8, 8.

En este caso el valor modal es 5 porque es el que se repite el mayor número
de veces en este grupo. Para el caso de datos agrupados en una serie
ordenada de frecuencias, se considera únicamente la mayor frecuencia y el
valor de la variable será el valor modal.

      a) Cuando trabajamos con datos agrupados en una tabla de distribución de
         frecuencias, deberemos considerar los siguientes pasos:
      b) Considerar el intervalo que mantiene la frecuencia absoluta simple más
         alta, lo que sería intervalo modal.
      c) Determinar la diferencia entre la frecuencia del intervalo modal y del pre
         modal.
      d) Determinar la diferencia entre la frecuencia del intervalo modal y del post
         moda



2.3     DATOS AGRUPADOS:




 1= Es el exceso de frecuencia de la clase modal con respecto a la clase
contigua anterior a ella.
                               INTERVALO           fi
 2= Posterior a ella.
                                   28-38           2
                                   38-48           7
                                   48-58           7
                                   58-68          14
                                   68-78          15
                                   78-88           8
                                   88-98           3
2.4   CUARTILES

Los cuartiles son los tres valores de la variable que dividen a un conjunto de
datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75%
de los datos.

Q2 Coincide con la mediana.

2.5   CÁLCULO DE LOS CUARTILES

1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la expresión

. K*N/ 4, K=1, 2,3

Número impar de datos

2, (Q1)

5, (Q2)

3, (Q3)…. 6, 7, 4, 9
Número par de datos

2, 5,3, 4, 6, 7,1, 9




2.6    CÁLCULO DE LOS CUARTILES PARA DATOS AGRUPADOS

En primer lugar buscamos la clase donde se encuentra,
en la tabla de las frecuencias acumuladas.




2.7 EJERCICIOS DE CUARTILES

Calcular los cuartiles de la distribución de la tabla:


                       DATOS                 fi    Fi

                       [50, 60)              8     8

                       [60, 70)              10    18

                       [70, 80)              16    34

                       [80, 90)              14    48

                       [90, 100)             10    58

                       [100, 110)            5     63

                       [110, 120)            2     65

                       TOTAL                 65
1. Cálculo del primer cuartil




   2. Cálculo del segundo cuartil




   3. Cálculo del tercer cuartil




                                   DECILES

 Los deciles son los nueve valores que dividen la serie de datos en diez
   partes iguales. ((Kazmier & Díaz Mata, 1993:)
 Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de
   los datos D5 coincide con la mediana. (((Masson /Lind /Marchal))

CÁLCULO DE LOS DECILES

En primer lugar buscamos la clase donde se encuentra, en la tabla de las
frecuencias acumuladas.
EJERCICIO DE DECILES

Calcular los deciles de la distribución de la tabla:

                           DATOS              fi       Fi

                          [50, 60)            8        8

                          [60, 70)            10       18

                          [70, 80)            16       34

                          [80, 90)            14       48

                          [90, 100)           10       58

                          [100, 110)          5        63

                          [110, 120)          2        65

                          TOTAL               65



   1. Cálculo del primer decil




   2. Cálculo del segundo decil




   3. Cálculo del tercer decil
4. Cálculo del cuarto decil




5. Cálculo del quinto decil




6. Cálculo del sexto decil.




7. Cálculo del séptimo decil
8. Cálculo del octavo decil




   9. Cálculo del noveno decil




                                PERCENTILES

 Los percentiles son los 99 valores que dividen la serie de datos en 100
   partes iguales. (http://www.monografia.com/estadistica).




 Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de
   los datos. (http://www.monografias.shtml)

P50 coincide con la mediana.

Cálculo de los percentiles

En primer lugar buscamos la clase donde se encuentra, en la tabla de las
frecuencias acumuladas.
EJERCICIO DE PERCENTILES

Calcular el percentil 35 y 60 de la distribución de la tabla:

                            DATOS          fi     Fi
                        [50, 60)           8      8
                        [60, 70)           10     18
                        [70, 80)           16     34
                        [80, 90)           14     48
                        [90, 100)          10     58
                        [100, 110)         5      63
                        [110, 120)         2      65
                             TOTAL         65


   1. Percentil 35




   2. Percentil 60
ORGANIZADOR GRAFICO DE LAS MEDIDAS DE TENDENCIA CENTRAL



                      Medios de Tendencia Central



                      Son los valores centrales de
                      una serie de datos que se
                      desea investigar.




   Media Aritmética             Mediana                    Moda



                                               C




                            Valor promedio           Es el número que más se repite
                                Central              en 1 distribución de frecuencias


   Valor promedio
       Central
Jonathanharo
NIVELES DE LOGRO                                                             ACTIVIDADES


                                              MEDIADO                                                      AUTÓNOMO


TEÓRICO BÁSICO          Análisis de las medidas de tendencia central en el           consulta de las medidas de tendencia central mediante la
                         Aula                                                          aplicación de las TIC´S

                        Lectura comprensiva de frecuencias            y de las       lectura comprensiva de los conceptos de las medidas de
                         medidas de tendencias Central                                 tendencia central




TEÓRICO SUPERIOR        Análisis de la realización de las tablas de frecuencias      Aplicación de los ejercicios propuestos
                         con datos agrupados y datos no agrupados
                                                                                      Realización de consultas de todos los conceptos básicos
                            Toma de decisiones para realizar los ejercicios con
                            la aplicación de las Medidas de tendencia central


TEÓRICO     PRÁCTICO        Aplicación en ejercicios de la teoría analizada            Realización de ejercicios
ACEPTABLE
                            Formulación de alternativas de solución                    Elaboración de mente factos y lectura comprensiva


TEÓRICO     PRÁCTICO    Análisis de los problemas que suceden en la                  Aplicación de ejercicios con datos reales del Banco Central
AVANZADO                    sociedad.                                                   del Ecuador.
Jonathanharo
CAPITULO II


                           MEDIDAS DE DISPERSIÓN


 Es la diferencia entre dos valores seleccionados del conjunto de datos
      Comprendemos pues, a la vista de estos ejemplos, la necesidad de
      conocer otras medidas, aparte de los valores de centralización, que nos
      indiquen la mayor o menor desviación de cada observación respecto de
      aquellos valores. Las medidas de desviación, variación o dispersión son:
      Rango o amplitud, desviación media y desviación típica. ((Webster)


 También conocidas como medidas de variabilidad. En contraste, estas
      medidas se encargan de describir la variabilidad entre los valores”
      ((Kazmier & Díaz Mata,)




2.8     RANGO, AMPLITUD TOTAL O RECORRIDO

2.9     DEFINICION


 Diferencia entre el valor observado más alto y el más pequeño. ((Masson
      /Lind /Marchal, 2000: p.106).)


 El rango se suele definir como la diferencia entre los dos valores
      extremos que toma la variable. Es la medida de dispersión más sencilla y
      también, por tanto, la que proporciona menos información. Además, esta
      información puede ser errónea, pues el hecho de que no influyan más de
      dos valores del total de la serie puede provocar una deformación de la
      realidad. La amplitud total o rango se define como la diferencia entre el
      valor máximo y el valor mínimo de un conjunto de datos. Cuando la
      variable sea continua, para el cálculo deben utilizarse los límites exactos.
      (http://www.monografia.com/estadistica)
2.10 CARACTERÌSTICAS

2.11 Características del Rango


1. Es fácil de calcular.
2. Es comúnmente usado como una medida eficaz de variabilidad.
3. Es comprensible para cualquier persona, aún cuando no conozca de
   estadística.

2.12 FORMULA




Dónde:
X máx = Valor máximo

X mín = Valor mínimo

r = rango


2.13 FORMAS DE CÁLCULO.


Comparemos, por ejemplo, estas dos series:

Serie 1: 1 5 7 7    8      9   9 10 17

Serie 2: 2 4 6 8 10 12 14 16 18

Ambas series tienen rango 16, pero están desigualmente agrupadas, pues
mientras la primera tiene una mayor concentración en el centro, la segunda
se distribuye uniformemente a lo largo de todo el recorrido.

El uso de esta medida de dispersión, será pues, bastante restringido.
3     LA VARIANZA

3.1   DEFINICION


El valor de la varianza, desde el punto de vista práctico, es un poco
complicado de entender, porque las unidades asignadas a ellas son
cuadradas, tales como metros cuadrados. Para convertir esta medida de
variabilidad en unidades originales, podemos tomar la raíz cuadrada de la
varianza (S2), obteniendo la desviación estándar de una muestra. La
desviación estándar sirve como medida básica de variabilidad.

“La varianza es la media aritmética de los cuadrados de las desviaciones de
las observaciones respecto de su media aritmética. Es una medida
importante de dispersión”. ((Webster) ((Webster, 2000: p. 72).)

La varianza es similar a la desviación media, porque se basa en la diferencia
entre cada uno de los valores del conjunto de datos y la media del grupo. La
diferencia consiste en que, antes de sumarlas se eleva al cuadrado cada una
de las diferencias. Para una población, se presenta la varianza mediante v
(x) o, en forma más típica mediante la letra σ² (que se lee “sigma cuadrado”).
((Kazmier & Díaz Mata, 1993:)

FORMULA:

                                POBLACIÓN




Dónde:
N= total de observaciones de la población
Xi= variable
μ = media poblacional
σ ²= varianza
MUESTRA




Dónde:
n= tamaño de la muestra
Xi= valores de la muestra
      = media muestral
S2 = varianza



3.2    FORMA DE CÁLCULO


El número de días necesarios por 10 equipos de trabajadores para terminar
10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61,
64, 60, 71, y80 días. Calcular la varianza.
Solución: Se suman todos los valores de una variable dividida entre el
número total de datos de los que se dispone:




Luego, se toman todos los valores dados y la media obtenida, se sustituye
en la fórmula de la varianza.




σ ²= 427,61
3.3   DESVIACIÓN MEDIA

3.4   DEFINICIÓN


Es la medida de dispersión más importante, ya que se emplea como una
medida para comparar la dispersión en dos o más conjuntos de
observaciones”. ((Masson /Lind /Marchal, 2000: p.106).)

La desviación típica de un conjunto de datos es una medida de cuánto se
desvían los datos de su media. Esta medida es más estable que el recorrido
y toma en consideración el valor de cada dato. También se puede decir que
es la raíz cuadrada de la varianza. (((Masson /Lind /Marchal))

Puede definirse como la media aritmética de las desviaciones de cada uno
de los valores con respecto a la media aritmética de la distribución, y de
indica así:

                                          x   x
                                DM
                                         N

Nótese que se toman las desviaciones en valor absoluto, es decir, que la
fórmula no distingue si la diferencia de cada valor de la variable con la media
es en más o en menos. Ya se habrá advertido que esta expresión sirve para
calcular la desviación media en el caso de datos sin agrupar. Se tiene los
valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviación media de estos
valores.

                    X            x x              x
                    2             -3              3
                    2              3              3
                    4             -1              1
                    4             -1              1
                    4             -1              1
                    5              0              0
                    6              1              1
                    7              2              2
                    8              3              3
                    8              3              3
DM = 1,8 Veamos ahora cómo se calcula la desviación media en el caso de
datos agrupados en intervalos.

                                         ni x
                                 DM
                                         N

Donde observamos que ahora las desviaciones van multiplicadas por las
frecuencias de los intervalos correspondientes. Además, las desviaciones
son de cada centro, o marca de clase, a la media aritmética. Es decir,

                                      ni ( x m   x)
                             DM
                                          N

Ejemplo: Para hallar la desviación media de la siguiente tabla referida a las
edades de los 100 empleados de una cierta empresa:

                          Clase          ni

                          16-20          2

                          20-24          8

                          24-28          8

                          28-32          18

                          32-36          20

                          36-40          18

                          40-44          15

                          44-48          8

                          48-52          3
Veamos cómo se procede:

  Marca de           ni          xm           ni xm       x   x    ni     x   x

    Clase
 16-20         2            18           36           16,72       33,44

 20-24         8            22           176

 24-28         8

 28-32         18

 32-36         20

 36-40         18

 40-44         18

 44-48         8

 48-52         3

               100

 DM = 6,09

 La desviación media viene a indicar el grado de concentración o de
 dispersión de los valores de la variable. Si es muy alta, indica gran
 dispersión; si es muy baja refleja un buen agrupamiento y que los valores
 son parecidos entre sí.

 3.5   DESVIACIÓN TÍPICA


 Es sin duda la medida de dispersión más importante, ya que además sirve
   como medida previa al cálculo de otros valores estadísticos.


 La desviación típica se define como la raíz cuadrada de la media de los
   cuadrados de las desviaciones con respecto a la media de la distribución.
   Es decir,
2
        x x
S
         N




Para datos sin agrupar, o bien:

                   2
        x x
S
        N


      3.6 CÁLCULO DE LA DESVIACIÓN TÍPICA PARA DATOS NO
                          AGRUPADOS EN CLASES
Veamos la fórmula anterior aplicada a un caso concreto.

Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.

                                                                2
                          X              x     x        x   x


                          5              -5,2          27,04
                          8              -2,2          4,84

                          10             -0,2          0,04
                          12             1,8           3,24
                          16             5,8           33,64



Primero hallamos x = 10,2

Luego S = 13,76 3,71

       3.7 CÁLCULO DE LA DESVIACIÓN TÍPICA PARA DATOS
       AGRUPADOS EN CLASES Y AGRUPADOS POR FRECUENCIAS


a) Método largo: Se aplica la siguiente fórmula

            fx 2
S
        N

Donde x            xm   x y f es la frecuencia absoluta de cada intervalo.
b) Método abreviado o corto: La fórmula a utilizar es:

                                                         2
                                       fd 2         fd
                            S   I
                                       N            N


Dónde:

I : amplitud de la clase

D: distancia en clases desde cada una en concreto a la clase que contiene a
la media supuesta A.

Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen así:


                           Clases             f

                           150 – 155          3

                           155 – 160          6

                           160 – 165          12

                           165 – 170          18

                           170 – 175          25

                           175 – 180          17

                           180 – 185          10

                           185 – 190          7

                           190 – 195          4

                           195 – 200          1

                                              103


Respuesta: S = 9,56
4   PASOS PARA DESCARGAR E INSTALAR EL SPSS


    1. Prender el computador
    2. Descargar el programa SPSS
    3. Entrar en la página 4 shared
    4. Clic en archivos y poner el nombre del programa y buscar
    5. Clic en descargar SPSS
    6. Clic en descargar archivo esperar algunos segundo
    7. Clic en descargar archivo
    8. Asegurarse de no estar conectado a internet: durante la instalación el
       programa
       Para desconectar el acceso a la red hacer clic en Inicio
    9. Panel de control
    10. Conexiones de red.
    11. Luego hacer clic con el botón secundario del mouse en el ícono de la
       placa de red y hacer clic en "Desactivar".
12. ) Ir a la carpeta donde se ubica el archivo "SPSS 17 Setup.exe" y
   hacer doble clic en el mismo.




13. Se abrirá una ventana que muestra el progreso de la instalación.
14. Se abre otra ventana. Seleccionar "Licencia de usuario individual" y
   hacer clic en "Siguiente >". En la siguiente ventana hacer clic en
   "Acepto los términos del contrato de licencia" y hacer clic en
   "Siguiente >". En la ventana de "Información de última hora" hacer clic
   en "Siguiente >".
15. Se abre una nueva ventana
   a) Completar los campos "Nombre de usuario" y "Organización" con
       los datos que se desee.
   b) Ir a la carpeta donde se ubica el archivo "keygen.exe" y hacer
       doble clic en el mismo.
   c) Atención: antes de continuar, tener en cuenta que los códigos
       mostrados aquí pueden diferir de los que muestra el programa en
       su computadora (se recomienda utilizar solamente los códigos
       mostrados en el programa que se utiliza al instalar y no los
       mostrados aquí
16. Se abre una ventana para ingresar licencia y registro de SPSS. Hacer
   clic en "Aceptar".
17. Se abre una nueva ventana. Seleccionar "Conseguir una licencia para
   mi producto ahora".
18. Clic en siguiente
19. Introducir el código de autorización que está debajo del botón
   "Generate" del keygen mencionado en 5b. Hacer clic en "Siguiente >".
Aparece una ventana que indica un error en la conexión a internet.
   Hacer clic en "Siguiente >".
20. Clic en siguiente para que se instale el programa
21. Luego clic en inicio programas spss Aparece una ventana que indica
   las licencias de las que se dispone. Hacer clic en "Siguiente >".
22. Se abre una nueva ventana.       Seleccionar "Conseguir una licencia
   para mi producto ahora".
23. Luego se introduce la licencia del producto
24. Clic en siguiente
25. Para pasar el idioma del programa a español
26. Abrir un archivo .sav o alguno de la carpeta Samples.

En el menú "Edit" hacer clic en el botón "Options..." En la pestaña
"General", en el área "Output", en la sección "Language" hacer clic la lista
desplegable (el triángulo que apunta hacia abajo) y hacer clic en
"Spanish".

  Repetir el paso 19 en la sección "User Interface" y hacer clic en "OK".




27. Para reconectar el acceso a la red hacer clic en Inicio / Panel de
   control / Conexiones de red. Luego hacer clic con el botón secundario
   del mouse en el ícono de la placa de red y hacer clic en "Activar".
4.1   PASOS PARA RESOLVER EL CASO EN SPSS:


1. Inicio/Programs/SPSS 17 for Windows/SPSS Para Windows.




2. Hacemos clic en la opción “Introducir datos” de la ventana de Bienvenida y
aceptamos.
3. Seleccionamos en la parte inferior de la ventana la opción “Vista de
Variables”, y procedemos a crear una variable




4. En la parte inferior de la ventana seleccionamos la opción “Vista de
datos”, en la columna donde vemos el nombre de la variable procedemos a
ingresar los datos al azar.
5. Para ordenar los datos ya sea en forma ascendente o descendente:
Datos/Ordenar casos.




6. En esta ventana seleccionamos la variable y la trasladamos haciendo clic
en la flecha de color negro.




7. Una vez que hemos trasladado la variable, seleccionamos el Orden de
clasificación (en este caso Descendente) y aceptamos.
8. En la ventana principal de SPSS, observamos que los datos se
encuentran ordenados de tal forma (de mayor a menor).

9. Para la obtención de Intervalos: Transformar/Recodificar/En distintas
variables…




10. En la ventana “Recodificar en distintas variables”, trasladamos la variable
“Exportaciones de Girasol” haciendo clic en la flecha de color negro.




11. En la opción “Variable de resultado” debemos colocar distintos nombres
en las casillas de Nombre y Etiqueta.




12. Hacemos clic en la opción “Cambiar” y posteriormente en la opción
“Valores antiguos y nuevos…”.
13. Dentro de la ventana “Recodificar en distintas variables: Valores antiguos
y nuevos”, escogemos la opción “Rango:” iremos ingresando los intervalos,
además hemos de marcar la opción “Las variables de resultados son
cadenas” y colocamos una cantidad (20), en la opción “Valor nuevo”
volveremos a ingresar los intervalos y los iremos añadiendo (opc. Añadir)
hasta terminar.




14. Aquí nos presentan ya los datos de los intervalos ingresados en su
totalidad.




15. Hacemos clic en la opción “Continuar” y tendremos en la Ventana
principal de SPSS los datos en forma de intervalo.
16.    Para    desarrollar    las    distintas    actividades   estadísticas:
Analizar/Estadísticos descriptivos/Frecuencias…




17. Dentro de la ventana “Frecuencias”, seleccionamos la Variable
“Exportaciones de Girasol” y la trasladamos haciendo clic en la flecha de
color negro.

18. Posteriormente hacemos clic en la opción “Estadísticos”.
19. Ya en la ventana “Frecuencias: Estadísticos”, marcamos todas las
operaciones estadísticas que necesitemos y hacemos clic en “Continuar”.




20. De retorno en la ventana “Frecuencias”, hacemos clic en la opción
“Gráficos”, seleccionamos la mejor gráfica y Hacemos clic en la opción
“Continuar”.

Gráficos histogramas.




21. Nuevamente en la ventana “Frecuencias”, hacemos clic en la opción
“Aceptar” y podremos visualizar los resultados finales.
Jonathanharo
5   ORGANIZADOR GRAFICO DE LAS MEDIDAS DE DISPERSIÓN


                         Medidas de Dispersión



                   Son aquellas medidas que se
                   encuentran alejadas del centro de
                   una distribución de frecuencias.




      Rango          Desviación            Desviación   Varianza
                       Media                 Típica
NIVELES DE LOGRO                                                ACTIVIDADES

                                                  MEDIADO                                          AUTÓNOMO

TEÓRICO BÁSICO                Análisis de las medidas dispersión.                        consulta     de las medidas de
                                                                                           dispersión mediante la aplicación
                              Lectura comprensiva de las medidas de dispersión            de las TIC´S
                                                                                          Lectura comprensiva de los
                                                                                           conceptos de las medidas de
                                                                                           dispersión

TEÓRICO SUPERIOR              Análisis de la realización de las medidas de dispersión    Aplicación   de    los   ejercicios
                               con datos agrupados y datos no agrupados                    propuestos
                              Toma de decisiones para realizar los ejercicios con la     Realización de consultas de todos
                               aplicación de las Medidas de dispersión                     los conceptos básicos

TEÓRICO PRÁCTICO ACEPTABLE     Aplicación en ejercicios   de la teoría analizada y        Realización de ejercicios a través
                                conocimiento del programa spss para la aplicación de        del programa SPSS
                                las medidas de tendencia central.
                                                                                           Elaboración de mente factos     y
                               Formulación de alternativas de solución.                    lectura comprensiva

TEÓRICO PRÁCTICO AVANZADO     Análisis de los problemas que suceden en la sociedad.      Aplicación de ejercicios con datos
                                                                                           reales de la Banco central del
                                                                                           Ecuador
CAPITULO III

5.1   TEMA: MUESTREO


Existen estudios en el que queremos conocer ciertas características de un
grupo de personas o autos a los que llamaremos población de manera que no
se los puede estudiar a todos porque son numerosos o porque su naturaleza se
vuelve inaccesible, existe otro recurso que es estudiar una parte que se llama
MUESTRA, generalmente cuando el n>100 se lo llama población pero si n<100
a toda la población se la puede llamar muestra.

Se puede estudiar el muestreo estadístico y el muestreo no estadístico en que
el primero se lo escoge completamente al azar sin ninguna instrucción
predeterminada en cambio el segundo tiene una instrucción al seleccionar los
elementos de la muestra.

                                        MUESTRA

DEFINICION

Una muestra es un conjunto de medidas u observaciones tomadas a partir de
una población dada; es un subconjunto de la población. Desde luego, el
número de observaciones en una muestra es menor que el número de posibles
observaciones en la población, de otra forma, la muestra será la población
misma. Las muestras se toman debido a que no es factible desde el punto de
vista económico usar a toda la población. En algunos casos es imposible
recolectar   todas    las    posibles     observaciones   en   la   población.
http://www.vitutor.com/estadistica/descriptiva/a_1.html

Una muestra es un conjunto de medidas u observaciones tomadas a partir de
una población dada; es un subconjunto de la población. Desde luego, el
número de observaciones en una muestra es menor que el número de posibles
observaciones en la población, de otra forma, la muestra será la población
misma. Las muestras se toman debido a que no es factible desde el punto de
vista económico usar a toda la población. En algunos casos es imposible
recolectar   todas    las    posibles    observaciones    en   la   población.
http://www.vitutor.com/estadistica/descriptiva/a_1.html

EJEMPLO

        Si se desea estimar el gasto promedio anual de los estudiantes del
        C.B., se extraería una muestra formada por cierto número de
        estudiantes, se determinaría el gasto anual correspondiente a cada
        uno de ellos y después se obtendría el promedio. Se utiliza una
        muestra debido a que simplemente no se tiene el tiempo ni el recurso
        para establecer el contacto con todos los estudiantes del C.B., aun
        cuando es posible hacerlo.

5.2   MUESTREO PROBABILÍSTICO:


Aleatorio: Asigna un número a cada uno, selecciona la muestra a través de
números aleatorios.

El procedimiento empleado es el siguiente: 1) se asigna un número a cada
individuo de la población y 2) a través de algún medio mecánico (bolas dentro
de una bolsa, tablas de números aleatorios, números aleatorios generados con
una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario
para completar el tamaño de muestra requerido. Este procedimiento, atractivo
por su simpleza, tiene poca o nula utilidad práctica cuando la población que
estamos manejando es muy grande. ((Kazmier & Díaz Mata,)


Muestreo en el que todas las muestras tienen la misma probabilidad de ser
seleccionadas y en el que las unidades obtenidas a lo largo del muestreo se
devuelven a la población. 2) Muestreo en el que la muestra aleatoria está
formada por variables aleatorias independientes e idénticamente distribuidas a
la variable aleatoria poblacional. Sinónimo de Muestreo aleatorio con
reemplazamiento. http://www.mitecnologico.com/
5.3     Sistemático: Lista completa del universo selecciona cada individuo cada
        10 individuos.


       Se practica cuando se dispone de una lista de todas las unidades
          Muéstrales, en un orden independiente de la variable que se desea
          medir. http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf


       Se elige un individuo al azar y a partir de él, a intervalos constantes, se
          eligen     los      demás      hasta      completar      la     muestra.
          http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html



5.4     Estratégico: Son tamaños de la muestra de cada extracto depende de
        los necesidades.

Muestreo en el que la población se divide previamente en un número de
subpoblaciones o estratos, prefijado de antemano. Dentro de cada estrato se
realiza      un    muestreo      aleatorio   simple.    (http://www.AulaFacil.com,
http://www.AulaFacil.com)

Este muestreo considera categorías típicas diferentes entre sí (estratos) que
poseen gran homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo,
el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de interés estarán representados
adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarán parte de la
muestra. En ocasiones las dificultades que plantean son demasiado grandes,
pues exige un conocimiento detallado de la población. (Tamaño geográfico,
sexos, edades, etc. (muestra. http:// www.wikipedia.)
5.5 MUESTREO NO PROBABILÍSTICO:

5.6    Casual: Entrevista a los individuos en forma casual (Ejemplo: lo que
       pasan por la calle).


       Se trata de un proceso en el que el investigador selecciona directa e
         intencionadamente         los      individuos      de       la     población.
         http://maxsilva.bligoo.com



       Se usa en los casos en no es posible seleccionar los elementos, y deben
         sacarse conclusiones con los elementos que estén disponibles
         http://sitios.ingenieria-usac.edu/teoria.html




5.7    Intencional: Selecciona al individuo según el criterio de un experto
       (Ejemplo: dueños a un restaurante).

       Es muy frecuente su utilización en sondeos preelectorales de zonas que
         en   anteriores    votaciones     han    marcado     tendencias     de     voto.
         http://maxsilva.bligoo.com/Metodos-de-Muestreos-no-Probabilist.html




       Muestreo en el que la persona que selecciona la muestra procura que
         esta sea representativa; por consiguiente, la representatividad depende
         de su intención u opinión, y la evaluación de la representatividad es
         subjetiva. No tiene fundamento probabilístico. http://sitios.ingenieria-.html

5.8    Cuotas: Cada entrevistado debe estar dentro de cada categoría (Ejemplo:
       hombres y mujeres).


       También      denominado       en   ocasiones     "accidental".     Se     asienta
         generalmente sobre la base de un buen conocimiento de los estratos de
         la población y/o de los individuos más "representativos" o "adecuados"
         para los fines de la investigación. http://www.psico.uniovi.es/Dptg.html
 En este tipo de muestreo se fijan unas "cuotas" que consisten en un
         número de individuos que reúnen unas determinadas condiciones, por
         ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes
         en Gijón. (http://www.monografias.shtml)



5.9     Determinar El Tamaño De La Muestra


Hay que tener mucho cuidado en determinar la muestra si es demasiado
grande la investigación puede existir un desperdicio de recursos si es
demasiado pequeña no lleva a tener resultados sin uso práctico.

Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente.

1. Que el objeto y objetivo de la investigación sea interesante.

2. El nivel de confiablidad con el que trabaja se recomienda el 95% ^ 99%,
      significa que de 100 casos, se espera que el 95 de ellos se hallan dentro del
      intervalo construido y que 5 se hallan fuera del intervalo sea a la derecha o
      izquierda.

3. Las probabilidades reales de ciertas características estén presentes en la
      investigación que debe variar entre (0-1) P+Q=1 Ejemplo.

                                  P=0.5; -> Q=0.5

                                  P=0.3; -> Q=0.7

4. El error de muestreo puede ser según el investigador que puede ser entre el
      1% ^ 9% máximo es recomendable entre el 1% ^ 9% máximo es
      recomendable entre el 1% ^5%.

5. Aplicar las fórmulas adecuadas para poblaciones finitas e infinitas.

Si el nivel de coeficiente es 95%.
Si el nivel de confianza es 99%.




5.10 EJEMPLOS:


1.- Se desea calcular e tamaño de la muestra que será aplicado a productos de
papas existen 4528 productores, el error o límite aceptable es del 5%.
2.-Cuando Exista La Probabilidad De Ocurrencia




P^O= probabilidad de ocurrencia.

Una empresa dedicada a la venta de artículos y accesorios para vehículos
desea conocer el grado de aceptación de sus productos entre los propietarios
de vehículos de la ciudad por lo cual se estabilicen las siguientes condiciones.

a) Nivel de confianza 95%

b) N= 46720

c) E= 4%




3.- según un departamento de una empresa consecuencia de un trauma de
coberturas desea conocer los km recorridos durante una semana.

   a) El error muestra máximo no debe pasar a 20km

   b) Nivel de confianza 95,44%        Z=2,05

   c) S= 195 km
5.11 POBLACIÓN FINITA


 Es aquella que indica que es posible alcanzarse o sobrepasarse al contar.
   http://www.gestiopolis.com/recursos/expertpagans/eco/44/estadistica.htm


 Es aquella que posee o incluye un número limitado de medidas y
   observaciones.
   http://www.gestiopolis.com/recursos/experto//pagans/eco/44/estadistica.htm




1.-Suponga que el cantón de Guamote está empeñado en recibir un proyecto
para que sus habitantes tengan acceso a la salud, con las siguientes
condiciones:

X= 95%; z= 1,96

S= Varianza (0,4)2

E =5%

n= (0,4)

n = (1,96)2(0,4)2

(0,05)2

n = 246 viviendas

2.-El gerente de una estación de televisión quiere calcular el porcentaje de
personas que hay en un determinado programa se pide una muestra que le
somete a una encuesta con las siguientes condiciones;

   a) E= 3%

   b) = 99%
c) La proporción de personas que presume que miran el programa se
      estima en el 65%




                                  n = 1683

3.-El cantón Espejo tiene 15614 habitantes se dedica a investigar sobre la
aceptación para la ordenanza municipal. Para dicha investigación se encarga la
UPEC aplicando una encuesta. A pedido del Alcalde de la localidad, el error
máximo es de 2,5%




                                  n = 1451
6     CAMPANA DE GAUS




6.1   Ejemplos de la campana de GAUS:

6.2   1.) Calcular La Probabilidad Del Evento


                                P (-2.8   Z     0)

                                   P= 0.4974

                                  P= 49.74%
DESARROLLO

a) P (-3.6 Z       0)      Z = -3.6       b)P (-2.02 Z   0)   Z = -2.02
 P= 0.4998                                P= 0.4783
 P= 49.98%                                P= 43.83%




      C) P (-1.4    Z   0)     Z = -1.4
P= 0.4192
P= 41.92%




6.3    2.) Calcular La Probabilidad Del Evento


P (1.02     Z      2.97)

1.02 y 2.96= A (0^2.97)- A (0^1.02)

= 0.4985 – 0.3461

= 0.1524

=15.24%
6.4     DESARROLLO


a) P (0.5   Z   1.09)                b) P (2.04 Z 3.16)                c) P (1.84 Z 1.96)
0.5 y 1.09 = A (0^1.09)- A           0.5 y 3.16 = A (0^3.16)- A        1.84 y 1.96= A(0^1.96)- A
(0^0.5)                              (0^0.5)                           (0^1.84)
= 0.3621- 0.1915                     = 0.4992-0.4793                   = 0.4750– 0.4671
= 0.1706                             = 0.0199                          = 0.1524
=17.06%                              =01.99%                           =00.79%




    3.) Calcular La Probabilidad Del Evento

    P (-3.5 Z      -3.08)

    A (-3.5 ^ - 3.08)= A (-3.5^0) - A (-3.08 ^0)

    = 0.4998-0.4990

     = 0.0008= 00.08%

    DESARROLLO

       a) P (--2.36 Z       -1.43)                     b) P (-1.75 Z    -0.45)
    A (-2.36 ^ - 1.43)= A (-2.36 ^0) - A (--1.43   A (-1.75 ^ - 0.45)= A (-1.75 ^0) - A (-0.45^0)
    ^0)                                            = 0.4599 -0.1736
    = 0.4909-0.4236                                 = 0.2863= 28.63%
    = 0.0673 = 06.73%
4) Calcular la probabilidad del evento

P (-1.03 A 2.94)

P (-1.03   Z    2.94)

A (-1.03 ^ 2.94)= A (-1.03 ^ 0) + A (0 ^ 2.94)

                 = 0.3485 + 0.4984

                 = 0.8469=84.69%

DESARROLLO

   a) P (-0.5 Z 12.76)                              a) P (-0.2 Z 1.01)
A (-0.5 ^ 16.76)= A (-0.5 ^ 0) + A (0 ^ 12.76)   A (-0.2 ^ 1.01)= A (-0.2 ^ 0) + A (0 ^ 1.01)
               = 0.1915+0.4971                                   = 0.0793 + 0.3438 +0.3438
               = 0.6886 =68.86%                                  = 0.4231=42.31%




5.) Calcular La Probabilidad Del Evento

P (Z > 2.03)

A=0.5-área entre

A=0.5-0.47=0.0212

A=2.12%
DESARROLLO

a) P (Z >1.96)                                                         a) P (Z >2.33)

A=0.5-área entre 1.96              a)   P (Z >2.58)                   A=0.5-área entre 2.33

A=0.5-0.4750=0.025                A=5-área entre 2.58                 A=1-0.4901 = 0.5099

A=2.5%                            A=5-0.4950=4.505                     A=50.99%




                                   A=450.5%




         7) Calcular la probabilidad del evento.

         DESARROLLO

         a) P (Z < -1.96)                               b) P (Z < -2.58)
         P=0.5-0.4750                                   P=0.5-0.4750
         P=0.025                                        P=0.05
         p=2.5%                                         P=5%




         7     VARIABLES

         7.1    DEFINICIÓN DE VARIABLE
                Una variable estadística es cada una de las características o cualidades
                  que poseen los individuos de una población.
 Son aquellas cualidades o características que tiene un individuo o
         población y puede ser medido tanto cuantitativa como cualitativamente.
         http://www.e-torredebabel.com/Psicologia/Vocabulario/Variable.htm

7.2     EJEMPLO DE VARIABLES:


      1. Edad de las personas

      2. Nacionalidad

      3. Nivel de ingresos

      4. Sexo motivación

      5. Color de piel

      6. Nivel de ansiedad

      7. Número de nacimientos

      8. Estado civil

      9. Peso

      10. Estatura

      11. Religión

7.3     CLASIFICACIÓN DE LAS VARIABLES:


      a) Variable independiente

      b) Variable dependiente

7.4     VARIABLE DEPENDIENTE:


En investigación, se denomina variable independiente a aquélla que es
manipulada por el investigador en un experimento con el objeto de estudiar
cómo incide sobre la expresión de la variable dependiente. A la variable
independiente también se la conoce como variable explicativa, y mientras que a
la variable dependiente se la conoce como variable explicada. Esto significa
que las variaciones en la variable independiente repercutirán en variaciones en
la variable dependiente.http://www.cx/ /var_dependientes_independientes.htm

7.5     VARIABLE INDEPENDIENTE:


Es aquella cuyo valor no depende de otra variable. Se podría decir que son
características controladas por el investigador. Los cambios en los valores de
este tipo de variables determinan cambios en los valores de otra (variable
dependiente).http://grupos.emagister.comvariables.com




EJEMPLOS:

VARIABLE INDEPENDIENTE                        VARIABLE DEPENDIENTE

       Consumo Excesivo De Cigarrillo         * Causa Enfermedades Graves
         En El Ser Humano.
       Mayor Demanda De Un Producto           * Genera Más Producción.
       Mayores Exportaciones                  * Generan Más Ingresos Al
         País.
       Menor Control En La Frontera           * Causa Mayor Contrabando.

a. Variable independiente

Es aquella característica o propiedad que supone ser la causa del fenómeno
estudiado. Además es la variable que el investigador manipula.

Ejemplo:

       El uso de dentífrico.

       Años estudiados.

b. Variable dependiente

Es el factor que es observado y medido para determinar el efecto de la variable
independiente.
Ejemplo:

   El uso de un dentífrico (v. independiente), quita o no caries (v.
     dependiente).
   El consumo excesivo de chocolates (v. independiente), produce caries
     (v. dependiente).
   Los años de estudio (v. independiente), aumenta el salario (v.
     dependiente).
NIVELES DE LOGRO                                                            ACTIVIDADES


                                                      MEDIADO                                                    AUTÓNOMO

                               Lectura comprensiva        del muestreo         y     de   la    Organizador gráfico del muestreo
TEÓRICO BÁSICO                  determinación del tamaño de la muestra
                                                                                                 Consulta y lectura comprensiva           de   los
                                   Análisis de la Campana de Gauss                               conceptos de muestreo




TEÓRICO SUPERIOR               Análisis de la realización de las gráficas de la campana         Análisis de los conceptos investigados
                                de Gauss.
                                                                                                 Comprensión de lectura.
                                  Toma de decisiones para realizar los ejercicios con la
                                   aplicación del muestreo


TEÓRICO            PRÁCTICO        Aplicación en ejercicios de la teoría analizada                  Aplicación de los ejercicios propuestos del
ACEPTABLE                                                                                             muestreo
                                   Formulación de alternativas de solución
                                                                                                   Realización de ejercicios de la campana de
                                                                                                    gauss


TEÓRICO            PRÁCTICO    Análisis de los problemas que suceden en la sociedad.            Aplicación de ejercicios     con   datos reales
AVANZADO                                                                                          planteados por el docente
                               Análisis de las variables dependientes e independientes
                                de la sociedad.                                                  Investigación de ejemplos de las variables.
CAPITULO IV

7.6   TEMA: ESTADÍSTICA INFERENCIAL

Rama de la estadística que estudia el comportamiento y propiedades de las
muestras, y la posibilidad y límites de la generalización de los resultados
obtenidos a partir de aquellas a las poblaciones que representan. Esta
generalización de tipo inductivo, se basa en la probabilidad. También se le
llama también estadística matemática, por su complejidad matemática en
relación a la estadística descriptiva. (muestra. http:// www.wikipedia.)

       Tiene como objetivo generalizar las propiedades de la población bajo
       estudio, basado en los resultados de una muestra representativa de la
       población.

Es una parte de la Estadística que comprende los métodos y procedimientos
estadísticos en los que interviene la aplicación de modelos de probabilidad y
mediante los cuales se realiza alguna afirmación sobre poblaciones con base
en la información producida por muestras para deducir propiedades (hacer
inferencias) de una población, a partir de una pequeña parte de la misma
(muestra). (http://www.Wikipedia: Estadísticas.)

7.7   CORRELACIÓN


La correlación indica la fuerza y la dirección de una relación lineal entre dos
variables aleatorias. Se considera que dos variables cuantitativas están
correlacionadas cuando los valores de una de ellas varían sistemáticamente
con respecto a los valores homónimos de la otra: si tenemos dos variables (A y
B) existe correlación si al aumentar los valores de A lo hacen también los de B
y viceversa. La correlación entre dos variables no implica, por sí misma,
ninguna relación de causalidad (http://es.correlacion-estadistica.org)

7.8   Coeficiente de correlación.- se expresa de una manera cuantitativa la
      magnitud y división de una relación se la designa con la letra x puede
      variar entre +1 a -1 el signo nos dice si la relación es positiva o negativa.
Como +1 es el mejor número posibles este representa una relación perfecta de
una relación positiva.

Si el coeficiente es menor a 1 que la relación es perfecta y la relación es
negativa.

Cuando la correlación es cero (0) no existe una relación entre X y Y significa
que X y no crece y dúrese la recta es horizontal.




7.9   Relación lineal.-          Entre dos variables es aquella que puede
      representarse en un plano cartesiano con una mayor exactitud mediante
      una línea recta por la ecuación Y= bx + a




Existen diversos coeficientes que miden el grado de correlación, adaptados a la
naturaleza de los datos. El más conocido es el coeficiente de correlación de
Pearson, que se obtiene dividiendo la covarianza de dos variables por el
producto de sus desviaciones estándar.

EJEMPLOS

La tabla muestra un salario mensual que perciben 5 agentes de ventas, el valor
de dólares.


             Agente      X mercancía   Variable
         Variable        vendida $     salario $    X         Y
         1               0             500          0         500
         2               1000          900          1000      900
         3               2000          1300         2000      1300
         4               3000          1700         3000      1700
         5               4000          2100         4000      2100
La ecuación                   nos indica la relación entre el salario y la
mercadería vendida, esto nos indica que Y se incrementa 0,40 por cada
unitario de X, con esta relación podemos predecir cualquier valor de Y si solo
se conoce el valor de x




Así un agente vende $ 1500 de mercancía y su salario igual a $1100
7.10 COEFICIENTE DE CORRELACIÓN DE PEARSON


Todo coeficiente de correlación que no sea cero indica cierto grado de relación
entre 2 variables, lo que el grado de intensidad es fuerte o débil de una
interpretación matemática pura, el hecha de que 2 variables tienden o
aumentan o disminuir sobre cada uno de ellos.

Matemáticamente entre dos variables r lo interpreta como




Interpretación.- que tan dorado es el coeficiente de orientación desde de r=0
indica cierto grado de relación entre 2 variables que grado.




Intensidad de relación se puede considerar si la relación es fuerte o débil.

EJEMPLO



          ESTUDIANTES               PRUEBA DE          EXAMEN DE AUDICIÓN
                                 HONORABILIDAD
                                     MENTAL
              María                     18                      82
               Olga                     15                      68
             Susana                     12                      60
               Aldo                     9                       32
              Juan                      3                       18
María                        18                    18
               Olga                         15                    32
              Susana                        12                    60
               Aldo                         9                     68
               Juan                         3                     82
               María                        18                    18
               Olga                         15                    82
              Susana                        12                    68
               Aldo                         9                     60
               Juan                         3                     32




7.11 Interpretación.- Que tan elevado es el coeficiente de correlación dado,
      todo r ≠0 indica cierto grado de relación entre 2 variables que grado de
      intensidad de relación se puede considerar si la relación es fuerte o débil.



7.12 Calcular el r de Pearson.


           ESTUDIANTE         COEFICIENTE              PUNTAJE
                              INTELECTUAL
                  1                 110                     1
                  2                 112                    1.6
                  3                 118                    1.2
                  4                 119                    2.1
                  5                 122                    1.8
                  6                 125                    2.6
                  7                 127                     2
                  8                 130                    3.2
                  9                 132                    2.6
                 10                 134                     3
                 11                 136                    3.6
                 12                 138
                 19               100-140                 (1-4)




       COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMAN


Cuando una o más variables son solo de escala ordinal su fórmula matemática
es:




N= números de parejas de rango
Sujeto        Orden dado       Orden dado    DI              Di ²
                   el psicólogo     por el        R( xi) - (yi)
                   A(Rxi)           psicólogo
                                    B(Ryi)

         1                  6                5          1           1
         2                  5                3          2           4
         3                  7                4          3           9
         4              10                   8          2         02.25
         5              2.5                  1         1.5        12.25
         6              2.5                  6         3.5          1
         7                  9                10         1           4
         8                  1                2          1           4
         9              11                   9          2           9
         10                 4                7          3           9
         12                 8                11         3           0
                        12                   12         0




7.13 COEFICIENTE INTELECTUAL

              1                     110                  1
              2                     112                 1.6
              3                     118                 1.2
              4                     119                 2.1
              5                     122                 1.8
              6                     125                 2.6
              7                     127                  2
              8                     130                 3.2
              9                     132                 2.6
              10                    134                  3
              11                    136                 3.6
              12                    138
              19                  100-140              (1-4)
7.14 COEFICIENTE R DE PEARSON


              X             Y        X2        Y2         Xy
              María         18       82        324        1476
              Olga          15       68        225        1020
              Susana        12       60        144        7200
              Aldo          9        32        81         288
              Juan          3        18        9          54



Ex 157            Ey= 260        Ex= 783     Ey= 16296      Exy= 3558




R= 0.98


REGRESIÓN LINEAL


La relación y la correlación están íntimamente ligadas, ambos implican la
relación entre 2 variables y utilizan el mismo conjunto de los datos básicos.

La relación se encuentra el         uso de la relación para determinar una
PREDICCION, cuando la relación es perfecta, esto es cuando todos los puntos
están sobre la recta y se utilizaría para señalar la predicción, la situación se
hace más compleja cuando la relación es imperfecta.

Esta es la recta es la línea de la regresión por los mínimos cuadrados la
distancia vertical en cada punto y la recta representa el error de la producción
parecía el error total de la suma de la producción para que una el error total
seria la suma equilibrada y _ y´

El error total de producción presentado esta dado por                 ecuación
de regresión lineal para reproducir el lado x

Y´=valor reproducido

By = pendiente

Ay= ordenada al origen




Ecuación por calcular los constantes de regresión




7.15 DEFINICIÓN DE CORRELACIÓN LINEAL


En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación
entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay
alguna relación entre las notas de la asignatura Estadística I y las de
Matemáticas I. Una primera aproximación al problema consistiría en dibujar en
el plano R2 un punto por cada alumno: la primera coordenada de cada punto
sería su nota en estadística, mientras que la segunda sería su nota en
matemáticas. Así, obtendríamos una nube de puntos la cual podría indicarnos
visualmente la existencia o no de algún tipo de relación (lineal, parabólica,
exponencial, etc.) entre ambas notas.
Otro ejemplo, consistiría en analizar la facturación de una empresa en un
periodo de tiempo dado y de cómo influyen los gastos de promoción y
publicidad en dicha facturación. Si consideramos un periodo de tiempo de 10
años, una posible representación sería situar un punto por cada año de forma
que la primera coordenada de cada punto sería la cantidad en euros invertidos
en publicidad, mientras que la segunda sería la cantidad en euros obtenidos de
su facturación. De esta manera, obtendríamos una nube de puntos que nos
indicaría el tipo de relación existente entre ambas variables.
En particular, nos interesa cuantificar la intensidad de la relación lineal entre
dos variables.


EJEMPLOS
La ecuación por los mínimos cuadrados esta dado por la ecuaciónde regresión
lineal para predecir Y lado X.




Y´=valor reproducido

by = pendiente

ay= ordenada al origen




Ecuación para calcular la constante de regresión
Ejemplo de aprovechamiento
                                                                    2
    Estudiante         X           Promedio de Y           XY      X
     numero                        calificaciones
        1              110               1                110     12100
        2              112              1.6               179.2   12544
        3              118              1.2               141.6   13424
        4              119              2.1               249.9   14161
        5              122              2.6               317.2   14384
        6              125              1.8               225     15625
        7              127              2.6               330.2   16129
        8              130               2                260     16900
        9              132              3.2               422.4   17421
        10             134              2.6               384.4   17456
        11             136               3                408     18496
        12             138              3.6               496.8   19044




X



    4




    3


    2




    1




                 110         120     130            140
Una psicóloga del desarrollo está interesada si es posible utiliza alturas de los
jóvenes para producir en un posible estatura en la edad adulta y ella reúne las
siguientes datos de la tabla.

   a) Trace la grafica
   b) Obtener la línea de regresión por mínimo cuadrados
   c) En base a estos datos aquí esta estatura podría producir para una
       persona de 20 años si a los 3 años de edad tiene una altura de 42
       pulgadas.


     Individuo     Altura la edad de   Altura a la edad
                   3 años pulgadas     de 20 años y        Xy            X
                                                                          2

                                       pulgada

        1                 30                  59          1770          900
        2                 30                  63          1890          900
        3                 32                  62          1984          1024
        4                 33                  67          2211          1059
        5                 34                  65          2210          1156
        6                 35                  61          2135          1225
        7                 36                  69          2484          1296

        8                 38                  66          2508          1444
        9                 40                  68          2720          1600
        10                41                  65          2665          1681
        11                41                  73          2993          1681
        12                43                  68          2924          1849
        13                45                  71          3195          2025
        14                45                  74          2924          2025
        15                47                  71          3195          2209

        16                48                  75          3330          2304

                                                          3337

                                                          3600

                          618                1077         41956        24408
x




    50


    40


    30

    20




    10
         5   10   15   20   25 30 35 40 45 50 55 60
Una neuróloga sospecha que su vela de exótica es una región del cerebro, se
asociación el comportamiento agresivo del individuo con neurotransmisor
cerebral los datos aparecen en una tabla de nutrición los datos promedios de 6
meses.
                                                                     2
   Menos sujetos   Tabla de nivel   Numero de       XY             Y
                    exótica(Y)       egresos
         1             0.32             6           1.92          0.1024
         2             0.35            3.8          1.33          0.1225
         3             0.38             3          1.140          0.1444
         4             0.41            5.1         2.091          .1681
         5             0.43             3          1.290          0.1849
         6             0.51            2.8         1.938          0.2601
         7             0.53            2.4         1.272          .2809
         8             0.60            3.5         2.100          0.3600
         9             0.63            2.2         14.467         0.3969
x

8

6

4

2

y

                0.3      0.4       0.5   0.6       0.7




    a) Hoja de grafica
    b) Ecuación de regresión lineal
    c) Cuál es el número de actos agresivos que podría producir y éxito
       numérico de menos que todo un nivel de exótica 0.46 min gramos




7.16 EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON R



Cuyo valor oscila entre –1 y +1:
Correlación tiende a ser lineal directa (mayores valores de X significan mayores
valores de Y), y se aproxima a –1 cuando la correlación tiende a ser lineal
inversa.
Es importante notar que la existencia de correlación entre variables no implica
causalidad.


NOTA: si no hay correlación de ningún tipo entre dos v. a., entonces tampoco
habrá correlación lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo
nos dice que no hay correlación lineal, pero puede que la haya de otro tipo.
El siguiente diagrama resume el análisis del coeficiente de correlación entre
dos variable
7.17 Definición y características del concepto de Regresión Lineal


En aquellos casos en que el coeficiente de regresión lineal sea “cercano” a +1
o a –1, tiene sentido considerar la ecuación de la recta que “mejor se ajuste” a
la nube de puntos (recta de mínimos cuadrados). Uno de los principales usos
de dicha recta será el de predecir o estimar los valores de Y que obtendríamos
para distintos valores de X. Estos conceptos quedarán representados en lo que
llamamos diagrama de dispersión:




 La ecuación de la recta de mínimos cuadrados (en forma punto-pendiente) es



             la siguiente

Si queremos estudiar la relación existente entre ambas variables, siguiendo con
el ejemplo anterior referente a la relación entre las ventas de una empresa ( ) t
V y sus gastos en publicidad ( ) t GP, lo que podemos hacer es representar
gráficamente el modelo matemático lineal que podemos considerar para
analizar dicha relación.

EJEMPLO

    Estudiante         IQ         Promedio de             XY       X2
     numero            X                 Y
                                  calificaciones
1                110              1                 110        12100
2                112              1.6               179.2      12544
3                118              1.2               141.6      13424
4                119              2.1               249.9      14161
5                122              2.6               317.2      14384
6                125              1.8               225        15625
7                127              2.6               330.2      16129
8                130              2                 260        16900
9                132              3.2               422.4      17421
10               134              2.6               384.4      17456
11               136              3                 408        18496
12               138              3.6               496.8      19044




     4




     3


     2




     1

                 110        120         130        140
O una psicóloga del desarrollo está interesada si es posible utiliza alturas de
los jóvenes para producir en un posible estatura en la edad adulta y ella reúne
las siguientes datos de la tabla.




   d) Trace la grafica
   e) Obtener la línea de regresión por mínimo cuadrados
   f) En base a estos datos aquí esta estatura podría producir para una
       persona de 20 años si a los 3 años de edad tiene una altura de 42
       pulgadas.

  Individuo     Altura la edad       Altura a la
                   de 3 años         edad de 20        xy          X2
                   pulgadas            años y
                                      pulgada
      1               30                   59         1770         900
      2               30                   63         1890         900
      3               32                   62         1984        1024
      4               33                   67         2211        1059
      5               34                   65         2210        1156
      6               35                   61         2135        1225
      7               36                   69         2484        1296
      8               38                   66         2508        1444
      9               40                   68         2720        1600
      10              41                   65         2665        1681
      11              41                   73         2993        1681
      12              43                   68         2924        1849
      13              45                   71         3195        2025
      14              45                   74         2924        2025
      15              47                   71         3195        2209
      16              48                   75         3330        2304
                                                      3337
                                                      3600

                618                 1077           41956      24408
50


40


30

20


10




              5    10   15   20   25 30 35 40 45 50 55 60




Una neuróloga sospecha que su vela de exótica es una región del cerebro,
se asocia con el comportamiento agresivo del individuo con neurotransmisor
cerebral los datos aparecen en una tabla de nutrición los datos promedios
de 6 meses.
Menos            Tabla de nivel   Numero     de XY              Y2
sujetos          exótica(Y)       egresos
1                0.32             6               1.92          0.1024
2                0.35             3.8             1.33          0.1225
3                0.38             3               1.140         0.1444
4                0.41             5.1             2.091         .1681
5                0.43             3               1.290         0.1849
6                0.51             2.8             1.938         0.2601
7                0.53             2.4             1.272         .2809
8                0.60             3.5             2.100         0.3600
9                0.63             2.2             14.467        0.3969
                 4.16             32.8            14.467        2.0202




            Y



        8

        6

        4

        2

                                                                X
                0.3     0.4       0.5       0.6           0.7
d) Hoja de grafica
e) Ecuación de regresión lineal
f) Cuál es el número de actos agresivos que podría producir y éxito
   numérico de menos que todo un nivel de exótica 0.46 min gramos
7.18 ORGANIZADOR GRAFICO DE CORRELACION Y REGRECION LINEAL


                               CORRELACIÓ
                                   N


          Expresa de una manera cuantitativa la magnitud y
          dirección de una relación entre 2 variables. Se lo designa
          con la letra ry puede variar entre +1 a -1 el signo significa
          si la relación es negativa o positiva.




                                CARACTERÍST
                                   ICAS


                           Relación perfecta (+ o -)
                          Relación Imperfecta (+ o -)
                               Relación Lineal




        COEFICIENT                                        COEFICIENT
           E DE                   CLASIFICACI                E DE
         PEARSON                      ÓN                   SPERMAN
7.19 EJERCICIOS DE CORRELACION Y REGRECION LINEAL


El número de españoles (en millones) ocupados en la agricultura, para los años
que se indican, era:

      Año           1980 1982 1984 1986 1988 1990 1992 1994
      Ocupados 2,1         2,04    1,96   1,74   1,69     1,49   1,25   1,16



a) ¿Podría explicarse su evolución mediante una recta de regresión?

b) ¿Qué limitaciones tendrían las estimaciones hechas por esa recta?

[sol] a) Si; b) No vale para hacer estimaciones alejadas de los años
considerados.

2. Asocia las rectas de regresión y = –x +16, y = 2x – 12, y = 0,5x + 5 a las
nubes de puntos siguientes:




3. Asigna los coeficientes de correlación lineal r = 0,4, r = –0,85 y r = 0,7, a las
nubes del problema anterior.

a) Respectivamente: (c), (b), (a). b) Respectivamente: (a), (b), (c)

Tipo II. Cálculo de la correlación y regresión

[a) Calcula la recta de regresión de Y sobre X en la distribución siguiente
realizando todos los cálculos intermedios.



       X            10            7          5        3          0

       Y            2             4          6        8          10
b) ¿Cuál es el valor que correspondería según dicha recta a X = 7?

a) y = –0,8276x +10,138; b) 4,3448.

5. El número de bacterias por unidad de volumen, presentes en un cultivo
después de un cierto número de horas, viene expresado en la siguiente tabla:

X: Nº de horas             0           1        2        3         4        5
Y: Nº de bacterias         12          19       23       34        56       62



Calcula:

a) Las medias y desviaciones típicas de las variables, número de horas y
número de bacterias.

b) La covarianza de la variable bidimensional.

c) El coeficiente de correlación e interpretación.

d) La recta de regresión de Y sobre X.




6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen,
las horas de estudio dedicadas a su preparación y las horas que vieron la
televisión los días previos al examen.

   Nota                        5   6        7       3    5    8         4   9
   Horas de estudio            7   10       9       4    8    10        5   14
   Horas de TV                 7   6        2       11   9    3         9   5



a) Representa gráficamente los diagramas correspondientes a nota-estudio y
nota-TV.

b) ¿Se observa correlación entre las variables estudiadas? ¿De qué tipo? ¿En
qué caso estimas que es más fuerte?

b) Sí. Directa; inversa.
7. Con los datos del problema anterior, halla el coeficiente de correlación de
nota-estudio y nota-TV. ¿Qué puede deducirse con más precisión conociendo
la nota que obtuvo una persona en el examen: el tiempo que dedicó al estudio
o el que dedicó a ver la televisión?

0,943382 y (0,846283. El tiempo que dedicó al estudio.

8. Con los mismos datos, halla las rectas de regresión correspondientes y
estima para un alumno que sacó un 2 en el examen:

      a) Las horas que estudió.

      b) Las horas que vio la TV.

      a) Esta = (0,246753 + 1,46753 otra; 2,7 h. b) TV = 14,1299 (1,2987 otra;
      11,5 h.

Tipo III. Estimación a partir del a recta de regresión

9. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son:

                Padre   170 173 178 167 171 169 184 175
                Hijo    172 177 175 170 178 169 180 187



a) Calcula la recta de regresión que permita estimar la altura de los hijos
dependiendo de la del padre; y la del padre conociendo la del hijo.

b) ¿Qué altura cabría esperar para un hijo si su padre mide 174? ¿Y para un
padre, si su hijo mide 190 cm?

a) H = 68,1853 + 0,621859 ; P = 77,4406 + 0,545082 . b) 176,4 cm; 181 cm.
Jonathanharo
NIVELES DE LOGRO                                                  ACTIVIDADES


                                                MEDIADO                                            AUTÓNOMO

                              Lectura comprensiva           de correlación y      Organizador gráfico de regresión lineal
TEÓRICO BÁSICO
                                  regresión lineal
                                                                                   Consulta y lectura comprensiva de los
                                  Análisis de la Campana de Gauss                     conceptos de muestreo


TEÓRICO SUPERIOR              Análisis de la realización de las gráficas de la    Análisis de los conceptos investigados
                                  campana de Gauss.
                                                                                   Comprensión de lectura.
                                  Toma de decisiones         para realizar los
                                  ejercicios con la aplicación del muestreo


TEÓRICO PRÁCTICO ACEPTABLE        Aplicación en ejercicios       de la teoría          Aplicación de los ejercicios propuestos del
                                    analizada                                           muestreo

                                  Formulación de alternativas de solución           Realización de ejercicios de la campana
                                                                                        de gauss


TEÓRICO PRÁCTICO AVANZADO     Análisis de los problemas que suceden en la         Aplicación de ejercicios con datos reales
                               sociedad.                                            planteados por el docente

                              Análisis de las variables dependientes e            Investigación de ejemplos de las variables.
                               independientes de la sociedad.
Jonathanharo
8     CARACTERÍSTICAS DE LAS HIPÓTESIS


       Deben basarse en una situación real, es decir deben someterse a
         prueba en un universo y contexto bien definido.

8.1    Ejemplo: El contrabando en Ecuador es menor que el contrabando en
       Colombia
       Dentro de la hipótesis las variables deben ser claras, comprensibles y
         concretas, no se debe usar términos confusos.

Ejemplo: Situación económica del Carchi Crisis económica

       La relación ente variables de una hipótesis deben ser lógicas.

       Las variables de la hipótesis deben ser observables y medibles (esto
         significa que deben tener referentes en la realidad); no se deben incluir
         aspectos morales porque no podríamos medirlos en la realidad.

       Las hipótesis deben estar relacionadas con técnicas disponibles para
         probarlas y verificarlas.

       Las hipótesis deben referirse a una situación real.

       Los términos (variables) de la hipótesis tienen que ser compatibles,
         precisos y lo más concretos posibles.

La relación entre variables propuestas por una hipótesis debe ser clara y
verosímil (lógica).

       Los términos de la hipótesis y la relación planteada entre ellos, deben
         poder ser observados y medidos, o sea tener referentes en la realidad.

       Las hipótesis deben estar relacionadas con técnicas disponibles para
         probarlas.http://www.antropologiasocial.org/contenidos/tutoriales/tym/Do
         cumentos/Hipotesis.pdf
CLASIFICACIÓN DE LAS HIPÓTESIS

HIPÓTESIS DE INVESTIGACION
       a. Hipótesis Descriptiva

          b. Hipótesis de Correlación

          c. Hipótesis de Diferencial de Grupos

          d. Hipótesis de Relaciones de Casualidad

          e. Hipótesis Casuales Bivariables

          f. Hipótesis Casuales Multivariables

8.2   HIPOTESIS NULA

8.3   HIPOTESIS ALTERNATIVA

8.4   HIPOTESIS ESTADISTICA
          a. Hipótesis estadísticas de Estimación

          b. Hipótesis estadísticas de Correlación

          c. Hipótesis estadísticas de Diferencial de medios o otras Variables

8.5   EJEMPLO DE HIPÓTESIS:


        A mayor cantidad de vehículos en una ciudad; mayor congestión
          vehicular.

        A mayor variedad en el trabajo; habrá mayor motivación individual
          hacia él.

        A mayor demanda de un producto; mayor producción del mismo.
1. HIPÓTESIS DE INVESTIGACIÓN (Hi):

Son propuestas de experimentos acerca de las posibles relaciones entre dos
o más variables.1http://iealidia.blogdiario.com/tags/hipotesis/

Se las simboliza como Hi; H1, H2, H3 (cuando son varias)

Las hipótesis de investigación a su vez pueden ser:

       Hipótesis descriptivas de un valor o dato pronosticado.

       Hipótesis correlaciónales.

       Hipótesis de diferencia de grupos.

       Hipótesis causales.

8.6    HIPÓTESIS DE UN VALOR O DATO PRONÓSTICADO:


Esta hipótesis trata de predecir un dato o valor en una o más variables que se
van a medir u observar. No es sencillo realizar estimaciones con precisión con
respecto a ciertos fenómenos.

8.7    HIPÓTESIS CORRELACIONADAS:


Especifican las relaciones entre dos o más variables y corresponden a los
estudios correlaciónales.

Ejemplos:

          “Los altos impuestos a pagar en la CAE están relacionados con el
            Contrabando en Tulcán”

          Las hipótesis correlacionadas no solo pueden establecer que dos o
            más variables se encuentren vinculadas, sino también como están
            asociadas.
Ejemplos:

       A mayor inflación de Precios, habrá menor consumo. (Aquí la hipótesis
         indica que cuando una variable aumenta, la otra disminuye, o
         viceversa).




8.8    HIPÓTESIS DE DIFERENCIA ENTRE GRUPOS:


Su finalidad es comparar grupos:

Por Ejemplo;

       Los niños tiene más cariño por sus padres que por sus tíos.

       Viajar vía aérea de Tulcán a Quito implica menos tiempo que viajar vía
         terrestre de Tulcán a Quito.

8.9    HIPÓTESIS CAUSALES:


Este tipo de hipótesis no solamente afirma la o las relaciones entre dos o más
variables y la manera en que se manifiesta, sino que además propone un
“sentido de entendimiento” de las relaciones. Tal sentido puede ser más o
menos completo, esto depende del número de variables que se incluya, pero
todas estas hipótesis establecen relaciones de causa -efecto.

Las hipótesis causales pueden simbolizarse como.

HIPÓTESIS NULA (Ho):


La hipótesis nula es en cierto modo, el reverso de las hipótesis de
investigación. También constituyen proposiciones acerca de la relación entre
variables, solo que sirven para negar lo que afirma la hipótesis de
investigación. 1 http://personal.us.es/vmanzano/docencia/analisis/guias/FichaP
SHN.pdf
La hipótesis nula se simboliza Ho.

Ejemplo:

Hi:    la inseguridad crece en el Ecuador por falta de trabajo

Ho:    la inseguridad no crece en el Ecuador por falta de trabajo

Hi:    El contrabando disminuirá en un 20% en el mes de diciembre porque
se ha intensificado el control en la frontera.

Ho:    El contrabando no disminuirá en un 20% en el mes de diciembre;
porque falta control en la frontera y por el aumento de los pasos ilegales.



HIPÓTESIS ALTERNATIVA (Ha):


Son posibilidades alternas ante las hipótesis de investigación y nula; ya que
nos presentan otra descripción explicación distintas a las que proporcionan
estos tipos de hipótesis.

Al responder a un problema es necesario hallar diferentes hipótesis como
respuesta y elegir entre ellas.

La hipótesis alternativa se simboliza Ha y solo puede formularse cuando hay
otras posibilidades.1http://www.mitecnologico.com/Main/HisConceptos.

Ejemplos:

Hi:    La empresa Nestlé es grande gracias a su producción y su buen
producto.

Ho:    La empresa Nestlé no es grande

Ha:    La empresa Nestlé es pequeña, mediana
HIPÓTESIS ESTADÍSTICA:


Representa la transformación de las hipótesis de investigación, nulas y
alternativas en símbolos estadísticos. Se pueden formular solo cuando los
datos    del    estudio     son     cuantitativos    (números,     porcentajes,
promedios).1http://www.monografias.com/trabajos17/pruebas-de-hipot.shtml

Hay tres tipos de hipótesis estadísticas:

   1. De estimación.

   2. De correlación.

   3. De diferencia de medias.

8.10 HIPÓTESIS ESTADÍSTICAS DE ESTIMACIÓN:


Sirve para evaluar la suposición de un investigador respecto del valor de
alguna característica en una muestra de individuos, otros seres vivos,
sucesos u objetos y en una población.

8.11 HIPÓTESIS ESTADÍSTICAS DE CORRELACIÓN:


Tiene por objetivo traducir en términos estadísticos una correlación entre dos
o más variables. El símbolo de una correlación entre dos variables es “r”, y
entre dos o más variables “R”.

8.12 HIPÓTESIS ESTADISTICAS DE LA DIFERENCIA DE MEDIAS U
     OTROS VALORES:
En estas hipótesis se compara una estadística entre dos o más grupos.

8.13 EJEMPLOS DE HIPOTESIS:

8.14 Hipótesis descriptiva


   1. Es día martes se realizaron 40 trámites de exportación a Colombia.

   2. El mes de diciembre las importaciones subirán en un 30 %.
3. En el 2011 las exportaciones aumentara en un 10 %.

   4. En el 2011 el contrabando bajara en un 2 %.

   5. En diciembre la producción del banano aumentara porque existe
         mayor demanda.

Hipótesis nula

   1. Los bajos aranceles en las exportaciones de camarón provoca
         mayores exportaciones a Canadá

         Los altos aranceles en las exportaciones de camarón provoca menores
         exportaciones a Canadá

   2. Las exportaciones de petróleo aumentaran en 2011, por la mayor
         producción en la refinería Sacha.

         Las exportaciones de petróleo disminuirán en 2011, por la menor
         producción en la refinería Sacha.

   3. El tipo de aforo de mercancías agilita el pronto despacho, saliendo las
         mercancías de las zonas primarias en menor tiempo

         El tipo de aforo de mercancías entorpece el pronto despacho, saliendo
         las mercancías de las zonas primarias en mayor tiempo

Hipótesis Alternativa

1.- El      tratado de Libre Comercio firmado por Ecuador         mejora las
exportaciones con Colombia, Venezuela, Perú.

2.- Los ingresos percibidos del Petróleo en Ecuador se invierten en salud,
educación, vivienda.
PRUEBA DE HIPÓTESIS

Se la llama ensayo de hipótesis. Son procedimientos que se unen para
determinar si es razonable o correcto la formulación en Ho, como resultado
aceptamos o rechazamos Ho.

8.15 PASOS PARA LA PRUEBA DE HIPOTESIS


1) Formular la hipótesis nula (Ho) y la hipótesis alternativa (H1).
2) Determinar si la prueba es unilateral y bilateral.
3) Asumir el nivel de significación   = 5%,    = 1%, =10%
4) Determinar la distribución muestral que utiliza la prueba.




       N= 50 > 30 se puede utilizar la prueba de hipótesis.
5) Elaborar un esquema de prueba.
6) Calculo estadístico :
7) TOMA DE DESICIONES:

Aceptación o rechazo del Ho.

Ṕ = proporción de la muestra %


P= proporción de la población=


EJEMPLO 1:

Para evaluar el nivel mental de los ingresantes de la Universidad se
estandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual)
promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la
prueba a una muestra de 60 ingresantes de esta universidad se calculó que el
C.I. promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel
mental de los ingresantes es superior al término medio?

Variable de estudio: La habilidad mental de los X estudiantes.

µ = rendimiento mental promedio de los ingresantes.

X = rendimiento promedio de la muestra.

Solución:

   1) Ho: µ= 101,2
      Ha: µ > 101,2
   2) Prueba unilateral de acuerdo a Ha.
   3) Realizar la prueba de los niveles de significación de 5% y 1%.
   4) Se admite que la variable aleatoria de la prueba es la media de los
      coeficientes de inteligencia Xi.
   5) Como n > 30 podemos usar una distribución normal de probabilidades
      para calcular los valores críticos y elaborar el esquema grafico de la
      prueba 99%.
6) Calculo estadístico de la prueba.




   7) Toma de decisiones:

A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z=
2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muy
significativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivel
mental de los ingresantes es superior al término medio.

EJEMPLO 2:

Un político supone que menos del 60% de los votos de su territorio le son
favorables. Con el fin de verificar su conjetura. Selecciona una muestra
representativa compuesta por 200 votantes y aplica una encuesta, obteniendo
100 respuestas a su favor. Probar que los resultados confirman la creencia
del político, es decir, que los votos favorables de su territorio son menores del
60%.
8.16 PRUEBA DE DIFERENCIAS DE MEDIAS


Cuando    existen    dos   grupos   de   investigación   en   una   `población.
Matemáticamente se puede expresar de la siguiente manera

                                            POBLACIÓN


                    Cuando n₁, n₂> 30




                                              MUESTRA




EJEMPLO 3

Un grupo de investigadores ha diseñado un cuestionario sobre la tensión,
consistente en 15 sucesos. Ellos están interesados en determinar si existe
una coincidencia entre dos culturas acerca de la cantidad relativa de ajustes
que acarrea cada suceso. El cuestionario se aplica a 300 estadounidenses y
300 italianos. Cada individuo debe utilizar el evento “matrimonio” como
estándar y juzgar los demás eventos en relación con el ajuste necesario para
el matrimonio. El matrimonio recibe un valor arbitrario de 50 puntos. Si se
considera que un evento requiere de más ajustes que el matrimonio, el evento
debe recibir más de 50 puntos. El número de puntos excedentes depende de
la cantidad de ajustes requeridos. Después de que cada sujeto de cada
cultura ha asignado puntos a todos los eventos, se promedian los puntos de
cada evento. Los resultados aparecen en la siguiente tabla:
EVENTOS                       ESTADOUNIDENSES           ITALIANOS
Muerte de la esposa                    100                   80
Divorcio                               73                    95
Separación de la pareja                65                    85
Temporada en prisión                   63                    52
Lesiones personales                    53                    72
Matrimonio                             50                    50
Despedido del trabajo                  47                    40
Jubilación                             45                    30
Embarazo                               40                    28
Dificultades sexuales                  39                    42
Reajustes económicos                   39                    36
Problemas con la
familia política                       29                    41
Problemas con el jefe                  23                    35
Vacaciones                             13                    16
Navidad                                12                    10



    a. Suponga que los datos tienen al menos una escala de intervalo
        y calcule la correlación entre los datos estadounidenses y la de
        los italianos.
    b. Suponga que los datos sólo tienen una escala ordinal y calcule
        la correlación entre los datos de ambas culturas.

           100

             80

             60
                                                   Series1
             40

             20

              0
                  0      50      100         150
0,8519

La     r es alta    y positiva es decir que los comportamiento de las dos
nacionalidades son bastante similares

EJEMPLO 4

Una muestra de 80 alambres de acero producidos por la fábrica A de una
resistencia media de rotura de 1230 lbs. y S= 120 lbs.; otra muestra de 100 de
alambres de aceros producidos por la fábrica B de una resistencia media de
1190 lbs. Con una S = 90 lbs. ¿Hay una diferencia real en resistencia media
de las dos marcas de alambre de acero si          ?

Solución:

     1) H₀=U₁=U₂
        Hₐ = U₁<U₂; U₁>U₂
     2) Es una campana bilateral
     3) El nivel de significación es
     4) Se utiliza una diferencias de medias n₁=80>30; n₂ 100>30
5) Gráfico




   6) Calculo estadístico




   7) Toma de decisiones
  El esquema estadístico cae en la zona de rechazo por lo tanto rechazamos
  la hipótesis nula y se puede deducir que existe una diferencia real de la
  resistencia media de las dos marca de acero de cada una de las fábricas.


EJEMPLO 5
Un aditivo servirá más millas por galón. La compañía ha reutilizado un gran
número de mediciones recorridas en la gasolina sin aditivo, bajo condiciones
controladas rigurosamente, los resultados muestra una media de 2,47 millas
por galón y un S= 4,8. Se realizan pruebas con una muestra de 75 autos que
utilizan la gasolina con aditivos, la media de la muestra es de 26,5 millas/
galón
Solución:

  1) H₀= 26,5
     U 24,7
     Hₐ : El nuevo aditivo incrementas el número de millas por galón por lo
     tanto X=26,5 en donde U>24,7
  2) La prueba es unilateral a la derecha
  3) El nivel de significación
  4) N>30 por lo tanto se utiliza la prueba de hipótesis
  5) Grafico




  6) Calculo estadístico




  7) Toma de decisiones
     Rechazamos la hipótesis nula y aceptamos la hipótesis alternativa
NIVELES DE                                                              ACTIVIDADES
   LOGRO

                                      MEDIADO                                                          AUTÓNOMO

               Lectura comprensiva de la prueba de hipótesis,                  Análisis y comprensión de la prueba de hipótesis atravesó de
TEÓRICO                                                                          las tic’s
BÁSICO             Análisis de la prueba de hipótesis,
                                                                                Consulta y lectura comprensiva de la prueba de hipótesis



TEÓRICO        Análisis de la realización de ejercicios de la prueba de        Análisis de los conceptos investigados sobre la prueba de
SUPERIOR        hipótesis.                                                       hipótesis.

                  Toma de decisiones para realizar los ejercicios con la         Comparación de los diferentes conceptos investigados sobre la
                   aplicación de la prueba de hipótesis mediante la                prueba de hipótesis,
                   aplicación de los 7 pasos


               Aplicación en ejercicios de la teoría analizada acerca            Aplicación de los ejercicios propuestos de la        prueba de
TEÓRICO         de la prueba de hipótesis,                                         hipótesis,
PRÁCTICO
ACEPTABLE          Formulación de alternativas de solución                     Realización de ejercicios de la prueba de hipótesis,


TEÓRICO        Análisis de los problemas que suceden en la sociedad.           Aplicación de ejercicios con datos a través de la elaboración de
PRÁCTICO                                                                         un proyecto
AVANZADO       Análisis de ejercicios propuestos por diversos autores
                                                                                Investigación de ejemplos de Hipótesis
“T“DE STUDENT

En probabilidad y estadística, la distribución t (de Student) es una
distribución de probabilidad que surge del problema de estimar la media de una
población normalmente distribuida cuando el tamaño de la muestra es
pequeño.

Aparece de manera natural al realizar la prueba t de Student para la
determinación de las diferencias entre dos medias muéstrales y para la
construcción del intervalo de confianza para la diferencia entre las medias de
dos poblaciones cuando se desconoce la desviación típica de una población y
ésta debe ser estimada a partir de los datos de una muestra

8.17 CARACTERÍSTICAS


            El tamaño de la muestra es menor a 30
            La población de donde se obtiene los datos está distribuida
              normalmente
            Se desconoce la desviación estándar de la población, entonces
              haremos uso de la distribución de student




8.18 Grado de libertad:
      (n-1) cuando se ha estimado un parámetro
       Cuando se estiman dos parámetros (gl= n₁+n₂-2)
gl =n-k     hay que mirar en la tabla de T de student con el coeficiente de

estimación de            ;

Solución              u= rendimiento mental medio en la estandarización.

u = 101

 = Rendimiento mental medio de la muestra

 = 105,4



8.19 FORMULACION DE HIPOTESIS


           Ho: u = 101       No existe diferencias significativas en el rendimiento
           mental de la muestra      y de la población.

           H1: u ˃ 101

      1) Prueba unilateral de cola derecha de acuerdo con H1

      2) Nivel de significación asumido: α = 0,01 = 1%

      3) Se debe utilizar una distribución muestral de medias n < 30 (muestra
           pequeña) se distancia Q ( desviación estándar de la población )

      4) α=0,01

    Los grados de libertad son:

    n - 1 = 15-1 = 14

    14; α=0,01 prueba 1 cola                2,624

      5) Calculo estadístico

 = 105,4    ;    u = 101 ; S = 5,3 ;       n = 15
t=


      t = 3,11

       6) Toma de decisiones :

Si t = 3,11 se halla en la zona de rechazo por lo tanto se descarta que u = 101
y se acepta la alternativa u          es decir el grupo de los 15 alumnos tiene
rendimiento mental mayor que el promedio de estandarización.

EJERCICIO:

En un laboratorio farmacéutico se produce comprimidos de un cierto
medicamento, con un peso promedio de 2 gr. promedio por cada comprimido,
para determinar si la maquina sigue en iguales condiciones de producir se toma
una muestra de 10 tabletas: 2,04 ; 1,96 ; 2,00 ; 1,98 ; 2,02 ; 2,01 ; 1,97 ; 1,94 ;
2,03 ; 2,01 ; asimilando α=0,01 ; verificar si la maquina está en buenas
condiciones.

Solución: U2= promedio de tabletas producidas por la máquina.

       1) Formulación de Hipótesis:

               Ho: U = 2 La máquina se halla en buenas condiciones.

               H1: U ≠ 2 La máquina no se halla en buenas condiciones.




       2) Prueba bilateral:

               H1: Hay dos probabilidades

               U˃ 2     y     U<2

       3) α = 0,01

       4) U=2g siendo una muestra pequeña n=10

           No aplica a la distribución normal y se aplica la t de student.

       5) α = 0,01 Prueba bilateral
gl = n-1 = 10-1 = 9 gl        t = 3,25




                                         Zona de Rechazo
                 Zona de Aceptación




        6) Cálculo estadístico




t=


t = -0,39

7) Toma de decisiones:

Si t = - 0,39 entonces u se encontraría en la zona de aceptación es decir se
acepta la Ho es decir la maquina se encuentra en buenas condiciones.
NIVELES DE                                                      ACTIVIDADES
  LOGRO
                                MEDIADO                                                     AUTÓNOMO

              Lectura comprensiva de la T-de student,                Análisis y comprensión de la T-de student,atraves de las tics
TEÓRICO
BÁSICO        Análisis de la T-de student,,                          Consulta y lectura comprensiva de la T-de student,

                                                                      Análisis de los conceptos investigados sobre la T-de student,
TEÓRICO       Análisis de la realización de ejercicios de la T-de
SUPERIOR       student                                                   Comparación de los diferentes conceptos investigados sobre
                                                                        la T-de student,
              Toma de decisiones para realizar los ejercicios
               con la aplicación de la

              Aplicación en ejercicios   de la teoría analizada      Aplicación de los ejercicios propuestos de la T-de student,
TEÓRICO        acerca de la T-de student,
PRÁCTICO                                                              Realización de ejercicios de la T-de student,
ACEPTABLE     Formulación de alternativas de solución a través
               de la T-de student,


TEÓRICO       Análisis de los problemas que suceden en la            Aplicación de ejercicios con datos a través de la elaboración
PRÁCTICO       sociedad.                                               de un proyecto
AVANZADO
              Análisis de ejercicios propuestos por diversos         Investigación de ejemplos sobre la T-de student,
               autores
Jonathanharo
PRUEBA DE Ji- CUADRADO O


Distribución Ji-cuadrado, también denominada Ji-cuadrado de Pearson, es una
distribución de probabilidad continua con un parámetro k que representa los
grados de libertad de la variable aleatoria. Se suele usar la denominada prueba
Ji-cuadrado como test de independencia y como test de bondad de ajuste.


En realidad la distribución Ji-cuadrado es una distribución muestral, es decir
que si se extraen todas las muestras posibles de una población normal y a
cada muestra se le calcula su varianza, se obtendrá la distribución muestral de
varianzas. Para estimar la varianza poblacional o la desviación estándar, se
necesita conocer el estadístico X². Si se elige una muestra de tamaño (n) de
una población normal con varianza, el estadístico:


Donde n es el tamaño de la muestra, S² la varianza muestral y la varianza de la
población de donde se extrajo la muestra.

8.20 Propiedades de las distribuciones Ji-cuadrado

1. Los valores de X2 son mayores o iguales que 0.


2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay
un número infinito de distribuciones X2.


3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.


4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.


5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).


6. El valor modal de una distribución X2 se da en el valor (n-3).
Chi 2

Otro de los modelos estadísticos para comprobar si las hipótesis de un
problema son verdaderas o falsas se sigue los siguientes pasos

1) la CHI 2 es utilizada para variables cuantitativas y cualitativas Ej. Cualidades
sí o no, verdadero falso y las cuantitativas son a través de números que se los
obtiene en una población, que se deben sacar diferentes muestras por
extractos que generalmente se los determina a través de las columnas o
intervalos o también se los obtienen a través de las tablas de valores.

2) su símbolo de chi 2 es X2 se la representa en el plano cartesiano




Únicamente el CHI² solo es de una sola cola a la derecha.

Hay dos formas diferentes para determinar los grados de libertad.

gl = K – 1 o gl = ( c - ) ( F – 1 ) para la tabla de valores

C columnas y F filas

Sus fórmulas matemáticas de chi 2


X2 =



X 2=


Oi frecuencias observadas

Ei frecuencias operadas
Las frecuencias operadas se las obtienen multiplicando de un número total por
el porcentaje o también se las obtiene de la división.


E=                           (multiplicaciones)


Para llegar a la toma de decisiones también se debe utilizar los siete pasos que
se dan tanto en la prueba de hipótesis como en la t de student.

Generalmente su símbolo es        .

Es una prueba que puede usarse para cualquier nivel de datos, es una medida
donde se encuentran las frecuencias (observadas y esperadas), en el caso de
las frecuencias esperadas estas se las obtiene a través de otros resultados.

Matemáticamente se la puede expresar de la siguiente forma:

               = dónde:




fe= frecuencia esperada

X2 = Siempre va hacer positiva por estar elevada al cuadrado

Como en las anteriores pruebas hay que dar los 7 pasos fundamentales hasta
llegar a la toma de decisiones.

Generalmente se presentan dos casos para encontrar los grados de libertad.

       1)

       2)                      esta cuando existen filas y columnas y se realizan
            tablas de contingencia.

Representación gráfica de la Campana de Gauss la cual solo tiene cola dirigida
hacia la derecha por poseer valores positivos.

            a) X = 0,05   >>>>

                  (4gl) = 9,488 Se lee en la tabla.
b) X =0,05       >>>>

                   = 18,307




EJEMPLO:

Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado
120 veces y obtuvo la siguiente distribución de frecuencias de las caras
resultantes.


       RESULTADO 1                    2    3        4        5        6
       FRECUENCIA 15                  25   33       17       16       14


      a) Enuncie las hipótesis de la prueba y determine las frecuencias
         esperadas.
      b) Describa la estadística de la prueba
      c) Determine la región crítica de la prueba al nivel de significación del 5%.
      d) ¿A qué conclusión llega usando el nivel de significación 0,05?
      e) Determine la probabilidad P.

1.- Ho: El dado es legal.

      Ha: El dado no es legal.

2.- Es de dos colas.

3.- Nivel de confianza



4.-

gl= k-1          gl=6-1          gl=5
5.-



          Zona
          aceptación



                              11,07
6.-

          Ei           20       20      20         20        20         20
          Oi      15          25      33         17        16         14




      6. Toma de decisiones Se acepta la hipótesis alternativa y se rechaza la
         hipótesis nula, es decir el dado del jugador no es legal ya que se
         encuentra dentro de la zona de rechazo

EJEMPLO:

      1. Ho.- El suero no tiene efecto, y la recuperación es independiente del
         uso del suero.
         Ha.- que el suero es el que permite la recuperación del paciente.


      2. Es cola unilateral


      3. 0,05 (N. significancia.)


         Nivel de confianza 95%


      4. n =200 personas se puede utilizar la ji cuadrado para cualquier valor de
         datos-


      5. GRÁFICO
gl =(F-1 ) (C-1)
        gl =(2-1) (2-1)
        x²=3,84


   6. Calculo de x²


        X2= (75 - 70)2 / 70 + (65 - 70)2 / 70 + (25-30)2 /30 + (35-30) 2 / 30 =
        2,38



8.21 FRECUENCIAS OBSERVADAS

                      CURADOS            NO CURADOS          TOTAL
GRUPO    A   USANDO   75                 25                  100
SUERO
GRUPO B SIN SUERO     65                 35                  100


TOTAL                 140                60                  200




8.22 FRECUENCIAS ESPERADAS (DE Ho)

                      CURADOS            NO CURADOS          TOTAL
GRUPO    A   USANDO   70                 30                  100
SUERO
GRUPO B SIN SUERO     70                 30                  100


TOTAL                 140                60                  200




   7. Ho aceptamos, concluyendo que el suero no tiene efecto, que la
        recuperación es independiente
Fe =(80 – 40) / 200 = 16


        Fe= FRECUENCIA ESPERADA = (total del renglón) (total columna) / gran
        total
        Fe =(100 – 140) / 200 = 7
           Fe =(100 – 60) / 200 = 30

EJERCICIO

La falta de muestra de estudiantes aprobados y suspendidos por 3 profesores
X, Y, Z

Ho= La proporción de estudiantes suspendidos son iguales.

Ha = L proporción de estudiantes suspendidos no son iguales.


                     X                 Y                  Z             TOTAL


APROBADOS            50                47                 56            153

SUSPENDIDOS          5                 14                 8             27



TOTAL                55                61                 64            180




X2 = (50 – 46,25)2 / 46,75 + (47 – 51,85)2 / 51,85 + (56 – 54,40)2 /54,40 + (5 –
8,25) 2 / 8,25 + (14 -9,15) 2 /9,15 + (8 -9,60)2 / 9,60

X2 = 4, 84

gl = (F-1) (C – 1)

gl = (2-1) (3-1)

X2 = 4, 61

X2= 0, 95 = 5, 99
X       Y       Z       TOTAL

APROBADOS     46,75   51,85   54,40   153

SUSPENDIDOS   8,25    9,15    9,6     27




TOTAL         55      61      64      180
NIVELES DE                                                                        ACTIVIDADES
   LOGRO

                                          MEDIADO                                                                      AUTÓNOMO

                  Lectura comprensiva de la CHI Cuadrado ,                                Análisis y comprensión de la      CHI Cuadrado de las tic’s
TEÓRICO
BÁSICO                Análisis de la   CHI Cuadrado                                       Consulta y lectura comprensiva de la      CHI Cuadrado


                                                                                           Análisis de los conceptos investigados sobre la     CHI Cuadrado
TEÓRICO           Análisis de la realización de ejercicios de la JI Cuadrado.
SUPERIOR                                                                                    Comparación de los diferentes conceptos investigados sobre la      CHI
                      Toma de decisiones     para realizar los ejercicios con la
                                                                                            Cuadrado
                   aplicación de la     CHI Cuadrado    mediante la aplicación de
                   los 7 pasos

                  Aplicación en ejercicios de la teoría analizada acerca de la            Aplicación de los ejercicios propuestos de la     CHI Cuadrado
TEÓRICO
                   CHI Cuadrado
PRÁCTICO                                                                                   Realización de ejercicios de la    CHI Cuadrado ,
ACEPTABLE              Formulación de alternativas de solución


TEÓRICO           Análisis de los problemas que suceden en la sociedad.                   Aplicación de ejercicios con datos a través de la elaboración de un
PRÁCTICO                                                                                    proyecto
                  Análisis de ejercicios propuestos por diversos autores
AVANZADO
                                                                                           Investigación de ejemplos sobre la JI Cuadrado
CONCLUSIÓNES


   De acuerdo con la realización del presente trabajo, hemos llegado a las
     siguientes conclusiones:


   La Estadística Descriptiva es un instrumento muy empleado por parte de
     los investigadores en las distintas áreas científicas y su necesidad e
     importancia han ido aumentando durante los últimos años.



   El interés de los diferentes usuarios por la información Estadística
     obedece principalmente a que permite adentrarse en aspectos
     importantes de los fenómenos económicos y sociales: Su magnitud, es
     decir, las dimensiones que estos tienen y su estructura, o sea, la forma
     como esos fenómenos se desagregan en sus componentes.


   Para que las Estadísticas sean de utilidad en cuanto a la caracterización
     de los fenómenos y al conocimiento de la realidad, deben cumplir
     determinados requisitos, siendo el principal el de veracidad, en el
     sentido de que los datos correspondan a cuantificaciones con suficiente
     precisión, de los universos de estudio y sus diversos subconjuntos,
     dentro de márgenes de tolerancia. A asimismo los datos deben ser
     conceptualmente    significativos,   es   decir,   obtenidos   a   partir   de
     definiciones previamente establecidas.
RECOMENDACIONES


   Es necesario el uso de la Estadística en la empresa, ya que a través de
     ésta se cuenta con la capacidad para reconocer que actividades o
     productos le generan utilidad, y cuales solo pérdida. No contar con datos
     e interpretarlos correctamente, es para los administradores como
     caminar a oscuras. Contar con los datos, les permite ver lo que está
     aconteciendo y en consecuencia tomar las medidas más apropiadas.


   Toda empresa debe contar con datos estadísticos en cuanto a lo que
     acontece tanto interna como externamente, para decidir sobre bases
     racionales, y adoptar las medidas preventivas y correctivas con
     suficiente tiempo para evitar daños, en muchos casos irreparables para
     la organización.



   También es necesario acompañar la Estadística de las poderosas
     herramientas informáticas, porque le permiten a los directivos, asesores
     y personal, contar con la suficiente información para mejorar a partir de
     ella los procesos de la empresa como por ejemplo: Tomar mejores
     decisiones comerciales, mejorar la seguridad y hacer un uso mucho más
     productivo y provechoso de los recursos.
10. FINANCIEROS Y TÉCNICOS.


DESCRIPCIÓN                      CANTIDAD             VALOR UNITARIO VALOR TOTAL

Papel bond                              200                   0,04                8
Impresiones                             200                   0,04                8
Material de oficina                                                              0,00
Movilización                                                                      3
Internet                                                                          3
Imprevistos                                                                       5
TOTAL                                   200                   0,08               21



     8. CRONOGRAMA DE TAREAS


T      DESCRIPCION DE LA TAREA                    1   2   3      4   5   6   7          8
T1                                            X
T2                                            X
T3                                            X
T4                                                    X
T5                                                        X
T6                                                              X
T7                                                                   X
T8                                                                       X
T9                                                                           X
T10    MODULO ESTADISTICA INFERENCIAL                                                 X
Jonathanharo
9   ANEXOS
9.1   ORGANIZADOR GRAFICO DE LA ESTADISTICA DESCRIPTIVA E
      INFERENCIAL
Universidad Politécnica Estatal del Carchi
   Comercio Internacional, Integración,
 Administración y Economía Empresarial




      Proyecto propuesto
        por el estudiante
Universidad Politécnica Estatal del Carchi

 Comercio Internacional, Integración, Administración y Economía
                           Empresarial.




Escuela: Comercio Exterior y Negociación Comercial Internacional

 TEMA: proyecto de aplicación de correlación, regresión lineal
                                                         2
      SIMPLE APLICANDO Prueba de Hipótesis, T-STUDEN Y CHI   .

                           Integrantes:

                      Coral Sánchez Nancy
                    Ramírez Carla Damaris
                    Rosero Carmen Tatiana
                      Vizcaíno Luis Javier

            Nivel: sexto         Paralelo: “a” Noche

                           AÑO-LECTIVO

                              2012
1.1 INTRODUCCIÓN

Los profesionales de la educación, como parte de su que hacer profesional,
realizan investigación científica: evaluación de la calidad de la educación,
someten a prueba diferentes métodos de comprensión lectora, estudian
problemas del aprendizaje, entre otros. Es así, que contamos con Internet,
como fuente general de información, que permite disponer de información
educativa, por ejemplo, sobre evaluaciones muéstrales, que realiza el
Ministerio de Educación y que está disponible en la página web:

Una vez que conoce tanto la forma de recoger información como la forma de
presentar a la misma, sea en forma de tablas o con el tratamiento realizado
para elaborar una tabla de frecuencias, ahora es conveniente seguir con las
características que permiten describir a un conjunto de datos que se recogen
de un problema a investigarse.

1.4 DEFINICIÓN DE ESTADÍSTICA INFERENCIAL

Estudia el comportamiento y propiedades de las muestras, y la posibilidad y
límites de la generalización de los resultados obtenidos a partir de aquellas a
las poblaciones que representan. Esta generalización de tipo inductivo, se basa
en la probabilidad. También se le llama también estadística matemática, por su
complejidad matemática en relación a la estadística descriptiva. (muestra. http://
www.wikipedia.)


Tiene como objetivo generalizar las propiedades de la población bajo estudio,
basado en los resultados de una muestra representativa de la población.

Es una parte de la Estadística que comprende los métodos y procedimientos
estadísticos en los que interviene la aplicación de modelos de probabilidad y
mediante los cuales se realiza alguna afirmación sobre poblaciones con base
en la información producida por muestras para deducir propiedades (hacer
inferencias) de una población, a partir de una pequeña parte de la misma
(muestra). (http://www.wikipedia: estadísticas.)
Tema: Proyecto de aplicación al comercio exterior aplicando correlación,
     regresión lineal simple aplicando, prueba de hipótesis, t-student y chi2 con
     ayuda del programa SPSS.

1.2 Problema

El desconocimiento de la correlación, prueba de hipótesis, T-Student y Chi 2 y
su aplicación en problemas del contexto.

1.3 Objetivos

Objetivo General

    Solucionar los datos investigados de exportaciones e importaciones de
      comercio exterior aplicando correlación, regresión lineal, prueba de
      hipótesis, T-Student y Chi 2.

Objetivos Específicos


    Identificar la correlación de datos de exportaciones
    Determinar su regresión lineal.
    Identificar la hipótesis nula y la hipótesis alternativa.
    Determinar si la prueba es unilateral o bilateral.
    Asumir el nivel de significación de la prueba.
    Determinar la distribución muestral que se usará en la prueba.
    Calcular el estadístico de la prueba.
    Tomar la decisión, para esto, se comparan el esquema de la parte de
      esquema de prueba.
    Determinar ejercicios en relaciona a nuestra carrera de comercio
      exterior.
Justificación


El uso de un programa informático (SSPS), es muy importante para la
resolución de problemas relacionados al comercio exterior por que representa
un alto nivel de importancia para una buena toma de decisiones.

En la estadística la aplicación de sistemas informáticos se da con mayor
frecuencia   remplazando    los procesos manuales, permitiendo al usuario
ahorrar tiempo y obtener resultados de manera directa y segura, haciendo que
de esta manera se vuelva más competitivo y profesional; permitiendo a la vez
ampliar su panorama ocupacional y logrando así la correcta toma de decisiones
en el campo laboral.
1.5 MARCO TEÓRICO

                                   El SPSS


SPSS es un programa estadístico informático muy usado en las ciencias
sociales y las empresas de investigación de mercado. Originalmente SPSS fue
creado como el acrónimo de Statistical Package for the Social Sciences aunque
también se ha referido como "Statistical Product and Service Solutions" (Pardo,
A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del
nombre completo del software (IBM SPSS) no es acrónimo de nada.

Como programa estadístico es muy popular su uso debido a la capacidad de
trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones
de registros y 250.000 variables. Además, de permitir la recodificación de las
variables y registros según las necesidades del usuario. El programa consiste
en un módulo base y módulos anexos que se han ido actualizando
constantemente con nuevos procedimientos estadísticos. Cada uno de estos
módulos se compra por separado.

Actualmente, compite no sólo con softwares licenciados como lo son SAS,
MATLAB, Statistica, Stata, sino también con software de código abierto y libre,
de los cuales el más destacado es el Lenguaje R. Recientemente ha sido
desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire
que ha sido compilada para diversos sistemas operativos como Linux, además
de versiones para Windows y OS X. Este último paquete pretende ser un clon
de código abierto que emule todas las posibilidades del SPSS.
CORRELACIÓN LINEAL


El análisis de correlación se dirige sobre todo a medir la fuerza de una relación
entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza
de la relación lineal entre dos variables. La fortaleza de la relación se determina
mediante la magnitud del efecto que cualquier cambio en una variable ejerce
sobre la otra. (JOHNSON, 1990)

Si X o Y son las dos variables en cuestión, un diagrama de la dispersión
muestra la localización de los puntos (X,Y) sobre un sistema rectangular de
coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en
una recta, como la figura 14(a) y 14(b) la correlación se llama lineal. (SPIEGEL,
1992)




Y                            Y                             Y




                         X                             X


(a) Correlación lineal positiva (b) Correlación lineal negativa            (c) Sin
correlación
Si Y tiende a crecer cuando X crece, como la figura anterior, la correlación se
dice positiva o directa. Si Y tiende a decrecer cuando X crece, como la figura
14.1 (b), la correlación se dice negativa o inversa.
Si todos los puntos parecen estar sobre una cierta curva la correlación se llama
no lineal, y una ecuación no lineal será apropiada para la regresión. Como
hemos visto en el capítulo 13 es claro q la correlación no lineal puede ser
positiva o negativa.
Si no hay relación entre las variables como la figura 14.1(c), decimos que no
hay correlación entre ellas. (SPIEGEL, 1992)

Técnicas de correlación


A continuación abordaremos el estudio de dos variables y no solamente de
una, estudiaremos qué sentido tiene afirmar que dos variables están
relacionadas linealmente entre si y cómo podemos medir esta relación.

Relaciones lineales entre variables


Supongamos que dispongamos de dos pruebas de habilidad mental y la otra
pruebe de ingreso a la universidad, seleccionamos a cinco estudiantes que se
expresan en la tabla N° 1 con los puntajes obtenidos en estas dos pruebas.


  Estudiantes                      X                                 Y
                     Prueba de habilidad Mental        Examen de Admisión
     María                         18                                82
      Olga                         15                                68
    Susana                         12                                60
      Aldo                         9                                 32
      Juan                         3                                 18




La tabla nos dice que si podemos usar para pronosticar el puntaje alto en la
prueba de habilidad mental y también en los que tienen un puntaje alto en los
exámenes de admisión y los estudiantes con puntajes bajos en la en el examen
de habilidad como en el de admisión.

En circunstancias como la presente (cuando los puntajes altos de una variable
están relacionados con los puntajes altos de otra variable y los puntajes bajos
están relacionados con los puntajes bajos de otra variable) entonces podemos
asegurar que existe una relación positiva entre las dos variables.
Supongamos que en lugar de los resultados de la tabla N° 1 hubiera obtenido
los puntajes que se muestran en la tabla N°2 ¿Podremos afirmar que con estos
datos en esta situación en la prueba de habilidad pueda usarse para
pronosticarse los puntajes del examen de admisión?

También, aunque en este caso los puntajes altos apresen con un puntaje bajo,
tomando en cuenta esto podemos definir una relación lineal negativa entre el
conjunto.

       Estudiantes                    X                        Y
                            Prueba de habilidad      Examen de Admisión
                                   Mental
             María                   18                       18
             Olga                    15                       32
            Susana                   12                       60
             Aldo                     9                       68
             Juan                     3                       82




      Estudiantes                    X                         Y
                           Prueba de habilidad       Examen de Admisión
                                  Mental
            María                    18                        18
            Olga                     15                        82
        Susana                       12                        68
            Aldo                     9                         60
            Juan                     3                         32




En este caso no podemos afirmar una relación lineal entre las variables X y Y
ya que unos puntajes se acotejan con otros y no están en concordancia.
DIAGRAMA DE DISPERSIÓN

  El diagrama de dispersión es útil para representar valores como lo
  mostraremos a continuación utilizando los datos de la tabla N° 1, pero en la
  vida real no todas las veces obtendremos datos de cinco parejas, tendremos
  que comprender muchos más datos por esto es más sencillo utilizar un
  diagrama para determinar la relación de los mismos.

  COEFICIENTE DE CORRELACIÓN RECTILÍNEA DE PEARSON
  Con la ayuda de las gráficas nos podemos formar una idea de la nube de
  puntos o diagrama de dispersión, representa la relación lineal es positiva o
  negativa y determinar la fuerza de relación.

  El coeficiente de Pearson, toma valores entre -1 y +1, el coeficiente 0
  demuestra que no existe correlación, así que independiente del número sea
  negativo o positivo son iguales, claro está que entre más se aproxime al 1 o -1
  mayor será la fuerza de relación.

  EJERCICIO: CORRELACIÓN

  El Banco Central del Ecuador nos presenta La siguiente informacion, la
  cantidad y el precio del petroleo exportado por el Ecuador en los años 2008
  hasta el 2011, se desea conocer si la informacion obtenida posee una
  correlacion.


         Año         2008                 2009                2010                2011
Meses
               CANTI      PRECIO      CANTI    PRECIO     CANTI    PRECIO     CANTI    PRECIO
Enero            11266        29,06    12427      46,69    10304      40,22     3383      76,44
Febrero          10193          32     11568       45,1     9210      46,29     5006      79,55
Marzo            11146        38,89    12428       46,8    10305      48,37     3502      85,49
Abril            10362        38,39    12577      54,67     9315      52,41     5494      91,25
Mayo             10761        35,95    10208      57,15     9224      53,78     5003     103,94
Junio            11521        42,26    10106      58,16    11842      56,94     4177     115,21
Julio             9744          46      9375      61,26    12239      63,73     3565     113,42
Agosto           10307        51,66    11206      59,29    10209      61,22     3989      99,13
Septiembre       10796        50,34    12310      49,34    10910      64,68     3630      87,47
Octubre          10001        45,43    11606        45     10605      71,36     3847      65,42
Noviembre        12569        40,33    12147      43,96     9214      79,81     2680      48,22
Diciembre        12929        42,76    10676      45,83    10722      77,21     5641      26,66
TOTAL            131595     493,07    136634     613,25   124099     716,02    49917      992,2
  BANCO CENTRAL DEL ECUADOR
DESARROLLO



Paso 1: Escogemos la opción Analizar/Correlaciones/Bi-variadas




Paso 2 : Seleccionamos las variables con el botón
Escogemos la opción Pearson Clic en la opción Bilateral

Pasó 3 : Escoger la opción Marcar las correlaciones significativas Clic Aceptar




Paso 4 Aparece la tabla en la que constan los datos correspondientes a la
correlación.
Regresión lineal

Fases del modelo de regresión lineal


La recta de regresión y el coeficiente de correlación tienen sentido en tanto en
cuanto son instrumento para inferir la relación de las variables en la población.

El conocimiento exacto del coeficiente de correlación solo es posible si
analizamos la totalidad de la población. Sin embargo, a la hora de evaluarlo,
nos encontramos con el problema habitual de tener que inferirlo desde la
estimación que proporcionan los datos de una muestra.

La recta de regresión lineal y=a+bx, es una estimación de la recta de regresión
lineal de la población y=α+ßx. Los parámetros α y ß son evaluados a partir de
los datos de una muestra, y es fundamental tener unas garantías de que los
valores a y b estimados no difieren significativamente de los parámetros
poblacionales α y ß.

El proceso que se sigue en la construcción del modelo de regresión se
compone de tres fases o etapas. En la primera fase, se comprueba si la
relación entre las variables que componen el modelo está de acuerdo con la
propia forma del modelo.

La segunda fase consiste en la estimación de los parámetros de acuerdo con el
criterio elegido (en nuestro caso, el método de mínimos cuadrados).

La última fase es fundamental para el investigador, que debe comprobar si las
inferencias o pronósticos que se pueden hacer de la relación encontrada entre
las variables se ajustan a los datos. (VARGAS, 1995)

El modelo de regresión lineal


El modelo de regresión lineal simple es un proceso experimental en el que
intervienen dos variables: una variable dependiente Y, que no es controlada por
el experimento, y que depende de otra variable independiente X, que si es
controlada por el experimento, por lo que esta no es una variable aleatoria.
Para estudiar la relación de dependencia entre estas variables, se dispone de
una muestra aleatoria de tamaño N, que vamos a representar por {[x,y]}… n

Cuando tomamos distintas muestras para un mismo valor X, es de esperar que
varíen los correspondientes valores de Y; por ello, el valor y1 del par (x ,y) se
puede considerar como valor de una variable aleatoria por Y, que tendrá una
medida M(Y) y una varianza V(Y). (VARGAS, 1995)

Por lo tanto, para x=x, tenemos una variable aleatoria a la que vamos a
designar por Y, que tendrá una medida M (Y) y una varianza V(Y).

Admitir el modelo de regresión lineal supone aceptar que la medida de la
variable aleatoria M (Y), está relacionada linealmente con la variable x por
medio de la ecuación de la regresión de la población, es decir: (VARGAS,
1995)




Donde α y ß son los parámetros de la población.

M (Y) es la respuesta promedio; para simplificar la terminología, vamos a
designarla por P.

Los parámetros de la recta de regresión poblacional α y ß, son desconocidos y
deben ser estimados mediante los valores de a y b en la recta de regresión
muestral que se obtiene a partir de los datos de la muestra. (VARGAS, 1995)

Una vez evaluadas a y b, una estimación de la respuesta promedio P es:




EJERCICIO:

RELACIÓN LINEAL
Con los datos proporcionados por el Banco Central del Ecuador nos piden
encontrar una línea recta la cual acoja a todos los datos obtenidos de las
exportaciones de petróleo desde 2008 hasta el 2011 para de esta manera
elaborar pronósticos que se ajusten a los datos:
Año       2008                2009                2010                2011
Meses
               CANTI    PRECIO     CANTI    PRECIO     CANTI    PRECIO     CANTI    PRECIO
Enero           11266      29,06    12427      46,69    10304      40,22     3383      76,44
Febrero         10193        32     11568       45,1     9210      46,29     5006      79,55
Marzo           11146      38,89    12428       46,8    10305      48,37     3502      85,49
Abril           10362      38,39    12577      54,67     9315      52,41     5494      91,25
Mayo            10761      35,95    10208      57,15     9224      53,78     5003     103,94
Junio           11521      42,26    10106      58,16    11842      56,94     4177     115,21
Julio            9744        46      9375      61,26    12239      63,73     3565     113,42
Agosto          10307      51,66    11206      59,29    10209      61,22     3989      99,13
Septiembre      10796      50,34    12310      49,34    10910      64,68     3630      87,47
Octubre         10001      45,43    11606        45     10605      71,36     3847      65,42
Noviembre       12569      40,33    12147      43,96     9214      79,81     2680      48,22
Diciembre       12929      42,76    10676      45,83    10722      77,21     5641      26,66
TOTAL          131595     493,07   136634     613,25   124099     716,02    49917      992,2
DESARROLLO


Paso 1 Clic en la opcion Gráficos/ Cuadro de diálogos antiguos/ Dispercion de
puntos




Elejimos la dispercion simple




En donde nos da como resultado el siguiente cuadro
Paso 2 Colocamos las variables en el eje de la X & Y dependiendo de los datos
del problema a resolver, dando como resultado el siguiente cuadro:




Si queremos encontrar la línea de correlación click en gráficos/cuadros de
dialogo antiguo/ lineas
Uniendo




ENCONTRAR LA ECUACIÓN


Paso 1 Escogemos la opción Analizar de la barra de herramientas/ Regresión/
Lineales
Paso 2 Elegimos la variable dependiente e independiente según corresponda;
después clic en la opción Estadísticos.




Paso 3 Se escoge las siguientes opciones de la ventana, Estimaciones, Ajuste del
modelo, Cambio en R cuadrado y Descriptivos clic en Continuar.
Paso 4 Clic en Aceptar




Paso 5 Nos aparecen los resultados del estadístico en donde podemos deducir
que la fórmula de la recta de los datos es:

F (x)= -20.183x+11795,561
Prueba de hipótesis


La prueba de hipótesis comienza con una suposición, llamada hipótesis, que
hacemos acerca de un parámetro de población. Después recolectamos datos
de muestra, producimos estadísticas muéstrales y usamos esta información
para decidir qué tan probable es que nuestro parámetro de población hipotético
sea correcto. Digamos que suponemos un cierto valor para una medida de
población, para probar validez de esa suposición recolectamos datos de
muestra y determinamos la diferencia entre el valor hipotético y el valor real de
la media de la muestra. Después juzgamos si la diferencia obtenida es
significativa o no. Mientras más pequeña sea la diferencia, mayor será la
probabilidad de que nuestro valor hipotético para la media sea correcto.
Mientras mayor sea la diferencia, más pequeña será la probabilidad. (LEVIN,
2010)



Hipótesis nula y alternativa


La prueba de hipótesis empieza con algo de teoría, afirmación o aserción con
respecto a un parámetro particular de una población. Para fines de análisis
estadístico, el gerente de producción escoge como hipótesis inicial que el
proceso está bajo control; esto es, el contenido promedio es de 368 gramos y
no es necesario efectuar acciones correctivas. La hipótesis de que el parámetro
de la población es igual a la especificación de las compañías se conoce como
la hipótesis nula.

Una hipótesis nula es siempre una de status quo o de no diferencia. Por lo
general se le identifica con el símbolo Ho. Nuestro gerente de producción
establecería como hipótesis nula que el proceso de llenado está bajo control y
funcionando apropiadamente, que la cantidad media de cereal por caja es la
aplicación de la compañía de 368 gramos. Esto se establece como:

Ho2 µ=0
Siempre que especifiquemos una hipótesis nula, también debemos especificar
una hipótesis alternativa o una que debe ser verdadera si se encuentra que la
hipótesis nula es falsa. La hipótesis alternativa (H1) es lo opuesto a la hipótesis
nula (Ho). Para el gerente de producción, la hipótesis alternativa se puede
establecer como:

Ho2 µx≠0

La hipótesis alternativa representa la conclusión a la que se llegaría si hubiera
suficiente evidencia de la información de la muestra para decidir que es
improbable que la hipótesis sea verdadera y, por tanto rechazarla. En nuestro
ejemplo, si el peso de las cajas muestreadas estuvieran lo suficiente por arriba
o por debajo del promedio.




Interpretación del nivel de significancia

El propósito del nivel de significancia no es cuestionar el valor calculado en el
estadístico de la muestra sino hacer un juicio respecto a la diferencia entre ese
estadístico y un parámetro hipotético de la población.

Si suponemos que la hipótesis es correcta, entonces el nivel de significancia
indicará el porcentaje de medias muéstrales que está fuera de ciertos límites.



Selección del nivel de significancia


No existe un nivel de significancia único estándar o universal para probar
hipótesis. En algunos casos se utiliza el nivel de significancia de 5%. Ciertos
resultados de investigaciones publicados a menudo prueban hipótesis para un
nivel de significancia del 1%. Es posible probar una hipótesis a cualquier nivel
de significancia.

Cuando más alto sea el nivel de significancia que utilizamos para probar una
hipótesis, mayor será la probabilidad de rechazar la hipótesis nula cuando es
cierta. (LEVIN, 2010)
Error tipo I y Error tipo II


Rechazar una hipótesis nula cuando es cierta se denomina error tipo I, y su
probabilidad se simboliza con α (alfa). Por otro lado, aceptar una hipótesis nula
cuando es falsa se llama Error tipo II, y su probabilidad se simboliza con ß
(beta).

Existe relación entre estos dos tipos de errores: la probabilidad de cometer un
tipo de error puede reducirse solo si estamos dispuestos a aumentar la
probabilidad de cometer el otro tipo de error. (LEVIN, 2010)

Pasos de una prueba de hipótesis


En la prueba de hipótesis que goza de aceptación general figuran siete pasos:

Paso 1 Formular la hipótesis nula HO,

De manera que pueda determinarse exactamente               α, la probabilidad de
cometer un error tipo 1. (Esto equivale a determinar el parámetro de población
que interesa y proponer la validez de un valor para él) (Signo =)

Formular la hipótesis alternativa Ha
De manera que el rechazo de la hipótesis nula signifique aceptar la hipótesis
alternativa. (Signo > o <)

Al formular estas dos hipótesis, se determinan el parámetro y el valor
propuesto;

Paso 2 Determinar si la prueba es unilateral o bilateral

Paso 3 Asumir el nivel de significación

Paso 4 Determinar la distribución muestral que se usara en la prueba

Paso 5 Elaborar el esquema de la prueba

Paso 6 Calcular el estadístico de la prueba

Paso 7 Tomar la decisión, para esto, se comparan el esquema de la parte 5,
con el estadístico del paso 6
T DE STUDENT


En probabilidad y estadística, la distribución t-Student es una distribución de
probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño.

Una variable aleatoria se distribuye según el modelo de t-Student con n grados
de libertad.

Propiedades:


   1. La gráfica de la función de densidad es en forma de campana.
   2. Los datos están más disperso que la curva normal estándar.
   3. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1).
   4. La gráfica es muy parecida a la de la normal estándar diferenciándose
       en que las colas de t están por encima de la normal, y el centro se
       encuentra por debajo del de la normal.
   5. Cuando los grados de libertad son altos, los valores de t coinciden con
       los de la normal.


EJERCICIO

Paso 1 Elegimos la opción analizar, donde se despliega otra ventana y
seleccionamos prueba T para una muestra.




Paso 2 Trasladamos la variable precio hacia la ventana derecha, y elegimos
aceptar, esperamos un momento y obtendremos los resultados.
Paso 1 Escoger la opción Análisis/Regresión/Lineales




Paso 2 Se escoge la variable dependiente e independiente según sea el caso
de los datos. Clic en la opción Gráficos
Paso 3 En la sección de colocar la variable X se utiliza DEPENDENT y para
ubicar Y se utiliza la opción *ZPRED, a la vez se escoge las opciones
histograma y grafico de prob. Normal. Clic en Continuar




Paso 4 Clic en Aceptar
Paso 5 Después de comparar los grados de libertad en el ejercicio además del
nivel de confianza podemos determinar si el resultado del estadístico se
encuentra dentro del rango de aceptación o rechazo.




                                 Chi- cuadrado

Pruebas paramétricas


Se llaman así a las pruebas de hipótesis que cumplen tres requisitos
fundamentales:

1 La variable de la prueba debe ser variable cuantitativa.

1 los datos se obtienen por muestreo estadístico.
2 Los datos deben ajustarse a determinadas distribuciones estadísticas.

Ejemplo

   1) La prueba basada en la distribución normal de probabilidades.
   2) La prueba de student.

Pruebas no paramétricas
Llamadas también pruebas de distribución libre son aquellas en que:

1 la variable de la prueba debe ser cualitativa o cuantitativa

2 los datos se obtienen pos muestreo estadístico

3 son independientes de cualquier distribución de cualquier probabilidad.
Ejemplo

La prueba del chi-cuadrado

Las pruebas paramétricas son más poderosas sin embargo cuando la variable
es cualitativa, solo se puede usar las pruebas no paramétricas.

Estadístico chi-cuadrado

Es un estadístico que sirve de base para una prueba no paramétrica
denominada prueba de chi cuadrado que se            utiliza especialmente para
variables cualitativas, esto es, variables que carecen de unidad y por lo tanto
sus valores no pueden expresarse numéricamente. Los valores de estas
variables son categorías que solo sirven para clasificar los elementos del
universo del estudio. También puede utilizarse para variables cuantitativas,
transformándolas, previamente, en variables cualitativas ordinales.

El estadístico Chi- Cuadrado se define por:




En donde:

n=número de elementos de la muestra

n-1= números de grados de libertad.

   =varianza de la muestra

   = varianza de la población
EJERCICIO:




Paso1 Clic en analizar, seleccionar la opción tablas de contingencia.

Paso 2 Trasladamos las variables precio y volumen a la parte derecha, y
hacemos clic en estadísticos.




Paso 3 En la ventana que se despliega escogemos la opción chi-cuadrado y
hacemos clic en continuar.
Paso 4 Cumplido los pasos anteriores, finalmente hacemos clic en aceptar
para obtener los resultados de este estadístico.




Paso 1 Escoger la opción Análisis/Regresión/Lineales
Paso 2 Se escoge la variable dependiente e independiente según sea el caso
de los datos. Clic en la opción Gráficos.




Paso 3 En la sección de colocar la variable X se utiliza DEPENDENT y para
ubicar Y se utiliza la opción *ZPRED,       a la vez se escoge las opciones
histograma y grafico de prob. Normal. Clic en Continuar




Paso 4 Clic en Aceptar
Paso 5 Después de comparar los grados de libertad en el ejercicio además del
nivel de confianza podemos determinar si el resultado del estadístico se
encuentra dentro del rango de aceptación o rechazo.




Varianza


Cuando es necesario hacer comparaciones entre tres o más medias
muéstrales para determinar si provienen de poblaciones iguales utilizamos la
técnica de análisis de varianza. Esta técnica se realiza utilizando la distribución
de probabilidad F vista anteriormente. Para el uso de esta técnica es necesario
seguir los siguientes supuestos:

   1) Las poblaciones siguen una Distribución de Probabilidad Normal
   2) Las poblaciones tienen desviaciones estándar (σ) iguales
   3) Las muestras se seleccionan de modo independiente



La técnica del análisis de     varianza descompone la variación total en dos
componentes de variación llamados variación debida a los tratamientos y
variación aleatoria.

Cuando estamos frente a un problema de análisis de varianza lo primero que
debemos hacer es identificar en términos del problema lo siguiente:
Variable dependiente o variable respuesta: Es la variable que nos interesa
medir o respuesta que se va a estudiar para determinar el efecto que tiene
sobre ella la variable independiente.
Variable independiente o factor: Es la variable o factor que puede influenciar
en la variabilidad de la respuesta o variable dependiente.

Nivel o tratamiento del factor: Es un valor o condición del factor bajo el cual
      se observa la respuesta medible.

Unidad experimental: Es el objeto (persona, animal o cosa) donde se aplica
un determinado       tratamiento, para obtener una medición de la variable
respuesta.

Error experimental: Es la variación que no se puede atribuir a un cambio de
tratamiento; es decir, la que se produce por los factores extraños que pueden
influir en la respuesta y que deben ser eliminados o controlados por el
investigador.

Aleatorización: Consiste en asignar en forma aleatoria los tratamientos a las
unidades experimentales con el propósito de remover los posibles sesgos
sistemáticos y neutralizar los efectos de todos aquellos factores externos que
no se encuentran bajo el control del investigador, pero pueden estar presentes
en el experimento.
Nosotros estudiaremos     el diseño Completamente Aleatorizado con un solo
factor o un factorial.

Este modelo es apropiado en aquellas situaciones donde se tiene un solo factor
o variable independiente con “c” niveles o tratamientos.
Ejercicio

Paso 1 Se selecciona la opción analizar, se desplegara otra barra donde se
escogerá la opción frecuencias.




Paso 2 Se traslada la variable dependiente a la parte derecha, posteriormente
hacemos chic en la opción estadísticos.




Paso 3 En esta ventana hacemos clic en varianza y luego clic en continuar.
Paso 4 Para obtener finalmente los resultados hacemos clic en la opción
aceptar, y enseguida saldrán los resultados.




ABSTRACT


When testing hypotheses, we start from an assumed value (hypothetical) in the
population parameter. After collecting a random sample, comparing the
statistical sample, as well as the average (x), with the hypothetical parameter is
compared with an assumed population mean. Then accepted or rejected the
notional value, as appropriate. Notional value is rejected only if the sample
result is very unlikely if the hypothesis is true.



A statistical test is a method, based on a random sample and meaningful,
allowing conclusions to accept or reject a hypothesis previously issued on the
value of an unknown parameter of a population.
Statistically a hypothesis test is any statement about a population and / or its
parameters.A hypothesis test is to contrast two statistical hypotheses. This
contrast involves making decisions about the hypothesis. The decision is to
reject or not a hypothesis in favor of the other. A statistical hypothesis is
denoted by “H” and is two:
- Ho: null
- H1: alternative hypothesis
Jonathanharo
Jonathanharo
Jonathanharo

Más contenido relacionado

PDF
Examen unidad 4 - Tipo 2
PPTX
Definiciones y funciones del precio
PDF
Introducción al análisis estadístico
PPT
Tema 1.1 introudcción a la estadística
DOCX
Objetivo de la calidad total
Examen unidad 4 - Tipo 2
Definiciones y funciones del precio
Introducción al análisis estadístico
Tema 1.1 introudcción a la estadística
Objetivo de la calidad total

La actualidad más candente (20)

PPTX
Unidad 1 relaciones industriales
PPT
Muestreo Por Etapas.
PPTX
Taxonomia de Beer
PPT
Instrumentos para recolectar informacion
PPTX
DOCX
Ejemplos de flujos financieros
PPTX
Moda, mediana y media
DOCX
Apuntes sobre Diagnostico Empresarial
DOCX
Ensayo sobre calidad
PPTX
Variables y escalas de medicion
PPT
Poblaciön y muestra1
PDF
Cuadro comparativo sobre estructuras de Mercado
PPTX
Desviacion media estadistica
PPT
Equilibrio economico
PPTX
Actividad 1 mapa mental (estadistica) comceptos
DOCX
Prueba de hipotesis unidad3
PDF
[2013] Sistema de control de inventarios_2a. ESTANCIA
DOCX
Caso de estudio práctico para aplicar el proceso de toma de decisiones
PPTX
Caracteristicas de los modelos economicos en mexico
Unidad 1 relaciones industriales
Muestreo Por Etapas.
Taxonomia de Beer
Instrumentos para recolectar informacion
Ejemplos de flujos financieros
Moda, mediana y media
Apuntes sobre Diagnostico Empresarial
Ensayo sobre calidad
Variables y escalas de medicion
Poblaciön y muestra1
Cuadro comparativo sobre estructuras de Mercado
Desviacion media estadistica
Equilibrio economico
Actividad 1 mapa mental (estadistica) comceptos
Prueba de hipotesis unidad3
[2013] Sistema de control de inventarios_2a. ESTANCIA
Caso de estudio práctico para aplicar el proceso de toma de decisiones
Caracteristicas de los modelos economicos en mexico
Publicidad

Similar a Jonathanharo (20)

DOC
Estadistica.doc
DOCX
MEDIDAS DE TENDENCIA CENTRAL
PPT
UTPL-ESTADÍSTICA I-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
PPTX
Contenido Del Curso De EstadíStica
PPTX
Estadística3
PPTX
Estadística3
DOCX
Guias 1,2 y 3 decimo iii p
PDF
Estadística julio 14
DOCX
Guias 1 y 2 Décimo III P
PDF
analisis-de-datos-en-ciencias-sociales-y-de-la-salud-2nbsped-8497566475-97884...
PDF
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
PPT
Tema 1.5 tendencia central y dispersión (datos no agrupados)
PPT
Tema 1.4 tendencia central y dispersión (datos agrupados)
PPTX
PPT 5.1 de datos unidimensionales_2024.pptx
PDF
medidas de tendencia central estadistica descriptiva
PDF
Estadística aplicada a la valuación 1
PPTX
Presentacion diapositivas estadisticas
PPTX
Presentacion diapositivas estadisticas
DOCX
Actividad no 7
DOCX
Conceptos
Estadistica.doc
MEDIDAS DE TENDENCIA CENTRAL
UTPL-ESTADÍSTICA I-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
Contenido Del Curso De EstadíStica
Estadística3
Estadística3
Guias 1,2 y 3 decimo iii p
Estadística julio 14
Guias 1 y 2 Décimo III P
analisis-de-datos-en-ciencias-sociales-y-de-la-salud-2nbsped-8497566475-97884...
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Tema 1.5 tendencia central y dispersión (datos no agrupados)
Tema 1.4 tendencia central y dispersión (datos agrupados)
PPT 5.1 de datos unidimensionales_2024.pptx
medidas de tendencia central estadistica descriptiva
Estadística aplicada a la valuación 1
Presentacion diapositivas estadisticas
Presentacion diapositivas estadisticas
Actividad no 7
Conceptos
Publicidad

Más de jonathanupec (20)

DOCX
PDF
Manual spss
PPTX
Presentacion de finanzas internacionales 2
PPTX
Situacion del ecuador frente al mundo
PPTX
Situacion del ecuador frente al mundo
PPTX
Presentation g20
PPTX
Tributos al comercio exterior
PPTX
Contabando y defraudaci_n_fiscal
PPTX
Abandono expreso
PPTX
Abandono expreso
DOCX
Correlación y regresion
PPTX
Envios de socorro
PPTX
Importaciones del sector público
PPTX
Donaciones
PPTX
Donaciones
PPTX
Decomiso administrativo
PPTX
Acción coactiva
PPTX
Valoracion antecedentes
PPTX
Vaaaaaaaa
PPTX
Valora00000
Manual spss
Presentacion de finanzas internacionales 2
Situacion del ecuador frente al mundo
Situacion del ecuador frente al mundo
Presentation g20
Tributos al comercio exterior
Contabando y defraudaci_n_fiscal
Abandono expreso
Abandono expreso
Correlación y regresion
Envios de socorro
Importaciones del sector público
Donaciones
Donaciones
Decomiso administrativo
Acción coactiva
Valoracion antecedentes
Vaaaaaaaa
Valora00000

Jonathanharo

  • 1. Universidad Politécnica Estatal del Carchi Comercio Internacional, Integración, Administración y Economía Empresarial. Escuela: Comercio Exterior y Negociación Comercial Internacional “Estadística Inferencial” “MODULO DEL ESTUDIANTE” Msc. Jorge Pozo Autor: Jonathan Haro Nivel: sexto Paralelo: “A” Marzo-Agosto 2012 Tulcán-Ecuador
  • 2. Contenido Modulo De Estadistica ...........................................................................................................8 CAPITULO I ...............................................................................................................................8 1.1Introducción ......................................................................................................................8 1.2 Definición De Estadística ...............................................................................................9 1.3 Clasificación De La Estadística ...................................................................................10 Estdistica Descriptiva ..........................................................................................................10 Frecuencia: ...........................................................................................................................10 1.1 Distribución De Frecuencias Absolutas Y Relativas ...........................................10 1.2 Tabla De Frecuencias: ............................................................................................11 1.3 Frecuencia Absoluta ................................................................................................11 1.4 Frecuencia Relativa:................................................................................................12 1.5 Forma De Cálculo ....................................................................................................13 1.6 Frecuencia Acumulada ...........................................................................................13 1.7 Gráficas .....................................................................................................................15 1.8 Histograma ...............................................................................................................15 1.9 Histograma Y Polígono De Frecuencias. .............................................................16 1.10 Para Trazar El Histograma, La Secuencia De Operaciones Es: .......................16 1.11 Medidas De Tendencia Central .............................................................................19 Definiciones ........................................................................................................................19 Las Medidas De Tendencia Central Más Comunes Son: .........................................19 Media Aritmética O Promedio..................................................................................20 Definición: ...........................................................................................................................20 Características De La Media Aritmética: .....................................................................20 1.12 Formula .....................................................................................................................21 1.13 Mediana (Med) ........................................................................................................23 1.14 Definición: .................................................................................................................23 1.15 Características De La Mediana..............................................................................23 1.16 Formas De Cálculo ..................................................................................................24 1.17 Mediana Para Datos No Agrupados: ....................................................................24 1.18 Mediana Para Datos Agrupados: ..........................................................................25 1.19 Ejemplo 2: .................................................................................................................26 2 Moda .................................................................................................................................30 2.1 Características De La Moda...................................................................................30 2.2 Formas De Cálculo: .................................................................................................30
  • 3. 2.3 Datos Agrupados: ....................................................................................................31 2.4 Cuartiles ....................................................................................................................32 2.5 Cálculo De Los Cuartiles ........................................................................................32 2.6 Cálculo De Los Cuartiles Para Datos Agrupados ...............................................33 2.7 Ejercicios De Cuartiles ............................................................................................33 Deciles .................................................................................................................................34 Cálculo De Los Deciles ....................................................................................................34 Ejercicio De Deciles ..........................................................................................................35 Percentiles ..........................................................................................................................37 Cálculo De Los Percentiles ............................................................................................37 Organizador Grafico De Las Medidas De Tendencia Central ...........................................39 CAPITULO II ............................................................................................................................43 Medidas De Dispersión .......................................................................................................43 2.8 Rango, Amplitud Total O Recorrido ......................................................................43 2.9 Definicion ..................................................................................................................43 2.10 Caracterìsticas .........................................................................................................44 2.11 Características Del Rango......................................................................................44 2.12 Formula .....................................................................................................................44 2.13 Formas De Cálculo. .................................................................................................44 3 La Varianza ......................................................................................................................45 3.1 Definicion ..................................................................................................................45 3.2 Forma De Cálculo ....................................................................................................46 3.3 Desviación Media ....................................................................................................47 3.4 Definición ..................................................................................................................47 3.5 Desviación Típica ....................................................................................................49 3.6 Cálculo De La Desviación Típica Para Datos No Agrupados En Clases .........50 3.7 Cálculo De La Desviación Típica Para Datos Agrupados En Clases Y Agrupados Por Frecuencias...............................................................................................50 4 .................................................................................................................................................51 5 Pasos Para Descargar E Instalar El Spss ....................................................................52 5.1 Pasos Para Resolver El Caso En Spss: ...............................................................55 6 .................................................................................................................................................62 7 Organizador Grafico De Las Medidas De Dispersión .................................................63 8 CAPITULO III ...................................................................................................................65 8.1 Tema: Muestreo .......................................................................................................65 Definicion ............................................................................................................................65
  • 4. 8.2 Muestreo Probabilístico: .........................................................................................66 8.3 Sistemático ...............................................................................................................67 8.4 Estratégico ................................................................................................................67 8.5 Muestreo No Probabilístico: ...................................................................................68 8.6 Casual. ......................................................................................................................68 8.7 Intencional ................................................................................................................68 8.8 Cuotas. ......................................................................................................................68 8.9 Determinar El Tamaño De La Muestra .................................................................69 8.10 Ejemplos: ..................................................................................................................70 8.11 Población Finita........................................................................................................72 9 Campana De Gaus ..........................................................................................................74 9.1 Ejemplos De La Campana De Gaus: ....................................................................74 9.2 1.) Calcular La Probabilidad Del Evento ...............................................................74 9.3 2.) Calcular La Probabilidad Del Evento ...............................................................75 9.4 Desarrollo..................................................................................................................76 10 Variables .......................................................................................................................78 10.1 Definición De Variable .............................................................................................78 10.2 Ejemplo De Variables:.............................................................................................79 10.3 Clasificación De Las Variables: .............................................................................79 10.4 Variable Dependiente:.............................................................................................79 10.5 Variable Independiente: ..........................................................................................80 11 CAPITULO IV...............................................................................................................83 11.1 1.3.2. Tema: Estadística Inferencial ......................................................................83 11.2 Correlación ...............................................................................................................83 11.3 Coeficiente De Correlación.. ..................................................................................83 11.4 Relación Lineal.........................................................................................................84 11.5 Coeficiente De Correlación De Pearson ...............................................................86 11.6 Interpretación.. .........................................................................................................87 11.7 Calcular El R De Pearson.......................................................................................87 12 Coeficiente De Correlación De Rangos De Sperman.............................................87 12.1 Coeficiente Intelectual .............................................................................................88 12.2 Coeficiente R De Pearson ......................................................................................89 14 Regresión Lineal ..........................................................................................................89 14.1 Definición De Correlación Lineal ...........................................................................90 14.2 El Coeficiente De Correlación Lineal De Pearson R ...........................................96 14.3 Definición Y Características Del Concepto De Regresión Lineal......................98
  • 5. 14.4 Organizador Grafico De Correlacion Y Regrecion Lineal ...............................104 14.5 Ejercicios De Correlacion Y Regrecion Lineal ..................................................105 15 Características De Las Hipótesis ............................................................................111 15.1 Ejemplo: El Contrabando En Ecuador Es Menor Que El Contrabando En Colombia .............................................................................................................................111 15.2 Clasificación De Las Hipótesis .............................................................................112 15.3 Hipótesis De Investigacion ...................................................................................112 15.4 Hipotesis Nula ........................................................................................................112 15.5 Hipotesis Alternativa ..............................................................................................112 15.6 Hipotesis Estadistica .............................................................................................112 15.7 Ejemplo De Hipótesis: ...........................................................................................112 15.8 Hipótesis De Un Valor O Dato Pronósticado: ...................................................113 15.9 Hipótesis Correlacionadas:...................................................................................113 15.10 Hipótesis De Diferencia Entre Grupos: ...............................................................114 15.11 Hipótesis Causales: ...............................................................................................114 15.12 Hipótesis Nula (Ho): .............................................................................................114 15.13 Hipótesis Alternativa (Ha): ...................................................................................115 15.14 Hipótesis Estadística: ...........................................................................................116 15.15 Hipótesis Estadísticas De Estimación:...............................................................116 15.16 Hipótesis Estadísticas De Correlación: ..............................................................116 15.17 Hipótesis Estadisticas De La Diferencia De Medias U Otros Valores: ..........116 15.18 Ejemplos De Hipotesis: ........................................................................................116 15.19 Hipótesis Descriptiva ............................................................................................116 15.20 Pasos Para La Prueba De Hipotesis.................................................................118 15.21 Prueba De Diferencias De Medias .....................................................................121 16 “T“De Student .............................................................................................................127 16.1 Características .......................................................................................................127 16.2 Grado De Libertad: ................................................................................................127 16.4 Formulacion De Hipotesis ....................................................................................128 17 Prueba De Ji- Cuadrado O .............................................................................133 17.1 Propiedades De Las Distribuciones Ji-Cuadrado..............................................133 17.2 Frecuencias Observadas ......................................................................................138 17.3 Frecuencias Esperadas (De Ho) .........................................................................138 18 Conclusiónes ..............................................................................................................142 19 Recomendaciones .....................................................................................................143 20 10. Financieros Y Técnicos. .....................................................................................144
  • 6. 21 9. Cronograma De Tareas ........................................................................................144 22 Anexos ........................................................................................................................146 22.1 Organizador Grafico De La Estadistica Descriptiva E Inferencial ...................147 22.2 Tema: Proyecto De Aplicación Al Comercio Exterior Aplicando Correlación, Regresión Lineal Simple Aplicando, Prueba De Hipótesis, T-Student Y Chi2 Con Ayuda Del Programa Spss. ..............................................................................................151 22.3 1.2 Problema ..........................................................................................................151 22.4 1.3 Objetivos...........................................................................................................151 22.5 Objetivo General ....................................................................................................151 22.6 Objetivos Específicos ............................................................................................151 22.7 3. Justificación ........................................................................................................152 1.5 Marco Teórico.......................................................................................................153 22.8 El Spss ....................................................................................................................153 22.9 Correlación Lineal ..................................................................................................154 22.10 Técnicas De Correlación...................................................................................155 22.11 Relaciones Lineales Entre Variables ..............................................................155 22.12 Diagrama De Dispersión ...................................................................................157 22.13 Coeficiente De Correlación Rectilínea De Pearson ......................................157 22.14 Correlación .........................................................................................................157 22.15 Desarrollo ............................................................................................................158 22.16 Regresión Lineal ................................................................................................160 22.17 Fases Del Modelo De Regresión Lineal .........................................................160 22.18 El Modelo De Regresión Lineal .......................................................................160 22.19 Relación Lineal ...................................................................................................161 22.20 Desarrollo ............................................................................................................163 22.21 Encontrar La Ecuación ......................................................................................165 22.22 Prueba De Hipótesis..........................................................................................168 22.23 Hipótesis Nula Y Alternativa .............................................................................168 22.24 Selección Del Nivel De Significancia ..............................................................169 22.25 Error Tipo I Y Error Tipo Ii.................................................................................170 22.26 Pasos De Una Prueba De Hipótesis ...............................................................170 22.27 Formular La Hipótesis Alternativa Ha ..............................................................170 22.28 T De Student ......................................................................................................171 22.29 Propiedades: ......................................................................................................171 22.30 Chi- Cuadrado ....................................................................................................174 22.31 Pruebas Paramétricas .......................................................................................174
  • 7. 22.32 Pruebas No Paramétricas.................................................................................174 22.33 Varianza ..............................................................................................................179 22.34 Variable Dependiente O Variable Respuesta. ...............................................180 22.35 Nivel O Tratamiento Del Factor:. .....................................................................180 22.36 Unidad Experimental .........................................................................................180 22.37 Error Experimental .............................................................................................180 22.38 Aleatorización:. ...................................................................................................180 22.39 Abstract ...............................................................................................................182 22.40 Evaluaciones De Estadistica Inferencial ........... ¡Error! Marcador no definido.
  • 8. MODULO DE ESTADISTICA CAPITULO I 1.1 INTRODUCCIÓN Los profesionales de la educación, como parte de su quehacer profesional, realizan investigación científica: evaluación de la calidad de la educación, someten a prueba diferentes métodos de comprensión lectora, estudian problemas del aprendizaje, entre otros. Es así, que contamos con Internet, como fuente general de información, que permite disponer de información educativa, por ejemplo, sobre evaluaciones muéstrales, que realiza el Ministerio de Educación y que está disponible en la página web. Una vez que conoce tanto la forma de recoger información como la forma de presentar a la misma, sea en forma de tablas o con el tratamiento realizado para elaborar una tabla de frecuencias, ahora es conveniente seguir con las características que permiten describir a un conjunto de datos que se recogen de un problema a investigarse. La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la estadística interviene cuando se quiere conocer el estado sanitario de un país, a través de ciertos parámetros como la tasa de morbilidad o mortalidad de la población. En este caso la estadística describe la muestra en términos de datos organizados y resumidos, y luego infiere conclusiones respecto de la población. Aplicada a la investigación científica, también infiere cuando provee los medios matemáticos para establecer si una hipótesis debe o no ser rechazada. La estadística puede aplicarse a cualquier ámbito de la realidad, y por ello es utilizada en física, química, biología, medicina, astronomía, psicología, sociología, lingüística, demografía, etc.
  • 9. 1.2 DEFINICIÓN DE ESTADÍSTICA La estadística es la ciencia formada por un conjunto de teorías y técnicas cuantitativas, que tiene por objeto la organización, presentación, descripción, resumen y comparación de conjuntos de datos numéricos, obtenidos de poblaciones en su conjunto de individuos o fenómenos o bien de muestras que representan las poblaciones estudiadas, así como el estudio de su variación, propiedades, relaciones, comportamiento probabilístico de dichos datos y la estimación, inferencia o generalización de los resultados obtenidos de muestras, respecto a las poblaciones que aquéllas representan. La estadística en la investigación científica, dada la necesidad de manejar y tratar en ellas grandes cantidades, progresivamente crecientes, de datos”. (http://www.AulaFacil.com) Irma Nocedo de León et al (2001), anotan que “la estadística es la ciencia encargada de suministrar las diferentes técnicas y procedimientos que permiten desde organizar la recolección de datos hasta su elaboración, análisis e interpretación. Abarca dos campos fundamentales la estadística descriptiva y la estadística inferencial. (http://www.Wikipedia: Estadísticas.)
  • 10. 1.3 CLASIFICACIÓN DE LA ESTADÍSTICA Dependiendo de cómo se analizan los datos, la Estadística se clasifica como:  ESTDISTICA DESCRIPTIVA Estadística Descriptiva.- Rama de la estadística que trata sobre la descripción y análisis estadístico de una población, que resume y presenta datos obtenidos de la población o de una muestra, mediante métodos adecuados. Tiene como objetivo caracterizar los datos, de manera gráfica o analítica, para resaltar las propiedades de los elementos bajo estudio. (http://www.Wikipedia: Estadísticas.)  FRECUENCIA: Es el número de veces que se repite un dato.  Es el número de repeticiones que presenta una observación. Se representa por ni. http://www.mitecnologico.com  Es el número de veces que aparece cualquier valor de la variable. Se representa por fi. En algunos libros de texto nos la encontraremos representada por ni. http://www.quequieredecir.com. 1.1 DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y RELATIVAS Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y resumir los datos obtenidos en la investigación de campo, para ello se concentran en tablas de frecuencia y éstas pueden ser: a) Absoluta. b) Relativa. c) Acumulada. Con el análisis de las frecuencias podemos determinar la tendencia de la variable en estudio que como ya se dijo, ésta puede ser nominal, ordinal o cuantitativa y sus respectivas escalas de medición: nominal, ordinal o por intervalos, respectivamente.
  • 11. EJEMPLO: La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las características y bondades de las carreras de Ingeniería, Química Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un cuestionario donde especificaron además de los datos personales, la carrera de preferencia. Se obtuvieron los siguientes resultados: I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M, Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I, M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q, 1.2 Tabla De Frecuencias: Carrera que prefieren los alumnos del grupo 603 del Plantel 11 del Colegio de Bachilleres. Encuesta realizada por la maestra de orientación del Plantel 11, el 12 de septiembre de 1993.  El número de columnas de una tabla es variable y depende de la información que se quiera registrar.  En nuestro ejemplo podemos suprimir la columna 2 que representa el conteo de la variable el cual se puede realizar en otras hojas de trabajo.  En la tercera columna se registra la frecuencia. 1.3 FRECUENCIA ABSOLUTA En una muestra estadística, número de veces que aparece un determinado carácter. http://nuestrosalud.com/ frecuencia-absoluta.html
  • 12. El número de los miembros de una serie estadística, que es al intervalo determinado de los significados de la cantidad variable dada casual; en particular, el número de los casos con dado o los valores dados del elemento durante todo el tiempo de las observaciones. http://www.quequieredecir.org. FRECUENCIAS ABSOLUTAS Simple (Ni) Acumulada (Ni) Ni Ni n2 ni+n2 n3 ni+n2+n3 . . . . Nn n 1.4 FRECUENCIA RELATIVA:  Cociente entre la frecuencia absoluta y el número de casos de una muestra. http://www.quequieredecir.org/frecuencia/  La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. http://www.mitecnologico.com FRECUENCIA RELATIVA Simple Acumulada hi=n1|n h1 h2=n2|n h1+h2 . . . . hn= nn/n h
  • 13. 1.5 FORMA DE CÁLCULO EJEMPLO La puntuación obtenida en un examen que se aplicó a 100 obreros de la fábrica de vidrio el Fanal, es la que se muestra en la siguiente tabla de frecuencias: 46 Resultados del examen aplicado a 100 obreros de la fábrica de vidrio el Fanal. Investigación realizada por el jefe del departamento de capacitación de la fábrica de vidrio el Fanal, el 5 de septiembre de 1993. 1.6 FRECUENCIA ACUMULADA La frecuencia acumulada (Fi) es otra característica de la muestra que nos permitirá determinar la posición de un caso particular que nos interese en comparación con el total de los elementos. ((Levin Richard & Rubin David)) DEFINICIÓN: Su definición matemática es:
  • 14. Al calcular la frecuencia acumulada (F1) podemos determinar su frecuencia relativa acumulada (Fr) en la forma ya explicada mediante la ecuación (1), esto es: n Regresemos al problema (11) de las llamadas telefónicas y calculemos la frecuencia acumulada (f1) y la frecuencia relativa acumulada (Fr). Frecuencia acumulada (Fi) de una clase es la que se obtiene sumando las frecuencias de las clases anteriores con la frecuencia de ésta. La frecuencia acumulada para la 4ta. Clase es F = 45; de este valor se infiere que hasta esta clase corresponden 45 de las 60 observaciones realizadas. También se infiere que a esta clase corresponden un número menor o igual a 43 llamadas telefónicas. La frecuencia relativa de esta clase es F = 0.75. Este valor significa que hasta esta clase corresponde el 75% de todas las llamadas.
  • 15. 1.7 GRÁFICAS Al representar en una gráfica la información concentrada en la tabla de frecuencias, ésta es un recurso visual que nos permite tener una idea clara, precisa, global y rápida acerca de las observaciones de una muestra o población. Existen muchos tipos de gráficas en las que se pueden representar la frecuencia absoluta (fi), relativa (fr) y acumulada (Fi) y con ellas podemos estimar algunos valores con la simple observación. 1.8 HISTOGRAMA Es uno de los medios expresada en % con mayor frecuencia, es una representación gráfica de la distribución de frecuencias. Se utilizan para representar tablas de frecuencias con datos agrupados en intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un rectángulo cuya altura es proporcional a la frecuencia correspondiente. http://www.monografias.com/ conceptos-de-estadistica.shtml En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la
  • 16. frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase. http://es.wikipedia.org/wiki/Histograma 1.9 HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.  El histograma es la forma más usual para analizar las características observables de una variable continua (http://www.monografias.shtml)  Histograma es la representación gráfica en el plano coordenado de las características concentradas en la tabla de frecuencias de una variable continua. (http://www.monografia.com/estadistica) 1.10 Para trazar el histograma, la secuencia de operaciones es: 1. En los ejes coordenados del plano cartesiano representamos los datos de la siguiente forma: a) En el eje de las abscisas (horizontal) se representan las clases con sus límites reales de clase y las marcas de clase (Mi) de cada intervalo. b) En el eje de las ordenadas (vertical) representamos las frecuencias absolutas en que ocurre la variable. Analicemos El Siguiente Problema: Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo que le indica al gerente de personal que realice un análisis del problema. El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad:
  • 17. 13, 19, 22, 14, 13, 16, 19, 21 23, 11, 27, 25, 17, 17, 13, 20 23, 17, 26, 20, 24, 15, 20, 21 23, 17, 29, 17, 19, 14, 20, 20 10, 22, 18, 25, 16, 23, 19, 20 21, 17, 18, 24, 21, 20, 19, 26 Con esta información decidió representarlos en una gráfica (histograma). Recuerda la secuencia de operaciones que establecimos: 1. Ordenamos los datos en sentido creciente: 10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18, 18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29. 2. Calculamos el rango R, para ello determinamos los valores mayor y menor de las puntuaciones. X n = 29 Xi = 10 3. Calculamos R = X n – X1 = 29 – 10 = 19 R = 19 4. Calculamos el número de clases (K), para ello determinamos (n) N = 48; K = 1 + 3.322 log48 = 1 + 3.322 (1.68) = 1 + 5.58 = 6.58 K = 7 5. Determinamos la amplitud de cada clase (A) R = 19 = 2.7K 7 Se han redondeado los valores de K y A porque el número de clases y la amplitud de la clase nunca serán fraccionarios.
  • 18. 6. Determinamos cada intervalo de clase y para ello calculamos los límites de clase y los registramos en la primera columna de la tabla. 7. Trazamos los ejes del plano coordenado, fijamos una escala para cada eje y representamos en el vertical las frecuencias y en el eje horizontal las clases. La mayor frecuencia es f4 = 16 por lo que con la escala establecida en cm. Marcamos 16 divisiones en el eje vertical. En el eje horizontal no es necesario iniciar por el cero, en nuestro ejemplo podemos iniciar a partir de 9, indicando que se trunca una parte del eje horizontal.
  • 19. 1.11 MEDIDAS DE TENDENCIA CENTRAL DEFINICIONES  También se conocen como medidas de ubicación. Para que entienda estos conceptos remítase al texto en la parte introductoria del capítulo (Levin Richard & Rubin David).  Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba. ((Kazmier & Díaz Mata, 1993:) 1. Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico. 2. Mostrar en qué lugar se ubica la persona promedio o típica del grupo. 3. Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. 4. Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos. LAS MEDIDAS DE TENDENCIA CENTRAL MÁS COMUNES SON:  La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior.  La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md.  La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo.
  • 20. De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las características de la media, esta es afectada por los valores extremos). La media aritmética es considerada como la mejor medida de tendencia central, por las siguientes razones: Los puntajes contribuyen de manera proporcional al hacer el cómputo de la media. Es la medida de tendencia central más conocida y utilizada. MEDIA ARITMÉTICA O PROMEDIO DEFINICIÓN:  Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos. (Kazmier & Díaz Mata)  Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos. Solo es aplicable para el tratamiento de datos cuantitativos. ((Levin Richard & Rubin David)). CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA: 1. Es una medida totalmente numérica o sea sólo puede calcularse en datos de características cuantitativas. 2. En su cálculo se toman en cuenta todos los valores de la variable. 3. Es lógica desde el punto de vista algebraico. 4. La media aritmética es altamente afectada por valores extremos.
  • 21. 5. No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas. 6. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y solo una media aritmética. 1.12 FORMULA Dónde: n= Media Aritmética Muestral Xi = Valor Típico Especifico N = Tamaño De La Muestra Σ = sumatoria. FORMAS DE CÁLCULO:
  • 22. Ejemplo 1: En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3 n = 6 (número total de datos) La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio. Ejemplo 2: Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra. Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta 5 10 5 . 10 = 50 6 15 6 . 15 = 90 7 20 7 . 20 = 140 8 12 8 . 12 = 96 9 6 9 . 6= 54 Frecuencia total = 63 430 Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).
  • 23. 1.13 MEDIANA (MED) 1.14 DEFINICIÓN:  La mediana solamente establece el valor que se encuentra utilizando la posición central dentro del conjunto. (file:/A|/tendencentral.htm)  Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados. Según el número de valores que se tengan se pueden presentar dos casos: ((Webster). Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos. Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2). 1.15 CARACTERÍSTICAS DE LA MEDIANA 1. En su cálculo no se incluyen todos los valores de la variable. 2. La Mediana no es afectada por valores extremos. 3. Puede ser calculada en distribuciones de frecuencia con clases abiertas. 4. No es lógica desde el punto de vista algebraico. FORMULA: Me= Li+ n/2 –FA ni (i)
  • 24. 1.16 FORMAS DE CÁLCULO La forma más general de calcular la mediana es la siguiente: 1.17 Mediana Para Datos No Agrupados: Los datos no agrupados son aquellos que no tienen una ordenación previa para presentarlos; por ello, se debe realizar lo siguiente: a. Con los datos recogidos se procede a ordenarlos de manera ascendente o descendente b. Establece el dato que ocupa la posición central c. Identificar el valor del dato que ocupa la posición central que vendría a ser el valor mediano. En este caso para encontrar el dato que ocupa la posición central debemos identificar si se trata de un número de datos par o impar. Si se trata de datos pares, haremos lo siguiente: Me=10/2 Con cuyo resultado contaremos la posición desde el valor menor y desde el valor mayor, por ejemplo, si tenemos los siguientes datos: 6, 9, 3, 7, 4, 8, 6, 9, 1, 2 Procedemos a ordenarlos: 1, 2, 3, 4, 6, 6, 7, 8, 9, 9, luego identificamos la posición que ocupa el valor central: M=5 Significa que desde el valor menor ubicamos el dato número 5, que para el caso es el valor 6, luego hacemos lo mismo desde el valor mayor y en este caso la posición 5 está ocupada por el valor 6. Posteriormente establecemos el promedio entre los valores encontrados y estamos encontrando el valor mediano: Me=6+6/2 M=6
  • 25. Por tanto 6 es el valor que se encuentra ocupando la posición central o el valor que divide en dos partes iguales al conjunto. Si se trata de datos impares, entonces encontramos la posición, haciendo lo siguiente: Me= n+1/ 2 Supongamos los siguientes datos: 5, 8, 3, 9, 1, 5, 7, 3, 8, 6, 4. Procedemos a ordenar los datos: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9 Ahora establecemos el dato que ocupa la posición central Me= n+1/ 2 Me=11+1/2 M=6 Identificamos el sexto valor, aquí no hay problema empezar por el menor o por el mayor puesto que será un solo valor: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9. Por simple observación llegamos a determinar que el valor mediano es: Me= n+1/ 2 M=5 1.18 Mediana Para Datos Agrupados: Para datos agrupados en una tabla de distribución de frecuencias, vamos a llevar el siguiente procedimiento: a. Con la tabla de distribución de frecuencias, encontramos la frecuencia acumulada. b. Establecemos el dato que se encuentra ocupando la posición central. Para ello utilizamos la siguiente fórmula: c. Identificamos el intervalo mediano a través de la frecuencia acumulada y la posición encontrada. d. Aplicamos la fórmula de la mediana que es la siguiente: Me= Li+ n/2 – fa(i) Ni
  • 26. Dónde: Li = límite real inferior del intervalo mediano. n= número total de observaciones. FA= frecuencia acumulada anterior al intervalo mediano. ni = frecuencia absoluta simple del intervalo mediano. i = tamaño o anchura del intervalo de clase. Ejemplo 1 Realicemos el cálculo de la mediana en el siguiente ejercicio: Me= 241+1/2 Me=121 Aplicamos la fórmula para encontrar el valor mediano: Me= Li+ n/2 – fa (i) / ni Me= 43.5
  • 27. 1.19 Ejemplo 2: El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Mediana será el promedio de los valores centrales. 21, 19, 18, 15, 13, 11, 10, 9, 5, 3 Ejemplo 3: Lo cual significa que la mediana se ubica en la posición intermedia entre los alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro: TABLA: PUNTAJE ALUMNOS 62 1 62 2 62 3 62 4 62 5 67 6 67 7 67 8 67 9
  • 28. 67 10 72 11 72 12 72 13 72 14 72 15 72 16 72 17 72 18 77 19 77 20 77 21 77 22 77 23 77 24 77 25 77 26 77 27 77 28 77 29 77 30 82 31 82 32
  • 29. 82 33 82 34 82 35 82 36 82 37 82 38 82 39 82 40 82 41 82 42 82 43 82 44 82 45 82 46 87 47 87 48 87 49 87 50 El alumno 25 obtuvo puntaje de 77 El alumno 26 obtuvo puntaje de 77 Entonces, como el total de alumnos es par debemos promediar esos puntajes: Mediana= 77+77/2 = 144/2 =77
  • 30. La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia abajo (alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron puntaje de 77 hacia arriba (alumnos 26 hasta el 50 en el cuadro). 2 MODA DEFINICIÓN.- Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más. Es el valor que se presenta con mayor frecuencia en un conjunto de datos. A una distribución que tiene una sola moda se le denomina un modal. Para un conjunto de datos poco numerosos, en los que no se repite ningún valor, no existe moda. Cuando dos valores no adyacentes tienen frecuencias máximas similares, se dice que la distribución es bimodal. A las distribuciones de mediciones que tienen varias modas se le denomina multimodales. ((Kazmier & Díaz Mata)) El valor que más a menudo se repite en un conjunto de datos. Está representado por el punto más alto de la curva de distribución de un conjunto de datos”. ((Levin Richard & Rubin David, 1996:p.140).) 2.1 CARACTERÍSTICAS DE LA MODA. 1. En su cálculo no se incluyen todos los valores de la variable. 2. El valor de la moda puede ser afectado grandemente por el método de designación de los intervalos de clases. 3. No está definida algebraicamente. 4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas. 5. No es afectada por valores extremos. 2.2 FORMAS DE CÁLCULO: Para datos no agrupados, por simple observación se puede determinar el valor o los valores de la moda, si es que existieran. Si tenemos los siguientes valores: 4, 5, 7, 5, 8, 1, 3, 5, 6, 8, 5
  • 31. Procedemos a ordenarlos para mayor facilidad de observación: 1, 3, 4, 5, 5, 5, 5, 6, 7, 8, 8. En este caso el valor modal es 5 porque es el que se repite el mayor número de veces en este grupo. Para el caso de datos agrupados en una serie ordenada de frecuencias, se considera únicamente la mayor frecuencia y el valor de la variable será el valor modal. a) Cuando trabajamos con datos agrupados en una tabla de distribución de frecuencias, deberemos considerar los siguientes pasos: b) Considerar el intervalo que mantiene la frecuencia absoluta simple más alta, lo que sería intervalo modal. c) Determinar la diferencia entre la frecuencia del intervalo modal y del pre modal. d) Determinar la diferencia entre la frecuencia del intervalo modal y del post moda 2.3 DATOS AGRUPADOS: 1= Es el exceso de frecuencia de la clase modal con respecto a la clase contigua anterior a ella. INTERVALO fi 2= Posterior a ella. 28-38 2 38-48 7 48-58 7 58-68 14 68-78 15 78-88 8 88-98 3
  • 32. 2.4 CUARTILES Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 Coincide con la mediana. 2.5 CÁLCULO DE LOS CUARTILES 1. Ordenamos los datos de menor a mayor. 2. Buscamos el lugar que ocupa cada cuartil mediante la expresión . K*N/ 4, K=1, 2,3 Número impar de datos 2, (Q1) 5, (Q2) 3, (Q3)…. 6, 7, 4, 9
  • 33. Número par de datos 2, 5,3, 4, 6, 7,1, 9 2.6 CÁLCULO DE LOS CUARTILES PARA DATOS AGRUPADOS En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas. 2.7 EJERCICIOS DE CUARTILES Calcular los cuartiles de la distribución de la tabla: DATOS fi Fi [50, 60) 8 8 [60, 70) 10 18 [70, 80) 16 34 [80, 90) 14 48 [90, 100) 10 58 [100, 110) 5 63 [110, 120) 2 65 TOTAL 65
  • 34. 1. Cálculo del primer cuartil 2. Cálculo del segundo cuartil 3. Cálculo del tercer cuartil DECILES  Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. ((Kazmier & Díaz Mata, 1993:)  Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos D5 coincide con la mediana. (((Masson /Lind /Marchal)) CÁLCULO DE LOS DECILES En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas.
  • 35. EJERCICIO DE DECILES Calcular los deciles de la distribución de la tabla: DATOS fi Fi [50, 60) 8 8 [60, 70) 10 18 [70, 80) 16 34 [80, 90) 14 48 [90, 100) 10 58 [100, 110) 5 63 [110, 120) 2 65 TOTAL 65 1. Cálculo del primer decil 2. Cálculo del segundo decil 3. Cálculo del tercer decil
  • 36. 4. Cálculo del cuarto decil 5. Cálculo del quinto decil 6. Cálculo del sexto decil. 7. Cálculo del séptimo decil
  • 37. 8. Cálculo del octavo decil 9. Cálculo del noveno decil PERCENTILES  Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. (http://www.monografia.com/estadistica).  Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. (http://www.monografias.shtml) P50 coincide con la mediana. Cálculo de los percentiles En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas.
  • 38. EJERCICIO DE PERCENTILES Calcular el percentil 35 y 60 de la distribución de la tabla: DATOS fi Fi [50, 60) 8 8 [60, 70) 10 18 [70, 80) 16 34 [80, 90) 14 48 [90, 100) 10 58 [100, 110) 5 63 [110, 120) 2 65 TOTAL 65 1. Percentil 35 2. Percentil 60
  • 39. ORGANIZADOR GRAFICO DE LAS MEDIDAS DE TENDENCIA CENTRAL Medios de Tendencia Central Son los valores centrales de una serie de datos que se desea investigar. Media Aritmética Mediana Moda C Valor promedio Es el número que más se repite Central en 1 distribución de frecuencias Valor promedio Central
  • 41. NIVELES DE LOGRO ACTIVIDADES MEDIADO AUTÓNOMO TEÓRICO BÁSICO  Análisis de las medidas de tendencia central en el  consulta de las medidas de tendencia central mediante la Aula aplicación de las TIC´S  Lectura comprensiva de frecuencias y de las  lectura comprensiva de los conceptos de las medidas de medidas de tendencias Central tendencia central TEÓRICO SUPERIOR  Análisis de la realización de las tablas de frecuencias  Aplicación de los ejercicios propuestos con datos agrupados y datos no agrupados  Realización de consultas de todos los conceptos básicos  Toma de decisiones para realizar los ejercicios con la aplicación de las Medidas de tendencia central TEÓRICO PRÁCTICO  Aplicación en ejercicios de la teoría analizada  Realización de ejercicios ACEPTABLE  Formulación de alternativas de solución  Elaboración de mente factos y lectura comprensiva TEÓRICO PRÁCTICO  Análisis de los problemas que suceden en la  Aplicación de ejercicios con datos reales del Banco Central AVANZADO sociedad. del Ecuador.
  • 43. CAPITULO II MEDIDAS DE DISPERSIÓN  Es la diferencia entre dos valores seleccionados del conjunto de datos Comprendemos pues, a la vista de estos ejemplos, la necesidad de conocer otras medidas, aparte de los valores de centralización, que nos indiquen la mayor o menor desviación de cada observación respecto de aquellos valores. Las medidas de desviación, variación o dispersión son: Rango o amplitud, desviación media y desviación típica. ((Webster)  También conocidas como medidas de variabilidad. En contraste, estas medidas se encargan de describir la variabilidad entre los valores” ((Kazmier & Díaz Mata,) 2.8 RANGO, AMPLITUD TOTAL O RECORRIDO 2.9 DEFINICION  Diferencia entre el valor observado más alto y el más pequeño. ((Masson /Lind /Marchal, 2000: p.106).)  El rango se suele definir como la diferencia entre los dos valores extremos que toma la variable. Es la medida de dispersión más sencilla y también, por tanto, la que proporciona menos información. Además, esta información puede ser errónea, pues el hecho de que no influyan más de dos valores del total de la serie puede provocar una deformación de la realidad. La amplitud total o rango se define como la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos. Cuando la variable sea continua, para el cálculo deben utilizarse los límites exactos. (http://www.monografia.com/estadistica)
  • 44. 2.10 CARACTERÌSTICAS 2.11 Características del Rango 1. Es fácil de calcular. 2. Es comúnmente usado como una medida eficaz de variabilidad. 3. Es comprensible para cualquier persona, aún cuando no conozca de estadística. 2.12 FORMULA Dónde: X máx = Valor máximo X mín = Valor mínimo r = rango 2.13 FORMAS DE CÁLCULO. Comparemos, por ejemplo, estas dos series: Serie 1: 1 5 7 7 8 9 9 10 17 Serie 2: 2 4 6 8 10 12 14 16 18 Ambas series tienen rango 16, pero están desigualmente agrupadas, pues mientras la primera tiene una mayor concentración en el centro, la segunda se distribuye uniformemente a lo largo de todo el recorrido. El uso de esta medida de dispersión, será pues, bastante restringido.
  • 45. 3 LA VARIANZA 3.1 DEFINICION El valor de la varianza, desde el punto de vista práctico, es un poco complicado de entender, porque las unidades asignadas a ellas son cuadradas, tales como metros cuadrados. Para convertir esta medida de variabilidad en unidades originales, podemos tomar la raíz cuadrada de la varianza (S2), obteniendo la desviación estándar de una muestra. La desviación estándar sirve como medida básica de variabilidad. “La varianza es la media aritmética de los cuadrados de las desviaciones de las observaciones respecto de su media aritmética. Es una medida importante de dispersión”. ((Webster) ((Webster, 2000: p. 72).) La varianza es similar a la desviación media, porque se basa en la diferencia entre cada uno de los valores del conjunto de datos y la media del grupo. La diferencia consiste en que, antes de sumarlas se eleva al cuadrado cada una de las diferencias. Para una población, se presenta la varianza mediante v (x) o, en forma más típica mediante la letra σ² (que se lee “sigma cuadrado”). ((Kazmier & Díaz Mata, 1993:) FORMULA: POBLACIÓN Dónde: N= total de observaciones de la población Xi= variable μ = media poblacional σ ²= varianza
  • 46. MUESTRA Dónde: n= tamaño de la muestra Xi= valores de la muestra = media muestral S2 = varianza 3.2 FORMA DE CÁLCULO El número de días necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y80 días. Calcular la varianza. Solución: Se suman todos los valores de una variable dividida entre el número total de datos de los que se dispone: Luego, se toman todos los valores dados y la media obtenida, se sustituye en la fórmula de la varianza. σ ²= 427,61
  • 47. 3.3 DESVIACIÓN MEDIA 3.4 DEFINICIÓN Es la medida de dispersión más importante, ya que se emplea como una medida para comparar la dispersión en dos o más conjuntos de observaciones”. ((Masson /Lind /Marchal, 2000: p.106).) La desviación típica de un conjunto de datos es una medida de cuánto se desvían los datos de su media. Esta medida es más estable que el recorrido y toma en consideración el valor de cada dato. También se puede decir que es la raíz cuadrada de la varianza. (((Masson /Lind /Marchal)) Puede definirse como la media aritmética de las desviaciones de cada uno de los valores con respecto a la media aritmética de la distribución, y de indica así: x x DM N Nótese que se toman las desviaciones en valor absoluto, es decir, que la fórmula no distingue si la diferencia de cada valor de la variable con la media es en más o en menos. Ya se habrá advertido que esta expresión sirve para calcular la desviación media en el caso de datos sin agrupar. Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviación media de estos valores. X x x x 2 -3 3 2 3 3 4 -1 1 4 -1 1 4 -1 1 5 0 0 6 1 1 7 2 2 8 3 3 8 3 3
  • 48. DM = 1,8 Veamos ahora cómo se calcula la desviación media en el caso de datos agrupados en intervalos. ni x DM N Donde observamos que ahora las desviaciones van multiplicadas por las frecuencias de los intervalos correspondientes. Además, las desviaciones son de cada centro, o marca de clase, a la media aritmética. Es decir, ni ( x m x) DM N Ejemplo: Para hallar la desviación media de la siguiente tabla referida a las edades de los 100 empleados de una cierta empresa: Clase ni 16-20 2 20-24 8 24-28 8 28-32 18 32-36 20 36-40 18 40-44 15 44-48 8 48-52 3
  • 49. Veamos cómo se procede: Marca de ni xm ni xm x x ni x x Clase 16-20 2 18 36 16,72 33,44 20-24 8 22 176 24-28 8 28-32 18 32-36 20 36-40 18 40-44 18 44-48 8 48-52 3 100 DM = 6,09 La desviación media viene a indicar el grado de concentración o de dispersión de los valores de la variable. Si es muy alta, indica gran dispersión; si es muy baja refleja un buen agrupamiento y que los valores son parecidos entre sí. 3.5 DESVIACIÓN TÍPICA  Es sin duda la medida de dispersión más importante, ya que además sirve como medida previa al cálculo de otros valores estadísticos.  La desviación típica se define como la raíz cuadrada de la media de los cuadrados de las desviaciones con respecto a la media de la distribución. Es decir,
  • 50. 2 x x S N Para datos sin agrupar, o bien: 2 x x S N 3.6 CÁLCULO DE LA DESVIACIÓN TÍPICA PARA DATOS NO AGRUPADOS EN CLASES Veamos la fórmula anterior aplicada a un caso concreto. Hallar la desviación típica de la serie: 5, 8, 10, 12, 16. 2 X x x x x 5 -5,2 27,04 8 -2,2 4,84 10 -0,2 0,04 12 1,8 3,24 16 5,8 33,64 Primero hallamos x = 10,2 Luego S = 13,76 3,71 3.7 CÁLCULO DE LA DESVIACIÓN TÍPICA PARA DATOS AGRUPADOS EN CLASES Y AGRUPADOS POR FRECUENCIAS a) Método largo: Se aplica la siguiente fórmula fx 2 S N Donde x xm x y f es la frecuencia absoluta de cada intervalo.
  • 51. b) Método abreviado o corto: La fórmula a utilizar es: 2 fd 2 fd S I N N Dónde: I : amplitud de la clase D: distancia en clases desde cada una en concreto a la clase que contiene a la media supuesta A. Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen así: Clases f 150 – 155 3 155 – 160 6 160 – 165 12 165 – 170 18 170 – 175 25 175 – 180 17 180 – 185 10 185 – 190 7 190 – 195 4 195 – 200 1 103 Respuesta: S = 9,56
  • 52. 4 PASOS PARA DESCARGAR E INSTALAR EL SPSS 1. Prender el computador 2. Descargar el programa SPSS 3. Entrar en la página 4 shared 4. Clic en archivos y poner el nombre del programa y buscar 5. Clic en descargar SPSS 6. Clic en descargar archivo esperar algunos segundo 7. Clic en descargar archivo 8. Asegurarse de no estar conectado a internet: durante la instalación el programa Para desconectar el acceso a la red hacer clic en Inicio 9. Panel de control 10. Conexiones de red. 11. Luego hacer clic con el botón secundario del mouse en el ícono de la placa de red y hacer clic en "Desactivar".
  • 53. 12. ) Ir a la carpeta donde se ubica el archivo "SPSS 17 Setup.exe" y hacer doble clic en el mismo. 13. Se abrirá una ventana que muestra el progreso de la instalación. 14. Se abre otra ventana. Seleccionar "Licencia de usuario individual" y hacer clic en "Siguiente >". En la siguiente ventana hacer clic en "Acepto los términos del contrato de licencia" y hacer clic en "Siguiente >". En la ventana de "Información de última hora" hacer clic en "Siguiente >". 15. Se abre una nueva ventana a) Completar los campos "Nombre de usuario" y "Organización" con los datos que se desee. b) Ir a la carpeta donde se ubica el archivo "keygen.exe" y hacer doble clic en el mismo. c) Atención: antes de continuar, tener en cuenta que los códigos mostrados aquí pueden diferir de los que muestra el programa en su computadora (se recomienda utilizar solamente los códigos mostrados en el programa que se utiliza al instalar y no los mostrados aquí 16. Se abre una ventana para ingresar licencia y registro de SPSS. Hacer clic en "Aceptar". 17. Se abre una nueva ventana. Seleccionar "Conseguir una licencia para mi producto ahora". 18. Clic en siguiente 19. Introducir el código de autorización que está debajo del botón "Generate" del keygen mencionado en 5b. Hacer clic en "Siguiente >".
  • 54. Aparece una ventana que indica un error en la conexión a internet. Hacer clic en "Siguiente >". 20. Clic en siguiente para que se instale el programa 21. Luego clic en inicio programas spss Aparece una ventana que indica las licencias de las que se dispone. Hacer clic en "Siguiente >". 22. Se abre una nueva ventana. Seleccionar "Conseguir una licencia para mi producto ahora". 23. Luego se introduce la licencia del producto 24. Clic en siguiente 25. Para pasar el idioma del programa a español 26. Abrir un archivo .sav o alguno de la carpeta Samples. En el menú "Edit" hacer clic en el botón "Options..." En la pestaña "General", en el área "Output", en la sección "Language" hacer clic la lista desplegable (el triángulo que apunta hacia abajo) y hacer clic en "Spanish". Repetir el paso 19 en la sección "User Interface" y hacer clic en "OK". 27. Para reconectar el acceso a la red hacer clic en Inicio / Panel de control / Conexiones de red. Luego hacer clic con el botón secundario del mouse en el ícono de la placa de red y hacer clic en "Activar".
  • 55. 4.1 PASOS PARA RESOLVER EL CASO EN SPSS: 1. Inicio/Programs/SPSS 17 for Windows/SPSS Para Windows. 2. Hacemos clic en la opción “Introducir datos” de la ventana de Bienvenida y aceptamos.
  • 56. 3. Seleccionamos en la parte inferior de la ventana la opción “Vista de Variables”, y procedemos a crear una variable 4. En la parte inferior de la ventana seleccionamos la opción “Vista de datos”, en la columna donde vemos el nombre de la variable procedemos a ingresar los datos al azar.
  • 57. 5. Para ordenar los datos ya sea en forma ascendente o descendente: Datos/Ordenar casos. 6. En esta ventana seleccionamos la variable y la trasladamos haciendo clic en la flecha de color negro. 7. Una vez que hemos trasladado la variable, seleccionamos el Orden de clasificación (en este caso Descendente) y aceptamos.
  • 58. 8. En la ventana principal de SPSS, observamos que los datos se encuentran ordenados de tal forma (de mayor a menor). 9. Para la obtención de Intervalos: Transformar/Recodificar/En distintas variables… 10. En la ventana “Recodificar en distintas variables”, trasladamos la variable “Exportaciones de Girasol” haciendo clic en la flecha de color negro. 11. En la opción “Variable de resultado” debemos colocar distintos nombres en las casillas de Nombre y Etiqueta. 12. Hacemos clic en la opción “Cambiar” y posteriormente en la opción “Valores antiguos y nuevos…”.
  • 59. 13. Dentro de la ventana “Recodificar en distintas variables: Valores antiguos y nuevos”, escogemos la opción “Rango:” iremos ingresando los intervalos, además hemos de marcar la opción “Las variables de resultados son cadenas” y colocamos una cantidad (20), en la opción “Valor nuevo” volveremos a ingresar los intervalos y los iremos añadiendo (opc. Añadir) hasta terminar. 14. Aquí nos presentan ya los datos de los intervalos ingresados en su totalidad. 15. Hacemos clic en la opción “Continuar” y tendremos en la Ventana principal de SPSS los datos en forma de intervalo.
  • 60. 16. Para desarrollar las distintas actividades estadísticas: Analizar/Estadísticos descriptivos/Frecuencias… 17. Dentro de la ventana “Frecuencias”, seleccionamos la Variable “Exportaciones de Girasol” y la trasladamos haciendo clic en la flecha de color negro. 18. Posteriormente hacemos clic en la opción “Estadísticos”.
  • 61. 19. Ya en la ventana “Frecuencias: Estadísticos”, marcamos todas las operaciones estadísticas que necesitemos y hacemos clic en “Continuar”. 20. De retorno en la ventana “Frecuencias”, hacemos clic en la opción “Gráficos”, seleccionamos la mejor gráfica y Hacemos clic en la opción “Continuar”. Gráficos histogramas. 21. Nuevamente en la ventana “Frecuencias”, hacemos clic en la opción “Aceptar” y podremos visualizar los resultados finales.
  • 63. 5 ORGANIZADOR GRAFICO DE LAS MEDIDAS DE DISPERSIÓN Medidas de Dispersión Son aquellas medidas que se encuentran alejadas del centro de una distribución de frecuencias. Rango Desviación Desviación Varianza Media Típica
  • 64. NIVELES DE LOGRO ACTIVIDADES MEDIADO AUTÓNOMO TEÓRICO BÁSICO  Análisis de las medidas dispersión.  consulta de las medidas de dispersión mediante la aplicación  Lectura comprensiva de las medidas de dispersión de las TIC´S  Lectura comprensiva de los conceptos de las medidas de dispersión TEÓRICO SUPERIOR  Análisis de la realización de las medidas de dispersión  Aplicación de los ejercicios con datos agrupados y datos no agrupados propuestos  Toma de decisiones para realizar los ejercicios con la  Realización de consultas de todos aplicación de las Medidas de dispersión los conceptos básicos TEÓRICO PRÁCTICO ACEPTABLE  Aplicación en ejercicios de la teoría analizada y  Realización de ejercicios a través conocimiento del programa spss para la aplicación de del programa SPSS las medidas de tendencia central.  Elaboración de mente factos y  Formulación de alternativas de solución. lectura comprensiva TEÓRICO PRÁCTICO AVANZADO  Análisis de los problemas que suceden en la sociedad.  Aplicación de ejercicios con datos reales de la Banco central del Ecuador
  • 65. CAPITULO III 5.1 TEMA: MUESTREO Existen estudios en el que queremos conocer ciertas características de un grupo de personas o autos a los que llamaremos población de manera que no se los puede estudiar a todos porque son numerosos o porque su naturaleza se vuelve inaccesible, existe otro recurso que es estudiar una parte que se llama MUESTRA, generalmente cuando el n>100 se lo llama población pero si n<100 a toda la población se la puede llamar muestra. Se puede estudiar el muestreo estadístico y el muestreo no estadístico en que el primero se lo escoge completamente al azar sin ninguna instrucción predeterminada en cambio el segundo tiene una instrucción al seleccionar los elementos de la muestra. MUESTRA DEFINICION Una muestra es un conjunto de medidas u observaciones tomadas a partir de una población dada; es un subconjunto de la población. Desde luego, el número de observaciones en una muestra es menor que el número de posibles observaciones en la población, de otra forma, la muestra será la población misma. Las muestras se toman debido a que no es factible desde el punto de vista económico usar a toda la población. En algunos casos es imposible recolectar todas las posibles observaciones en la población. http://www.vitutor.com/estadistica/descriptiva/a_1.html Una muestra es un conjunto de medidas u observaciones tomadas a partir de una población dada; es un subconjunto de la población. Desde luego, el número de observaciones en una muestra es menor que el número de posibles observaciones en la población, de otra forma, la muestra será la población misma. Las muestras se toman debido a que no es factible desde el punto de vista económico usar a toda la población. En algunos casos es imposible
  • 66. recolectar todas las posibles observaciones en la población. http://www.vitutor.com/estadistica/descriptiva/a_1.html EJEMPLO Si se desea estimar el gasto promedio anual de los estudiantes del C.B., se extraería una muestra formada por cierto número de estudiantes, se determinaría el gasto anual correspondiente a cada uno de ellos y después se obtendría el promedio. Se utiliza una muestra debido a que simplemente no se tiene el tiempo ni el recurso para establecer el contacto con todos los estudiantes del C.B., aun cuando es posible hacerlo. 5.2 MUESTREO PROBABILÍSTICO: Aleatorio: Asigna un número a cada uno, selecciona la muestra a través de números aleatorios. El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande. ((Kazmier & Díaz Mata,) Muestreo en el que todas las muestras tienen la misma probabilidad de ser seleccionadas y en el que las unidades obtenidas a lo largo del muestreo se devuelven a la población. 2) Muestreo en el que la muestra aleatoria está formada por variables aleatorias independientes e idénticamente distribuidas a la variable aleatoria poblacional. Sinónimo de Muestreo aleatorio con reemplazamiento. http://www.mitecnologico.com/
  • 67. 5.3 Sistemático: Lista completa del universo selecciona cada individuo cada 10 individuos.  Se practica cuando se dispone de una lista de todas las unidades Muéstrales, en un orden independiente de la variable que se desea medir. http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf  Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra. http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html 5.4 Estratégico: Son tamaños de la muestra de cada extracto depende de los necesidades. Muestreo en el que la población se divide previamente en un número de subpoblaciones o estratos, prefijado de antemano. Dentro de cada estrato se realiza un muestreo aleatorio simple. (http://www.AulaFacil.com, http://www.AulaFacil.com) Este muestreo considera categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades, etc. (muestra. http:// www.wikipedia.)
  • 68. 5.5 MUESTREO NO PROBABILÍSTICO: 5.6 Casual: Entrevista a los individuos en forma casual (Ejemplo: lo que pasan por la calle).  Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. http://maxsilva.bligoo.com  Se usa en los casos en no es posible seleccionar los elementos, y deben sacarse conclusiones con los elementos que estén disponibles http://sitios.ingenieria-usac.edu/teoria.html 5.7 Intencional: Selecciona al individuo según el criterio de un experto (Ejemplo: dueños a un restaurante).  Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. http://maxsilva.bligoo.com/Metodos-de-Muestreos-no-Probabilist.html  Muestreo en el que la persona que selecciona la muestra procura que esta sea representativa; por consiguiente, la representatividad depende de su intención u opinión, y la evaluación de la representatividad es subjetiva. No tiene fundamento probabilístico. http://sitios.ingenieria-.html 5.8 Cuotas: Cada entrevistado debe estar dentro de cada categoría (Ejemplo: hombres y mujeres).  También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. http://www.psico.uniovi.es/Dptg.html
  • 69.  En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. (http://www.monografias.shtml) 5.9 Determinar El Tamaño De La Muestra Hay que tener mucho cuidado en determinar la muestra si es demasiado grande la investigación puede existir un desperdicio de recursos si es demasiado pequeña no lleva a tener resultados sin uso práctico. Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente. 1. Que el objeto y objetivo de la investigación sea interesante. 2. El nivel de confiablidad con el que trabaja se recomienda el 95% ^ 99%, significa que de 100 casos, se espera que el 95 de ellos se hallan dentro del intervalo construido y que 5 se hallan fuera del intervalo sea a la derecha o izquierda. 3. Las probabilidades reales de ciertas características estén presentes en la investigación que debe variar entre (0-1) P+Q=1 Ejemplo. P=0.5; -> Q=0.5 P=0.3; -> Q=0.7 4. El error de muestreo puede ser según el investigador que puede ser entre el 1% ^ 9% máximo es recomendable entre el 1% ^ 9% máximo es recomendable entre el 1% ^5%. 5. Aplicar las fórmulas adecuadas para poblaciones finitas e infinitas. Si el nivel de coeficiente es 95%.
  • 70. Si el nivel de confianza es 99%. 5.10 EJEMPLOS: 1.- Se desea calcular e tamaño de la muestra que será aplicado a productos de papas existen 4528 productores, el error o límite aceptable es del 5%.
  • 71. 2.-Cuando Exista La Probabilidad De Ocurrencia P^O= probabilidad de ocurrencia. Una empresa dedicada a la venta de artículos y accesorios para vehículos desea conocer el grado de aceptación de sus productos entre los propietarios de vehículos de la ciudad por lo cual se estabilicen las siguientes condiciones. a) Nivel de confianza 95% b) N= 46720 c) E= 4% 3.- según un departamento de una empresa consecuencia de un trauma de coberturas desea conocer los km recorridos durante una semana. a) El error muestra máximo no debe pasar a 20km b) Nivel de confianza 95,44% Z=2,05 c) S= 195 km
  • 72. 5.11 POBLACIÓN FINITA  Es aquella que indica que es posible alcanzarse o sobrepasarse al contar. http://www.gestiopolis.com/recursos/expertpagans/eco/44/estadistica.htm  Es aquella que posee o incluye un número limitado de medidas y observaciones. http://www.gestiopolis.com/recursos/experto//pagans/eco/44/estadistica.htm 1.-Suponga que el cantón de Guamote está empeñado en recibir un proyecto para que sus habitantes tengan acceso a la salud, con las siguientes condiciones: X= 95%; z= 1,96 S= Varianza (0,4)2 E =5% n= (0,4) n = (1,96)2(0,4)2 (0,05)2 n = 246 viviendas 2.-El gerente de una estación de televisión quiere calcular el porcentaje de personas que hay en un determinado programa se pide una muestra que le somete a una encuesta con las siguientes condiciones; a) E= 3% b) = 99%
  • 73. c) La proporción de personas que presume que miran el programa se estima en el 65% n = 1683 3.-El cantón Espejo tiene 15614 habitantes se dedica a investigar sobre la aceptación para la ordenanza municipal. Para dicha investigación se encarga la UPEC aplicando una encuesta. A pedido del Alcalde de la localidad, el error máximo es de 2,5% n = 1451
  • 74. 6 CAMPANA DE GAUS 6.1 Ejemplos de la campana de GAUS: 6.2 1.) Calcular La Probabilidad Del Evento P (-2.8 Z 0) P= 0.4974 P= 49.74%
  • 75. DESARROLLO a) P (-3.6 Z 0) Z = -3.6 b)P (-2.02 Z 0) Z = -2.02 P= 0.4998 P= 0.4783 P= 49.98% P= 43.83% C) P (-1.4 Z 0) Z = -1.4 P= 0.4192 P= 41.92% 6.3 2.) Calcular La Probabilidad Del Evento P (1.02 Z 2.97) 1.02 y 2.96= A (0^2.97)- A (0^1.02) = 0.4985 – 0.3461 = 0.1524 =15.24%
  • 76. 6.4 DESARROLLO a) P (0.5 Z 1.09) b) P (2.04 Z 3.16) c) P (1.84 Z 1.96) 0.5 y 1.09 = A (0^1.09)- A 0.5 y 3.16 = A (0^3.16)- A 1.84 y 1.96= A(0^1.96)- A (0^0.5) (0^0.5) (0^1.84) = 0.3621- 0.1915 = 0.4992-0.4793 = 0.4750– 0.4671 = 0.1706 = 0.0199 = 0.1524 =17.06% =01.99% =00.79% 3.) Calcular La Probabilidad Del Evento P (-3.5 Z -3.08) A (-3.5 ^ - 3.08)= A (-3.5^0) - A (-3.08 ^0) = 0.4998-0.4990 = 0.0008= 00.08% DESARROLLO a) P (--2.36 Z -1.43) b) P (-1.75 Z -0.45) A (-2.36 ^ - 1.43)= A (-2.36 ^0) - A (--1.43 A (-1.75 ^ - 0.45)= A (-1.75 ^0) - A (-0.45^0) ^0) = 0.4599 -0.1736 = 0.4909-0.4236 = 0.2863= 28.63% = 0.0673 = 06.73%
  • 77. 4) Calcular la probabilidad del evento P (-1.03 A 2.94) P (-1.03 Z 2.94) A (-1.03 ^ 2.94)= A (-1.03 ^ 0) + A (0 ^ 2.94) = 0.3485 + 0.4984 = 0.8469=84.69% DESARROLLO a) P (-0.5 Z 12.76) a) P (-0.2 Z 1.01) A (-0.5 ^ 16.76)= A (-0.5 ^ 0) + A (0 ^ 12.76) A (-0.2 ^ 1.01)= A (-0.2 ^ 0) + A (0 ^ 1.01) = 0.1915+0.4971 = 0.0793 + 0.3438 +0.3438 = 0.6886 =68.86% = 0.4231=42.31% 5.) Calcular La Probabilidad Del Evento P (Z > 2.03) A=0.5-área entre A=0.5-0.47=0.0212 A=2.12%
  • 78. DESARROLLO a) P (Z >1.96) a) P (Z >2.33) A=0.5-área entre 1.96 a) P (Z >2.58) A=0.5-área entre 2.33 A=0.5-0.4750=0.025 A=5-área entre 2.58 A=1-0.4901 = 0.5099 A=2.5% A=5-0.4950=4.505 A=50.99% A=450.5% 7) Calcular la probabilidad del evento. DESARROLLO a) P (Z < -1.96) b) P (Z < -2.58) P=0.5-0.4750 P=0.5-0.4750 P=0.025 P=0.05 p=2.5% P=5% 7 VARIABLES 7.1 DEFINICIÓN DE VARIABLE  Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población.
  • 79.  Son aquellas cualidades o características que tiene un individuo o población y puede ser medido tanto cuantitativa como cualitativamente. http://www.e-torredebabel.com/Psicologia/Vocabulario/Variable.htm 7.2 EJEMPLO DE VARIABLES: 1. Edad de las personas 2. Nacionalidad 3. Nivel de ingresos 4. Sexo motivación 5. Color de piel 6. Nivel de ansiedad 7. Número de nacimientos 8. Estado civil 9. Peso 10. Estatura 11. Religión 7.3 CLASIFICACIÓN DE LAS VARIABLES: a) Variable independiente b) Variable dependiente 7.4 VARIABLE DEPENDIENTE: En investigación, se denomina variable independiente a aquélla que es manipulada por el investigador en un experimento con el objeto de estudiar cómo incide sobre la expresión de la variable dependiente. A la variable independiente también se la conoce como variable explicativa, y mientras que a la variable dependiente se la conoce como variable explicada. Esto significa
  • 80. que las variaciones en la variable independiente repercutirán en variaciones en la variable dependiente.http://www.cx/ /var_dependientes_independientes.htm 7.5 VARIABLE INDEPENDIENTE: Es aquella cuyo valor no depende de otra variable. Se podría decir que son características controladas por el investigador. Los cambios en los valores de este tipo de variables determinan cambios en los valores de otra (variable dependiente).http://grupos.emagister.comvariables.com EJEMPLOS: VARIABLE INDEPENDIENTE VARIABLE DEPENDIENTE  Consumo Excesivo De Cigarrillo * Causa Enfermedades Graves En El Ser Humano.  Mayor Demanda De Un Producto * Genera Más Producción.  Mayores Exportaciones * Generan Más Ingresos Al País.  Menor Control En La Frontera * Causa Mayor Contrabando. a. Variable independiente Es aquella característica o propiedad que supone ser la causa del fenómeno estudiado. Además es la variable que el investigador manipula. Ejemplo:  El uso de dentífrico.  Años estudiados. b. Variable dependiente Es el factor que es observado y medido para determinar el efecto de la variable independiente.
  • 81. Ejemplo:  El uso de un dentífrico (v. independiente), quita o no caries (v. dependiente).  El consumo excesivo de chocolates (v. independiente), produce caries (v. dependiente).  Los años de estudio (v. independiente), aumenta el salario (v. dependiente).
  • 82. NIVELES DE LOGRO ACTIVIDADES MEDIADO AUTÓNOMO  Lectura comprensiva del muestreo y de la  Organizador gráfico del muestreo TEÓRICO BÁSICO determinación del tamaño de la muestra  Consulta y lectura comprensiva de los  Análisis de la Campana de Gauss conceptos de muestreo TEÓRICO SUPERIOR  Análisis de la realización de las gráficas de la campana  Análisis de los conceptos investigados de Gauss.  Comprensión de lectura.  Toma de decisiones para realizar los ejercicios con la aplicación del muestreo TEÓRICO PRÁCTICO  Aplicación en ejercicios de la teoría analizada  Aplicación de los ejercicios propuestos del ACEPTABLE muestreo  Formulación de alternativas de solución  Realización de ejercicios de la campana de gauss TEÓRICO PRÁCTICO  Análisis de los problemas que suceden en la sociedad.  Aplicación de ejercicios con datos reales AVANZADO planteados por el docente  Análisis de las variables dependientes e independientes de la sociedad.  Investigación de ejemplos de las variables.
  • 83. CAPITULO IV 7.6 TEMA: ESTADÍSTICA INFERENCIAL Rama de la estadística que estudia el comportamiento y propiedades de las muestras, y la posibilidad y límites de la generalización de los resultados obtenidos a partir de aquellas a las poblaciones que representan. Esta generalización de tipo inductivo, se basa en la probabilidad. También se le llama también estadística matemática, por su complejidad matemática en relación a la estadística descriptiva. (muestra. http:// www.wikipedia.) Tiene como objetivo generalizar las propiedades de la población bajo estudio, basado en los resultados de una muestra representativa de la población. Es una parte de la Estadística que comprende los métodos y procedimientos estadísticos en los que interviene la aplicación de modelos de probabilidad y mediante los cuales se realiza alguna afirmación sobre poblaciones con base en la información producida por muestras para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). (http://www.Wikipedia: Estadísticas.) 7.7 CORRELACIÓN La correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad (http://es.correlacion-estadistica.org) 7.8 Coeficiente de correlación.- se expresa de una manera cuantitativa la magnitud y división de una relación se la designa con la letra x puede variar entre +1 a -1 el signo nos dice si la relación es positiva o negativa.
  • 84. Como +1 es el mejor número posibles este representa una relación perfecta de una relación positiva. Si el coeficiente es menor a 1 que la relación es perfecta y la relación es negativa. Cuando la correlación es cero (0) no existe una relación entre X y Y significa que X y no crece y dúrese la recta es horizontal. 7.9 Relación lineal.- Entre dos variables es aquella que puede representarse en un plano cartesiano con una mayor exactitud mediante una línea recta por la ecuación Y= bx + a Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El más conocido es el coeficiente de correlación de Pearson, que se obtiene dividiendo la covarianza de dos variables por el producto de sus desviaciones estándar. EJEMPLOS La tabla muestra un salario mensual que perciben 5 agentes de ventas, el valor de dólares. Agente X mercancía Variable Variable vendida $ salario $ X Y 1 0 500 0 500 2 1000 900 1000 900 3 2000 1300 2000 1300 4 3000 1700 3000 1700 5 4000 2100 4000 2100
  • 85. La ecuación nos indica la relación entre el salario y la mercadería vendida, esto nos indica que Y se incrementa 0,40 por cada unitario de X, con esta relación podemos predecir cualquier valor de Y si solo se conoce el valor de x Así un agente vende $ 1500 de mercancía y su salario igual a $1100
  • 86. 7.10 COEFICIENTE DE CORRELACIÓN DE PEARSON Todo coeficiente de correlación que no sea cero indica cierto grado de relación entre 2 variables, lo que el grado de intensidad es fuerte o débil de una interpretación matemática pura, el hecha de que 2 variables tienden o aumentan o disminuir sobre cada uno de ellos. Matemáticamente entre dos variables r lo interpreta como Interpretación.- que tan dorado es el coeficiente de orientación desde de r=0 indica cierto grado de relación entre 2 variables que grado. Intensidad de relación se puede considerar si la relación es fuerte o débil. EJEMPLO ESTUDIANTES PRUEBA DE EXAMEN DE AUDICIÓN HONORABILIDAD MENTAL María 18 82 Olga 15 68 Susana 12 60 Aldo 9 32 Juan 3 18
  • 87. María 18 18 Olga 15 32 Susana 12 60 Aldo 9 68 Juan 3 82 María 18 18 Olga 15 82 Susana 12 68 Aldo 9 60 Juan 3 32 7.11 Interpretación.- Que tan elevado es el coeficiente de correlación dado, todo r ≠0 indica cierto grado de relación entre 2 variables que grado de intensidad de relación se puede considerar si la relación es fuerte o débil. 7.12 Calcular el r de Pearson. ESTUDIANTE COEFICIENTE PUNTAJE INTELECTUAL 1 110 1 2 112 1.6 3 118 1.2 4 119 2.1 5 122 1.8 6 125 2.6 7 127 2 8 130 3.2 9 132 2.6 10 134 3 11 136 3.6 12 138 19 100-140 (1-4) COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMAN Cuando una o más variables son solo de escala ordinal su fórmula matemática es: N= números de parejas de rango
  • 88. Sujeto Orden dado Orden dado DI Di ² el psicólogo por el R( xi) - (yi) A(Rxi) psicólogo B(Ryi) 1 6 5 1 1 2 5 3 2 4 3 7 4 3 9 4 10 8 2 02.25 5 2.5 1 1.5 12.25 6 2.5 6 3.5 1 7 9 10 1 4 8 1 2 1 4 9 11 9 2 9 10 4 7 3 9 12 8 11 3 0 12 12 0 7.13 COEFICIENTE INTELECTUAL 1 110 1 2 112 1.6 3 118 1.2 4 119 2.1 5 122 1.8 6 125 2.6 7 127 2 8 130 3.2 9 132 2.6 10 134 3 11 136 3.6 12 138 19 100-140 (1-4)
  • 89. 7.14 COEFICIENTE R DE PEARSON X Y X2 Y2 Xy María 18 82 324 1476 Olga 15 68 225 1020 Susana 12 60 144 7200 Aldo 9 32 81 288 Juan 3 18 9 54 Ex 157 Ey= 260 Ex= 783 Ey= 16296 Exy= 3558 R= 0.98 REGRESIÓN LINEAL La relación y la correlación están íntimamente ligadas, ambos implican la relación entre 2 variables y utilizan el mismo conjunto de los datos básicos. La relación se encuentra el uso de la relación para determinar una PREDICCION, cuando la relación es perfecta, esto es cuando todos los puntos están sobre la recta y se utilizaría para señalar la predicción, la situación se hace más compleja cuando la relación es imperfecta. Esta es la recta es la línea de la regresión por los mínimos cuadrados la distancia vertical en cada punto y la recta representa el error de la producción
  • 90. parecía el error total de la suma de la producción para que una el error total seria la suma equilibrada y _ y´ El error total de producción presentado esta dado por ecuación de regresión lineal para reproducir el lado x Y´=valor reproducido By = pendiente Ay= ordenada al origen Ecuación por calcular los constantes de regresión 7.15 DEFINICIÓN DE CORRELACIÓN LINEAL En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las notas de la asignatura Estadística I y las de Matemáticas I. Una primera aproximación al problema consistiría en dibujar en el plano R2 un punto por cada alumno: la primera coordenada de cada punto sería su nota en estadística, mientras que la segunda sería su nota en matemáticas. Así, obtendríamos una nube de puntos la cual podría indicarnos visualmente la existencia o no de algún tipo de relación (lineal, parabólica, exponencial, etc.) entre ambas notas.
  • 91. Otro ejemplo, consistiría en analizar la facturación de una empresa en un periodo de tiempo dado y de cómo influyen los gastos de promoción y publicidad en dicha facturación. Si consideramos un periodo de tiempo de 10 años, una posible representación sería situar un punto por cada año de forma que la primera coordenada de cada punto sería la cantidad en euros invertidos en publicidad, mientras que la segunda sería la cantidad en euros obtenidos de su facturación. De esta manera, obtendríamos una nube de puntos que nos indicaría el tipo de relación existente entre ambas variables. En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. EJEMPLOS La ecuación por los mínimos cuadrados esta dado por la ecuaciónde regresión lineal para predecir Y lado X. Y´=valor reproducido by = pendiente ay= ordenada al origen Ecuación para calcular la constante de regresión
  • 92. Ejemplo de aprovechamiento 2 Estudiante X Promedio de Y XY X numero calificaciones 1 110 1 110 12100 2 112 1.6 179.2 12544 3 118 1.2 141.6 13424 4 119 2.1 249.9 14161 5 122 2.6 317.2 14384 6 125 1.8 225 15625 7 127 2.6 330.2 16129 8 130 2 260 16900 9 132 3.2 422.4 17421 10 134 2.6 384.4 17456 11 136 3 408 18496 12 138 3.6 496.8 19044 X 4 3 2 1 110 120 130 140
  • 93. Una psicóloga del desarrollo está interesada si es posible utiliza alturas de los jóvenes para producir en un posible estatura en la edad adulta y ella reúne las siguientes datos de la tabla. a) Trace la grafica b) Obtener la línea de regresión por mínimo cuadrados c) En base a estos datos aquí esta estatura podría producir para una persona de 20 años si a los 3 años de edad tiene una altura de 42 pulgadas. Individuo Altura la edad de Altura a la edad 3 años pulgadas de 20 años y Xy X 2 pulgada 1 30 59 1770 900 2 30 63 1890 900 3 32 62 1984 1024 4 33 67 2211 1059 5 34 65 2210 1156 6 35 61 2135 1225 7 36 69 2484 1296 8 38 66 2508 1444 9 40 68 2720 1600 10 41 65 2665 1681 11 41 73 2993 1681 12 43 68 2924 1849 13 45 71 3195 2025 14 45 74 2924 2025 15 47 71 3195 2209 16 48 75 3330 2304 3337 3600 618 1077 41956 24408
  • 94. x 50 40 30 20 10 5 10 15 20 25 30 35 40 45 50 55 60
  • 95. Una neuróloga sospecha que su vela de exótica es una región del cerebro, se asociación el comportamiento agresivo del individuo con neurotransmisor cerebral los datos aparecen en una tabla de nutrición los datos promedios de 6 meses. 2 Menos sujetos Tabla de nivel Numero de XY Y exótica(Y) egresos 1 0.32 6 1.92 0.1024 2 0.35 3.8 1.33 0.1225 3 0.38 3 1.140 0.1444 4 0.41 5.1 2.091 .1681 5 0.43 3 1.290 0.1849 6 0.51 2.8 1.938 0.2601 7 0.53 2.4 1.272 .2809 8 0.60 3.5 2.100 0.3600 9 0.63 2.2 14.467 0.3969
  • 96. x 8 6 4 2 y 0.3 0.4 0.5 0.6 0.7 a) Hoja de grafica b) Ecuación de regresión lineal c) Cuál es el número de actos agresivos que podría producir y éxito numérico de menos que todo un nivel de exótica 0.46 min gramos 7.16 EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON R Cuyo valor oscila entre –1 y +1:
  • 97. Correlación tiende a ser lineal directa (mayores valores de X significan mayores valores de Y), y se aproxima a –1 cuando la correlación tiende a ser lineal inversa. Es importante notar que la existencia de correlación entre variables no implica causalidad. NOTA: si no hay correlación de ningún tipo entre dos v. a., entonces tampoco habrá correlación lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo nos dice que no hay correlación lineal, pero puede que la haya de otro tipo. El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variable
  • 98. 7.17 Definición y características del concepto de Regresión Lineal En aquellos casos en que el coeficiente de regresión lineal sea “cercano” a +1 o a –1, tiene sentido considerar la ecuación de la recta que “mejor se ajuste” a la nube de puntos (recta de mínimos cuadrados). Uno de los principales usos de dicha recta será el de predecir o estimar los valores de Y que obtendríamos para distintos valores de X. Estos conceptos quedarán representados en lo que llamamos diagrama de dispersión: La ecuación de la recta de mínimos cuadrados (en forma punto-pendiente) es la siguiente Si queremos estudiar la relación existente entre ambas variables, siguiendo con el ejemplo anterior referente a la relación entre las ventas de una empresa ( ) t V y sus gastos en publicidad ( ) t GP, lo que podemos hacer es representar
  • 99. gráficamente el modelo matemático lineal que podemos considerar para analizar dicha relación. EJEMPLO Estudiante IQ Promedio de XY X2 numero X Y calificaciones 1 110 1 110 12100 2 112 1.6 179.2 12544 3 118 1.2 141.6 13424 4 119 2.1 249.9 14161 5 122 2.6 317.2 14384 6 125 1.8 225 15625 7 127 2.6 330.2 16129 8 130 2 260 16900 9 132 3.2 422.4 17421 10 134 2.6 384.4 17456 11 136 3 408 18496 12 138 3.6 496.8 19044 4 3 2 1 110 120 130 140
  • 100. O una psicóloga del desarrollo está interesada si es posible utiliza alturas de los jóvenes para producir en un posible estatura en la edad adulta y ella reúne las siguientes datos de la tabla. d) Trace la grafica e) Obtener la línea de regresión por mínimo cuadrados f) En base a estos datos aquí esta estatura podría producir para una persona de 20 años si a los 3 años de edad tiene una altura de 42 pulgadas. Individuo Altura la edad Altura a la de 3 años edad de 20 xy X2 pulgadas años y pulgada 1 30 59 1770 900 2 30 63 1890 900 3 32 62 1984 1024 4 33 67 2211 1059 5 34 65 2210 1156 6 35 61 2135 1225 7 36 69 2484 1296 8 38 66 2508 1444 9 40 68 2720 1600 10 41 65 2665 1681 11 41 73 2993 1681 12 43 68 2924 1849 13 45 71 3195 2025 14 45 74 2924 2025 15 47 71 3195 2209 16 48 75 3330 2304 3337 3600 618 1077 41956 24408
  • 101. 50 40 30 20 10 5 10 15 20 25 30 35 40 45 50 55 60 Una neuróloga sospecha que su vela de exótica es una región del cerebro, se asocia con el comportamiento agresivo del individuo con neurotransmisor cerebral los datos aparecen en una tabla de nutrición los datos promedios de 6 meses.
  • 102. Menos Tabla de nivel Numero de XY Y2 sujetos exótica(Y) egresos 1 0.32 6 1.92 0.1024 2 0.35 3.8 1.33 0.1225 3 0.38 3 1.140 0.1444 4 0.41 5.1 2.091 .1681 5 0.43 3 1.290 0.1849 6 0.51 2.8 1.938 0.2601 7 0.53 2.4 1.272 .2809 8 0.60 3.5 2.100 0.3600 9 0.63 2.2 14.467 0.3969 4.16 32.8 14.467 2.0202 Y 8 6 4 2 X 0.3 0.4 0.5 0.6 0.7
  • 103. d) Hoja de grafica e) Ecuación de regresión lineal f) Cuál es el número de actos agresivos que podría producir y éxito numérico de menos que todo un nivel de exótica 0.46 min gramos
  • 104. 7.18 ORGANIZADOR GRAFICO DE CORRELACION Y REGRECION LINEAL CORRELACIÓ N Expresa de una manera cuantitativa la magnitud y dirección de una relación entre 2 variables. Se lo designa con la letra ry puede variar entre +1 a -1 el signo significa si la relación es negativa o positiva. CARACTERÍST ICAS Relación perfecta (+ o -) Relación Imperfecta (+ o -) Relación Lineal COEFICIENT COEFICIENT E DE CLASIFICACI E DE PEARSON ÓN SPERMAN
  • 105. 7.19 EJERCICIOS DE CORRELACION Y REGRECION LINEAL El número de españoles (en millones) ocupados en la agricultura, para los años que se indican, era: Año 1980 1982 1984 1986 1988 1990 1992 1994 Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16 a) ¿Podría explicarse su evolución mediante una recta de regresión? b) ¿Qué limitaciones tendrían las estimaciones hechas por esa recta? [sol] a) Si; b) No vale para hacer estimaciones alejadas de los años considerados. 2. Asocia las rectas de regresión y = –x +16, y = 2x – 12, y = 0,5x + 5 a las nubes de puntos siguientes: 3. Asigna los coeficientes de correlación lineal r = 0,4, r = –0,85 y r = 0,7, a las nubes del problema anterior. a) Respectivamente: (c), (b), (a). b) Respectivamente: (a), (b), (c) Tipo II. Cálculo de la correlación y regresión [a) Calcula la recta de regresión de Y sobre X en la distribución siguiente realizando todos los cálculos intermedios. X 10 7 5 3 0 Y 2 4 6 8 10
  • 106. b) ¿Cuál es el valor que correspondería según dicha recta a X = 7? a) y = –0,8276x +10,138; b) 4,3448. 5. El número de bacterias por unidad de volumen, presentes en un cultivo después de un cierto número de horas, viene expresado en la siguiente tabla: X: Nº de horas 0 1 2 3 4 5 Y: Nº de bacterias 12 19 23 34 56 62 Calcula: a) Las medias y desviaciones típicas de las variables, número de horas y número de bacterias. b) La covarianza de la variable bidimensional. c) El coeficiente de correlación e interpretación. d) La recta de regresión de Y sobre X. 6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio dedicadas a su preparación y las horas que vieron la televisión los días previos al examen. Nota 5 6 7 3 5 8 4 9 Horas de estudio 7 10 9 4 8 10 5 14 Horas de TV 7 6 2 11 9 3 9 5 a) Representa gráficamente los diagramas correspondientes a nota-estudio y nota-TV. b) ¿Se observa correlación entre las variables estudiadas? ¿De qué tipo? ¿En qué caso estimas que es más fuerte? b) Sí. Directa; inversa.
  • 107. 7. Con los datos del problema anterior, halla el coeficiente de correlación de nota-estudio y nota-TV. ¿Qué puede deducirse con más precisión conociendo la nota que obtuvo una persona en el examen: el tiempo que dedicó al estudio o el que dedicó a ver la televisión? 0,943382 y (0,846283. El tiempo que dedicó al estudio. 8. Con los mismos datos, halla las rectas de regresión correspondientes y estima para un alumno que sacó un 2 en el examen: a) Las horas que estudió. b) Las horas que vio la TV. a) Esta = (0,246753 + 1,46753 otra; 2,7 h. b) TV = 14,1299 (1,2987 otra; 11,5 h. Tipo III. Estimación a partir del a recta de regresión 9. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son: Padre 170 173 178 167 171 169 184 175 Hijo 172 177 175 170 178 169 180 187 a) Calcula la recta de regresión que permita estimar la altura de los hijos dependiendo de la del padre; y la del padre conociendo la del hijo. b) ¿Qué altura cabría esperar para un hijo si su padre mide 174? ¿Y para un padre, si su hijo mide 190 cm? a) H = 68,1853 + 0,621859 ; P = 77,4406 + 0,545082 . b) 176,4 cm; 181 cm.
  • 109. NIVELES DE LOGRO ACTIVIDADES MEDIADO AUTÓNOMO  Lectura comprensiva de correlación y  Organizador gráfico de regresión lineal TEÓRICO BÁSICO regresión lineal  Consulta y lectura comprensiva de los  Análisis de la Campana de Gauss conceptos de muestreo TEÓRICO SUPERIOR  Análisis de la realización de las gráficas de la  Análisis de los conceptos investigados campana de Gauss.  Comprensión de lectura.  Toma de decisiones para realizar los ejercicios con la aplicación del muestreo TEÓRICO PRÁCTICO ACEPTABLE  Aplicación en ejercicios de la teoría  Aplicación de los ejercicios propuestos del analizada muestreo  Formulación de alternativas de solución  Realización de ejercicios de la campana de gauss TEÓRICO PRÁCTICO AVANZADO  Análisis de los problemas que suceden en la  Aplicación de ejercicios con datos reales sociedad. planteados por el docente  Análisis de las variables dependientes e  Investigación de ejemplos de las variables. independientes de la sociedad.
  • 111. 8 CARACTERÍSTICAS DE LAS HIPÓTESIS  Deben basarse en una situación real, es decir deben someterse a prueba en un universo y contexto bien definido. 8.1 Ejemplo: El contrabando en Ecuador es menor que el contrabando en Colombia  Dentro de la hipótesis las variables deben ser claras, comprensibles y concretas, no se debe usar términos confusos. Ejemplo: Situación económica del Carchi Crisis económica  La relación ente variables de una hipótesis deben ser lógicas.  Las variables de la hipótesis deben ser observables y medibles (esto significa que deben tener referentes en la realidad); no se deben incluir aspectos morales porque no podríamos medirlos en la realidad.  Las hipótesis deben estar relacionadas con técnicas disponibles para probarlas y verificarlas.  Las hipótesis deben referirse a una situación real.  Los términos (variables) de la hipótesis tienen que ser compatibles, precisos y lo más concretos posibles. La relación entre variables propuestas por una hipótesis debe ser clara y verosímil (lógica).  Los términos de la hipótesis y la relación planteada entre ellos, deben poder ser observados y medidos, o sea tener referentes en la realidad.  Las hipótesis deben estar relacionadas con técnicas disponibles para probarlas.http://www.antropologiasocial.org/contenidos/tutoriales/tym/Do cumentos/Hipotesis.pdf
  • 112. CLASIFICACIÓN DE LAS HIPÓTESIS HIPÓTESIS DE INVESTIGACION a. Hipótesis Descriptiva b. Hipótesis de Correlación c. Hipótesis de Diferencial de Grupos d. Hipótesis de Relaciones de Casualidad e. Hipótesis Casuales Bivariables f. Hipótesis Casuales Multivariables 8.2 HIPOTESIS NULA 8.3 HIPOTESIS ALTERNATIVA 8.4 HIPOTESIS ESTADISTICA a. Hipótesis estadísticas de Estimación b. Hipótesis estadísticas de Correlación c. Hipótesis estadísticas de Diferencial de medios o otras Variables 8.5 EJEMPLO DE HIPÓTESIS:  A mayor cantidad de vehículos en una ciudad; mayor congestión vehicular.  A mayor variedad en el trabajo; habrá mayor motivación individual hacia él.  A mayor demanda de un producto; mayor producción del mismo.
  • 113. 1. HIPÓTESIS DE INVESTIGACIÓN (Hi): Son propuestas de experimentos acerca de las posibles relaciones entre dos o más variables.1http://iealidia.blogdiario.com/tags/hipotesis/ Se las simboliza como Hi; H1, H2, H3 (cuando son varias) Las hipótesis de investigación a su vez pueden ser:  Hipótesis descriptivas de un valor o dato pronosticado.  Hipótesis correlaciónales.  Hipótesis de diferencia de grupos.  Hipótesis causales. 8.6 HIPÓTESIS DE UN VALOR O DATO PRONÓSTICADO: Esta hipótesis trata de predecir un dato o valor en una o más variables que se van a medir u observar. No es sencillo realizar estimaciones con precisión con respecto a ciertos fenómenos. 8.7 HIPÓTESIS CORRELACIONADAS: Especifican las relaciones entre dos o más variables y corresponden a los estudios correlaciónales. Ejemplos:  “Los altos impuestos a pagar en la CAE están relacionados con el Contrabando en Tulcán”  Las hipótesis correlacionadas no solo pueden establecer que dos o más variables se encuentren vinculadas, sino también como están asociadas.
  • 114. Ejemplos:  A mayor inflación de Precios, habrá menor consumo. (Aquí la hipótesis indica que cuando una variable aumenta, la otra disminuye, o viceversa). 8.8 HIPÓTESIS DE DIFERENCIA ENTRE GRUPOS: Su finalidad es comparar grupos: Por Ejemplo;  Los niños tiene más cariño por sus padres que por sus tíos.  Viajar vía aérea de Tulcán a Quito implica menos tiempo que viajar vía terrestre de Tulcán a Quito. 8.9 HIPÓTESIS CAUSALES: Este tipo de hipótesis no solamente afirma la o las relaciones entre dos o más variables y la manera en que se manifiesta, sino que además propone un “sentido de entendimiento” de las relaciones. Tal sentido puede ser más o menos completo, esto depende del número de variables que se incluya, pero todas estas hipótesis establecen relaciones de causa -efecto. Las hipótesis causales pueden simbolizarse como. HIPÓTESIS NULA (Ho): La hipótesis nula es en cierto modo, el reverso de las hipótesis de investigación. También constituyen proposiciones acerca de la relación entre variables, solo que sirven para negar lo que afirma la hipótesis de investigación. 1 http://personal.us.es/vmanzano/docencia/analisis/guias/FichaP SHN.pdf
  • 115. La hipótesis nula se simboliza Ho. Ejemplo: Hi: la inseguridad crece en el Ecuador por falta de trabajo Ho: la inseguridad no crece en el Ecuador por falta de trabajo Hi: El contrabando disminuirá en un 20% en el mes de diciembre porque se ha intensificado el control en la frontera. Ho: El contrabando no disminuirá en un 20% en el mes de diciembre; porque falta control en la frontera y por el aumento de los pasos ilegales. HIPÓTESIS ALTERNATIVA (Ha): Son posibilidades alternas ante las hipótesis de investigación y nula; ya que nos presentan otra descripción explicación distintas a las que proporcionan estos tipos de hipótesis. Al responder a un problema es necesario hallar diferentes hipótesis como respuesta y elegir entre ellas. La hipótesis alternativa se simboliza Ha y solo puede formularse cuando hay otras posibilidades.1http://www.mitecnologico.com/Main/HisConceptos. Ejemplos: Hi: La empresa Nestlé es grande gracias a su producción y su buen producto. Ho: La empresa Nestlé no es grande Ha: La empresa Nestlé es pequeña, mediana
  • 116. HIPÓTESIS ESTADÍSTICA: Representa la transformación de las hipótesis de investigación, nulas y alternativas en símbolos estadísticos. Se pueden formular solo cuando los datos del estudio son cuantitativos (números, porcentajes, promedios).1http://www.monografias.com/trabajos17/pruebas-de-hipot.shtml Hay tres tipos de hipótesis estadísticas: 1. De estimación. 2. De correlación. 3. De diferencia de medias. 8.10 HIPÓTESIS ESTADÍSTICAS DE ESTIMACIÓN: Sirve para evaluar la suposición de un investigador respecto del valor de alguna característica en una muestra de individuos, otros seres vivos, sucesos u objetos y en una población. 8.11 HIPÓTESIS ESTADÍSTICAS DE CORRELACIÓN: Tiene por objetivo traducir en términos estadísticos una correlación entre dos o más variables. El símbolo de una correlación entre dos variables es “r”, y entre dos o más variables “R”. 8.12 HIPÓTESIS ESTADISTICAS DE LA DIFERENCIA DE MEDIAS U OTROS VALORES: En estas hipótesis se compara una estadística entre dos o más grupos. 8.13 EJEMPLOS DE HIPOTESIS: 8.14 Hipótesis descriptiva 1. Es día martes se realizaron 40 trámites de exportación a Colombia. 2. El mes de diciembre las importaciones subirán en un 30 %.
  • 117. 3. En el 2011 las exportaciones aumentara en un 10 %. 4. En el 2011 el contrabando bajara en un 2 %. 5. En diciembre la producción del banano aumentara porque existe mayor demanda. Hipótesis nula 1. Los bajos aranceles en las exportaciones de camarón provoca mayores exportaciones a Canadá Los altos aranceles en las exportaciones de camarón provoca menores exportaciones a Canadá 2. Las exportaciones de petróleo aumentaran en 2011, por la mayor producción en la refinería Sacha. Las exportaciones de petróleo disminuirán en 2011, por la menor producción en la refinería Sacha. 3. El tipo de aforo de mercancías agilita el pronto despacho, saliendo las mercancías de las zonas primarias en menor tiempo El tipo de aforo de mercancías entorpece el pronto despacho, saliendo las mercancías de las zonas primarias en mayor tiempo Hipótesis Alternativa 1.- El tratado de Libre Comercio firmado por Ecuador mejora las exportaciones con Colombia, Venezuela, Perú. 2.- Los ingresos percibidos del Petróleo en Ecuador se invierten en salud, educación, vivienda.
  • 118. PRUEBA DE HIPÓTESIS Se la llama ensayo de hipótesis. Son procedimientos que se unen para determinar si es razonable o correcto la formulación en Ho, como resultado aceptamos o rechazamos Ho. 8.15 PASOS PARA LA PRUEBA DE HIPOTESIS 1) Formular la hipótesis nula (Ho) y la hipótesis alternativa (H1). 2) Determinar si la prueba es unilateral y bilateral. 3) Asumir el nivel de significación = 5%, = 1%, =10% 4) Determinar la distribución muestral que utiliza la prueba. N= 50 > 30 se puede utilizar la prueba de hipótesis. 5) Elaborar un esquema de prueba. 6) Calculo estadístico :
  • 119. 7) TOMA DE DESICIONES: Aceptación o rechazo del Ho. Ṕ = proporción de la muestra % P= proporción de la población= EJEMPLO 1: Para evaluar el nivel mental de los ingresantes de la Universidad se estandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual) promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la prueba a una muestra de 60 ingresantes de esta universidad se calculó que el C.I. promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel mental de los ingresantes es superior al término medio? Variable de estudio: La habilidad mental de los X estudiantes. µ = rendimiento mental promedio de los ingresantes. X = rendimiento promedio de la muestra. Solución: 1) Ho: µ= 101,2 Ha: µ > 101,2 2) Prueba unilateral de acuerdo a Ha. 3) Realizar la prueba de los niveles de significación de 5% y 1%. 4) Se admite que la variable aleatoria de la prueba es la media de los coeficientes de inteligencia Xi. 5) Como n > 30 podemos usar una distribución normal de probabilidades para calcular los valores críticos y elaborar el esquema grafico de la prueba 99%.
  • 120. 6) Calculo estadístico de la prueba. 7) Toma de decisiones: A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z= 2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muy significativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivel mental de los ingresantes es superior al término medio. EJEMPLO 2: Un político supone que menos del 60% de los votos de su territorio le son favorables. Con el fin de verificar su conjetura. Selecciona una muestra representativa compuesta por 200 votantes y aplica una encuesta, obteniendo 100 respuestas a su favor. Probar que los resultados confirman la creencia del político, es decir, que los votos favorables de su territorio son menores del 60%.
  • 121. 8.16 PRUEBA DE DIFERENCIAS DE MEDIAS Cuando existen dos grupos de investigación en una `población. Matemáticamente se puede expresar de la siguiente manera POBLACIÓN Cuando n₁, n₂> 30 MUESTRA EJEMPLO 3 Un grupo de investigadores ha diseñado un cuestionario sobre la tensión, consistente en 15 sucesos. Ellos están interesados en determinar si existe una coincidencia entre dos culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe utilizar el evento “matrimonio” como estándar y juzgar los demás eventos en relación con el ajuste necesario para el matrimonio. El matrimonio recibe un valor arbitrario de 50 puntos. Si se considera que un evento requiere de más ajustes que el matrimonio, el evento debe recibir más de 50 puntos. El número de puntos excedentes depende de la cantidad de ajustes requeridos. Después de que cada sujeto de cada cultura ha asignado puntos a todos los eventos, se promedian los puntos de cada evento. Los resultados aparecen en la siguiente tabla:
  • 122. EVENTOS ESTADOUNIDENSES ITALIANOS Muerte de la esposa 100 80 Divorcio 73 95 Separación de la pareja 65 85 Temporada en prisión 63 52 Lesiones personales 53 72 Matrimonio 50 50 Despedido del trabajo 47 40 Jubilación 45 30 Embarazo 40 28 Dificultades sexuales 39 42 Reajustes económicos 39 36 Problemas con la familia política 29 41 Problemas con el jefe 23 35 Vacaciones 13 16 Navidad 12 10 a. Suponga que los datos tienen al menos una escala de intervalo y calcule la correlación entre los datos estadounidenses y la de los italianos. b. Suponga que los datos sólo tienen una escala ordinal y calcule la correlación entre los datos de ambas culturas. 100 80 60 Series1 40 20 0 0 50 100 150
  • 123. 0,8519 La r es alta y positiva es decir que los comportamiento de las dos nacionalidades son bastante similares EJEMPLO 4 Una muestra de 80 alambres de acero producidos por la fábrica A de una resistencia media de rotura de 1230 lbs. y S= 120 lbs.; otra muestra de 100 de alambres de aceros producidos por la fábrica B de una resistencia media de 1190 lbs. Con una S = 90 lbs. ¿Hay una diferencia real en resistencia media de las dos marcas de alambre de acero si ? Solución: 1) H₀=U₁=U₂ Hₐ = U₁<U₂; U₁>U₂ 2) Es una campana bilateral 3) El nivel de significación es 4) Se utiliza una diferencias de medias n₁=80>30; n₂ 100>30
  • 124. 5) Gráfico 6) Calculo estadístico 7) Toma de decisiones El esquema estadístico cae en la zona de rechazo por lo tanto rechazamos la hipótesis nula y se puede deducir que existe una diferencia real de la resistencia media de las dos marca de acero de cada una de las fábricas. EJEMPLO 5 Un aditivo servirá más millas por galón. La compañía ha reutilizado un gran número de mediciones recorridas en la gasolina sin aditivo, bajo condiciones controladas rigurosamente, los resultados muestra una media de 2,47 millas por galón y un S= 4,8. Se realizan pruebas con una muestra de 75 autos que utilizan la gasolina con aditivos, la media de la muestra es de 26,5 millas/ galón
  • 125. Solución: 1) H₀= 26,5 U 24,7 Hₐ : El nuevo aditivo incrementas el número de millas por galón por lo tanto X=26,5 en donde U>24,7 2) La prueba es unilateral a la derecha 3) El nivel de significación 4) N>30 por lo tanto se utiliza la prueba de hipótesis 5) Grafico 6) Calculo estadístico 7) Toma de decisiones Rechazamos la hipótesis nula y aceptamos la hipótesis alternativa
  • 126. NIVELES DE ACTIVIDADES LOGRO MEDIADO AUTÓNOMO  Lectura comprensiva de la prueba de hipótesis,  Análisis y comprensión de la prueba de hipótesis atravesó de TEÓRICO las tic’s BÁSICO  Análisis de la prueba de hipótesis,  Consulta y lectura comprensiva de la prueba de hipótesis TEÓRICO  Análisis de la realización de ejercicios de la prueba de  Análisis de los conceptos investigados sobre la prueba de SUPERIOR hipótesis. hipótesis.  Toma de decisiones para realizar los ejercicios con la  Comparación de los diferentes conceptos investigados sobre la aplicación de la prueba de hipótesis mediante la prueba de hipótesis, aplicación de los 7 pasos  Aplicación en ejercicios de la teoría analizada acerca  Aplicación de los ejercicios propuestos de la prueba de TEÓRICO de la prueba de hipótesis, hipótesis, PRÁCTICO ACEPTABLE  Formulación de alternativas de solución  Realización de ejercicios de la prueba de hipótesis, TEÓRICO  Análisis de los problemas que suceden en la sociedad.  Aplicación de ejercicios con datos a través de la elaboración de PRÁCTICO un proyecto AVANZADO  Análisis de ejercicios propuestos por diversos autores  Investigación de ejemplos de Hipótesis
  • 127. “T“DE STUDENT En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muéstrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra 8.17 CARACTERÍSTICAS  El tamaño de la muestra es menor a 30  La población de donde se obtiene los datos está distribuida normalmente  Se desconoce la desviación estándar de la población, entonces haremos uso de la distribución de student 8.18 Grado de libertad: (n-1) cuando se ha estimado un parámetro Cuando se estiman dos parámetros (gl= n₁+n₂-2)
  • 128. gl =n-k hay que mirar en la tabla de T de student con el coeficiente de estimación de ; Solución u= rendimiento mental medio en la estandarización. u = 101 = Rendimiento mental medio de la muestra = 105,4 8.19 FORMULACION DE HIPOTESIS Ho: u = 101 No existe diferencias significativas en el rendimiento mental de la muestra y de la población. H1: u ˃ 101 1) Prueba unilateral de cola derecha de acuerdo con H1 2) Nivel de significación asumido: α = 0,01 = 1% 3) Se debe utilizar una distribución muestral de medias n < 30 (muestra pequeña) se distancia Q ( desviación estándar de la población ) 4) α=0,01 Los grados de libertad son: n - 1 = 15-1 = 14 14; α=0,01 prueba 1 cola 2,624 5) Calculo estadístico = 105,4 ; u = 101 ; S = 5,3 ; n = 15
  • 129. t= t = 3,11 6) Toma de decisiones : Si t = 3,11 se halla en la zona de rechazo por lo tanto se descarta que u = 101 y se acepta la alternativa u es decir el grupo de los 15 alumnos tiene rendimiento mental mayor que el promedio de estandarización. EJERCICIO: En un laboratorio farmacéutico se produce comprimidos de un cierto medicamento, con un peso promedio de 2 gr. promedio por cada comprimido, para determinar si la maquina sigue en iguales condiciones de producir se toma una muestra de 10 tabletas: 2,04 ; 1,96 ; 2,00 ; 1,98 ; 2,02 ; 2,01 ; 1,97 ; 1,94 ; 2,03 ; 2,01 ; asimilando α=0,01 ; verificar si la maquina está en buenas condiciones. Solución: U2= promedio de tabletas producidas por la máquina. 1) Formulación de Hipótesis: Ho: U = 2 La máquina se halla en buenas condiciones. H1: U ≠ 2 La máquina no se halla en buenas condiciones. 2) Prueba bilateral: H1: Hay dos probabilidades U˃ 2 y U<2 3) α = 0,01 4) U=2g siendo una muestra pequeña n=10 No aplica a la distribución normal y se aplica la t de student. 5) α = 0,01 Prueba bilateral
  • 130. gl = n-1 = 10-1 = 9 gl t = 3,25 Zona de Rechazo Zona de Aceptación 6) Cálculo estadístico t= t = -0,39 7) Toma de decisiones: Si t = - 0,39 entonces u se encontraría en la zona de aceptación es decir se acepta la Ho es decir la maquina se encuentra en buenas condiciones.
  • 131. NIVELES DE ACTIVIDADES LOGRO MEDIADO AUTÓNOMO  Lectura comprensiva de la T-de student,  Análisis y comprensión de la T-de student,atraves de las tics TEÓRICO BÁSICO  Análisis de la T-de student,,  Consulta y lectura comprensiva de la T-de student,  Análisis de los conceptos investigados sobre la T-de student, TEÓRICO  Análisis de la realización de ejercicios de la T-de SUPERIOR student Comparación de los diferentes conceptos investigados sobre la T-de student,  Toma de decisiones para realizar los ejercicios con la aplicación de la  Aplicación en ejercicios de la teoría analizada  Aplicación de los ejercicios propuestos de la T-de student, TEÓRICO acerca de la T-de student, PRÁCTICO  Realización de ejercicios de la T-de student, ACEPTABLE  Formulación de alternativas de solución a través de la T-de student, TEÓRICO  Análisis de los problemas que suceden en la  Aplicación de ejercicios con datos a través de la elaboración PRÁCTICO sociedad. de un proyecto AVANZADO  Análisis de ejercicios propuestos por diversos  Investigación de ejemplos sobre la T-de student, autores
  • 133. PRUEBA DE Ji- CUADRADO O Distribución Ji-cuadrado, también denominada Ji-cuadrado de Pearson, es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria. Se suele usar la denominada prueba Ji-cuadrado como test de independencia y como test de bondad de ajuste. En realidad la distribución Ji-cuadrado es una distribución muestral, es decir que si se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas. Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X². Si se elige una muestra de tamaño (n) de una población normal con varianza, el estadístico: Donde n es el tamaño de la muestra, S² la varianza muestral y la varianza de la población de donde se extrajo la muestra. 8.20 Propiedades de las distribuciones Ji-cuadrado 1. Los valores de X2 son mayores o iguales que 0. 2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un número infinito de distribuciones X2. 3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1. 4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha. 5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1). 6. El valor modal de una distribución X2 se da en el valor (n-3).
  • 134. Chi 2 Otro de los modelos estadísticos para comprobar si las hipótesis de un problema son verdaderas o falsas se sigue los siguientes pasos 1) la CHI 2 es utilizada para variables cuantitativas y cualitativas Ej. Cualidades sí o no, verdadero falso y las cuantitativas son a través de números que se los obtiene en una población, que se deben sacar diferentes muestras por extractos que generalmente se los determina a través de las columnas o intervalos o también se los obtienen a través de las tablas de valores. 2) su símbolo de chi 2 es X2 se la representa en el plano cartesiano Únicamente el CHI² solo es de una sola cola a la derecha. Hay dos formas diferentes para determinar los grados de libertad. gl = K – 1 o gl = ( c - ) ( F – 1 ) para la tabla de valores C columnas y F filas Sus fórmulas matemáticas de chi 2 X2 = X 2= Oi frecuencias observadas Ei frecuencias operadas
  • 135. Las frecuencias operadas se las obtienen multiplicando de un número total por el porcentaje o también se las obtiene de la división. E= (multiplicaciones) Para llegar a la toma de decisiones también se debe utilizar los siete pasos que se dan tanto en la prueba de hipótesis como en la t de student. Generalmente su símbolo es . Es una prueba que puede usarse para cualquier nivel de datos, es una medida donde se encuentran las frecuencias (observadas y esperadas), en el caso de las frecuencias esperadas estas se las obtiene a través de otros resultados. Matemáticamente se la puede expresar de la siguiente forma: = dónde: fe= frecuencia esperada X2 = Siempre va hacer positiva por estar elevada al cuadrado Como en las anteriores pruebas hay que dar los 7 pasos fundamentales hasta llegar a la toma de decisiones. Generalmente se presentan dos casos para encontrar los grados de libertad. 1) 2) esta cuando existen filas y columnas y se realizan tablas de contingencia. Representación gráfica de la Campana de Gauss la cual solo tiene cola dirigida hacia la derecha por poseer valores positivos. a) X = 0,05 >>>> (4gl) = 9,488 Se lee en la tabla.
  • 136. b) X =0,05 >>>> = 18,307 EJEMPLO: Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado 120 veces y obtuvo la siguiente distribución de frecuencias de las caras resultantes. RESULTADO 1 2 3 4 5 6 FRECUENCIA 15 25 33 17 16 14 a) Enuncie las hipótesis de la prueba y determine las frecuencias esperadas. b) Describa la estadística de la prueba c) Determine la región crítica de la prueba al nivel de significación del 5%. d) ¿A qué conclusión llega usando el nivel de significación 0,05? e) Determine la probabilidad P. 1.- Ho: El dado es legal. Ha: El dado no es legal. 2.- Es de dos colas. 3.- Nivel de confianza 4.- gl= k-1 gl=6-1 gl=5 5.- Zona aceptación 11,07
  • 137. 6.- Ei 20 20 20 20 20 20 Oi 15 25 33 17 16 14 6. Toma de decisiones Se acepta la hipótesis alternativa y se rechaza la hipótesis nula, es decir el dado del jugador no es legal ya que se encuentra dentro de la zona de rechazo EJEMPLO: 1. Ho.- El suero no tiene efecto, y la recuperación es independiente del uso del suero. Ha.- que el suero es el que permite la recuperación del paciente. 2. Es cola unilateral 3. 0,05 (N. significancia.) Nivel de confianza 95% 4. n =200 personas se puede utilizar la ji cuadrado para cualquier valor de datos- 5. GRÁFICO
  • 138. gl =(F-1 ) (C-1) gl =(2-1) (2-1) x²=3,84 6. Calculo de x² X2= (75 - 70)2 / 70 + (65 - 70)2 / 70 + (25-30)2 /30 + (35-30) 2 / 30 = 2,38 8.21 FRECUENCIAS OBSERVADAS CURADOS NO CURADOS TOTAL GRUPO A USANDO 75 25 100 SUERO GRUPO B SIN SUERO 65 35 100 TOTAL 140 60 200 8.22 FRECUENCIAS ESPERADAS (DE Ho) CURADOS NO CURADOS TOTAL GRUPO A USANDO 70 30 100 SUERO GRUPO B SIN SUERO 70 30 100 TOTAL 140 60 200 7. Ho aceptamos, concluyendo que el suero no tiene efecto, que la recuperación es independiente
  • 139. Fe =(80 – 40) / 200 = 16 Fe= FRECUENCIA ESPERADA = (total del renglón) (total columna) / gran total Fe =(100 – 140) / 200 = 7 Fe =(100 – 60) / 200 = 30 EJERCICIO La falta de muestra de estudiantes aprobados y suspendidos por 3 profesores X, Y, Z Ho= La proporción de estudiantes suspendidos son iguales. Ha = L proporción de estudiantes suspendidos no son iguales. X Y Z TOTAL APROBADOS 50 47 56 153 SUSPENDIDOS 5 14 8 27 TOTAL 55 61 64 180 X2 = (50 – 46,25)2 / 46,75 + (47 – 51,85)2 / 51,85 + (56 – 54,40)2 /54,40 + (5 – 8,25) 2 / 8,25 + (14 -9,15) 2 /9,15 + (8 -9,60)2 / 9,60 X2 = 4, 84 gl = (F-1) (C – 1) gl = (2-1) (3-1) X2 = 4, 61 X2= 0, 95 = 5, 99
  • 140. X Y Z TOTAL APROBADOS 46,75 51,85 54,40 153 SUSPENDIDOS 8,25 9,15 9,6 27 TOTAL 55 61 64 180
  • 141. NIVELES DE ACTIVIDADES LOGRO MEDIADO AUTÓNOMO  Lectura comprensiva de la CHI Cuadrado ,  Análisis y comprensión de la CHI Cuadrado de las tic’s TEÓRICO BÁSICO  Análisis de la CHI Cuadrado  Consulta y lectura comprensiva de la CHI Cuadrado  Análisis de los conceptos investigados sobre la CHI Cuadrado TEÓRICO  Análisis de la realización de ejercicios de la JI Cuadrado. SUPERIOR Comparación de los diferentes conceptos investigados sobre la CHI  Toma de decisiones para realizar los ejercicios con la Cuadrado aplicación de la CHI Cuadrado mediante la aplicación de los 7 pasos  Aplicación en ejercicios de la teoría analizada acerca de la  Aplicación de los ejercicios propuestos de la CHI Cuadrado TEÓRICO CHI Cuadrado PRÁCTICO  Realización de ejercicios de la CHI Cuadrado , ACEPTABLE  Formulación de alternativas de solución TEÓRICO  Análisis de los problemas que suceden en la sociedad.  Aplicación de ejercicios con datos a través de la elaboración de un PRÁCTICO proyecto  Análisis de ejercicios propuestos por diversos autores AVANZADO  Investigación de ejemplos sobre la JI Cuadrado
  • 142. CONCLUSIÓNES  De acuerdo con la realización del presente trabajo, hemos llegado a las siguientes conclusiones:  La Estadística Descriptiva es un instrumento muy empleado por parte de los investigadores en las distintas áreas científicas y su necesidad e importancia han ido aumentando durante los últimos años.  El interés de los diferentes usuarios por la información Estadística obedece principalmente a que permite adentrarse en aspectos importantes de los fenómenos económicos y sociales: Su magnitud, es decir, las dimensiones que estos tienen y su estructura, o sea, la forma como esos fenómenos se desagregan en sus componentes.  Para que las Estadísticas sean de utilidad en cuanto a la caracterización de los fenómenos y al conocimiento de la realidad, deben cumplir determinados requisitos, siendo el principal el de veracidad, en el sentido de que los datos correspondan a cuantificaciones con suficiente precisión, de los universos de estudio y sus diversos subconjuntos, dentro de márgenes de tolerancia. A asimismo los datos deben ser conceptualmente significativos, es decir, obtenidos a partir de definiciones previamente establecidas.
  • 143. RECOMENDACIONES  Es necesario el uso de la Estadística en la empresa, ya que a través de ésta se cuenta con la capacidad para reconocer que actividades o productos le generan utilidad, y cuales solo pérdida. No contar con datos e interpretarlos correctamente, es para los administradores como caminar a oscuras. Contar con los datos, les permite ver lo que está aconteciendo y en consecuencia tomar las medidas más apropiadas.  Toda empresa debe contar con datos estadísticos en cuanto a lo que acontece tanto interna como externamente, para decidir sobre bases racionales, y adoptar las medidas preventivas y correctivas con suficiente tiempo para evitar daños, en muchos casos irreparables para la organización.  También es necesario acompañar la Estadística de las poderosas herramientas informáticas, porque le permiten a los directivos, asesores y personal, contar con la suficiente información para mejorar a partir de ella los procesos de la empresa como por ejemplo: Tomar mejores decisiones comerciales, mejorar la seguridad y hacer un uso mucho más productivo y provechoso de los recursos.
  • 144. 10. FINANCIEROS Y TÉCNICOS. DESCRIPCIÓN CANTIDAD VALOR UNITARIO VALOR TOTAL Papel bond 200 0,04 8 Impresiones 200 0,04 8 Material de oficina 0,00 Movilización 3 Internet 3 Imprevistos 5 TOTAL 200 0,08 21 8. CRONOGRAMA DE TAREAS T DESCRIPCION DE LA TAREA 1 2 3 4 5 6 7 8 T1 X T2 X T3 X T4 X T5 X T6 X T7 X T8 X T9 X T10 MODULO ESTADISTICA INFERENCIAL X
  • 146. 9 ANEXOS
  • 147. 9.1 ORGANIZADOR GRAFICO DE LA ESTADISTICA DESCRIPTIVA E INFERENCIAL
  • 148. Universidad Politécnica Estatal del Carchi Comercio Internacional, Integración, Administración y Economía Empresarial Proyecto propuesto por el estudiante
  • 149. Universidad Politécnica Estatal del Carchi Comercio Internacional, Integración, Administración y Economía Empresarial. Escuela: Comercio Exterior y Negociación Comercial Internacional TEMA: proyecto de aplicación de correlación, regresión lineal 2 SIMPLE APLICANDO Prueba de Hipótesis, T-STUDEN Y CHI . Integrantes: Coral Sánchez Nancy Ramírez Carla Damaris Rosero Carmen Tatiana Vizcaíno Luis Javier Nivel: sexto Paralelo: “a” Noche AÑO-LECTIVO 2012
  • 150. 1.1 INTRODUCCIÓN Los profesionales de la educación, como parte de su que hacer profesional, realizan investigación científica: evaluación de la calidad de la educación, someten a prueba diferentes métodos de comprensión lectora, estudian problemas del aprendizaje, entre otros. Es así, que contamos con Internet, como fuente general de información, que permite disponer de información educativa, por ejemplo, sobre evaluaciones muéstrales, que realiza el Ministerio de Educación y que está disponible en la página web: Una vez que conoce tanto la forma de recoger información como la forma de presentar a la misma, sea en forma de tablas o con el tratamiento realizado para elaborar una tabla de frecuencias, ahora es conveniente seguir con las características que permiten describir a un conjunto de datos que se recogen de un problema a investigarse. 1.4 DEFINICIÓN DE ESTADÍSTICA INFERENCIAL Estudia el comportamiento y propiedades de las muestras, y la posibilidad y límites de la generalización de los resultados obtenidos a partir de aquellas a las poblaciones que representan. Esta generalización de tipo inductivo, se basa en la probabilidad. También se le llama también estadística matemática, por su complejidad matemática en relación a la estadística descriptiva. (muestra. http:// www.wikipedia.) Tiene como objetivo generalizar las propiedades de la población bajo estudio, basado en los resultados de una muestra representativa de la población. Es una parte de la Estadística que comprende los métodos y procedimientos estadísticos en los que interviene la aplicación de modelos de probabilidad y mediante los cuales se realiza alguna afirmación sobre poblaciones con base en la información producida por muestras para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). (http://www.wikipedia: estadísticas.)
  • 151. Tema: Proyecto de aplicación al comercio exterior aplicando correlación, regresión lineal simple aplicando, prueba de hipótesis, t-student y chi2 con ayuda del programa SPSS. 1.2 Problema El desconocimiento de la correlación, prueba de hipótesis, T-Student y Chi 2 y su aplicación en problemas del contexto. 1.3 Objetivos Objetivo General  Solucionar los datos investigados de exportaciones e importaciones de comercio exterior aplicando correlación, regresión lineal, prueba de hipótesis, T-Student y Chi 2. Objetivos Específicos  Identificar la correlación de datos de exportaciones  Determinar su regresión lineal.  Identificar la hipótesis nula y la hipótesis alternativa.  Determinar si la prueba es unilateral o bilateral.  Asumir el nivel de significación de la prueba.  Determinar la distribución muestral que se usará en la prueba.  Calcular el estadístico de la prueba.  Tomar la decisión, para esto, se comparan el esquema de la parte de esquema de prueba.  Determinar ejercicios en relaciona a nuestra carrera de comercio exterior.
  • 152. Justificación El uso de un programa informático (SSPS), es muy importante para la resolución de problemas relacionados al comercio exterior por que representa un alto nivel de importancia para una buena toma de decisiones. En la estadística la aplicación de sistemas informáticos se da con mayor frecuencia remplazando los procesos manuales, permitiendo al usuario ahorrar tiempo y obtener resultados de manera directa y segura, haciendo que de esta manera se vuelva más competitivo y profesional; permitiendo a la vez ampliar su panorama ocupacional y logrando así la correcta toma de decisiones en el campo laboral.
  • 153. 1.5 MARCO TEÓRICO El SPSS SPSS es un programa estadístico informático muy usado en las ciencias sociales y las empresas de investigación de mercado. Originalmente SPSS fue creado como el acrónimo de Statistical Package for the Social Sciences aunque también se ha referido como "Statistical Product and Service Solutions" (Pardo, A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del nombre completo del software (IBM SPSS) no es acrónimo de nada. Como programa estadístico es muy popular su uso debido a la capacidad de trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones de registros y 250.000 variables. Además, de permitir la recodificación de las variables y registros según las necesidades del usuario. El programa consiste en un módulo base y módulos anexos que se han ido actualizando constantemente con nuevos procedimientos estadísticos. Cada uno de estos módulos se compra por separado. Actualmente, compite no sólo con softwares licenciados como lo son SAS, MATLAB, Statistica, Stata, sino también con software de código abierto y libre, de los cuales el más destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos sistemas operativos como Linux, además de versiones para Windows y OS X. Este último paquete pretende ser un clon de código abierto que emule todas las posibilidades del SPSS.
  • 154. CORRELACIÓN LINEAL El análisis de correlación se dirige sobre todo a medir la fuerza de una relación entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza de la relación lineal entre dos variables. La fortaleza de la relación se determina mediante la magnitud del efecto que cualquier cambio en una variable ejerce sobre la otra. (JOHNSON, 1990) Si X o Y son las dos variables en cuestión, un diagrama de la dispersión muestra la localización de los puntos (X,Y) sobre un sistema rectangular de coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en una recta, como la figura 14(a) y 14(b) la correlación se llama lineal. (SPIEGEL, 1992) Y Y Y X X (a) Correlación lineal positiva (b) Correlación lineal negativa (c) Sin correlación Si Y tiende a crecer cuando X crece, como la figura anterior, la correlación se dice positiva o directa. Si Y tiende a decrecer cuando X crece, como la figura 14.1 (b), la correlación se dice negativa o inversa. Si todos los puntos parecen estar sobre una cierta curva la correlación se llama no lineal, y una ecuación no lineal será apropiada para la regresión. Como hemos visto en el capítulo 13 es claro q la correlación no lineal puede ser positiva o negativa.
  • 155. Si no hay relación entre las variables como la figura 14.1(c), decimos que no hay correlación entre ellas. (SPIEGEL, 1992) Técnicas de correlación A continuación abordaremos el estudio de dos variables y no solamente de una, estudiaremos qué sentido tiene afirmar que dos variables están relacionadas linealmente entre si y cómo podemos medir esta relación. Relaciones lineales entre variables Supongamos que dispongamos de dos pruebas de habilidad mental y la otra pruebe de ingreso a la universidad, seleccionamos a cinco estudiantes que se expresan en la tabla N° 1 con los puntajes obtenidos en estas dos pruebas. Estudiantes X Y Prueba de habilidad Mental Examen de Admisión María 18 82 Olga 15 68 Susana 12 60 Aldo 9 32 Juan 3 18 La tabla nos dice que si podemos usar para pronosticar el puntaje alto en la prueba de habilidad mental y también en los que tienen un puntaje alto en los exámenes de admisión y los estudiantes con puntajes bajos en la en el examen de habilidad como en el de admisión. En circunstancias como la presente (cuando los puntajes altos de una variable están relacionados con los puntajes altos de otra variable y los puntajes bajos están relacionados con los puntajes bajos de otra variable) entonces podemos asegurar que existe una relación positiva entre las dos variables.
  • 156. Supongamos que en lugar de los resultados de la tabla N° 1 hubiera obtenido los puntajes que se muestran en la tabla N°2 ¿Podremos afirmar que con estos datos en esta situación en la prueba de habilidad pueda usarse para pronosticarse los puntajes del examen de admisión? También, aunque en este caso los puntajes altos apresen con un puntaje bajo, tomando en cuenta esto podemos definir una relación lineal negativa entre el conjunto. Estudiantes X Y Prueba de habilidad Examen de Admisión Mental María 18 18 Olga 15 32 Susana 12 60 Aldo 9 68 Juan 3 82 Estudiantes X Y Prueba de habilidad Examen de Admisión Mental María 18 18 Olga 15 82 Susana 12 68 Aldo 9 60 Juan 3 32 En este caso no podemos afirmar una relación lineal entre las variables X y Y ya que unos puntajes se acotejan con otros y no están en concordancia.
  • 157. DIAGRAMA DE DISPERSIÓN El diagrama de dispersión es útil para representar valores como lo mostraremos a continuación utilizando los datos de la tabla N° 1, pero en la vida real no todas las veces obtendremos datos de cinco parejas, tendremos que comprender muchos más datos por esto es más sencillo utilizar un diagrama para determinar la relación de los mismos. COEFICIENTE DE CORRELACIÓN RECTILÍNEA DE PEARSON Con la ayuda de las gráficas nos podemos formar una idea de la nube de puntos o diagrama de dispersión, representa la relación lineal es positiva o negativa y determinar la fuerza de relación. El coeficiente de Pearson, toma valores entre -1 y +1, el coeficiente 0 demuestra que no existe correlación, así que independiente del número sea negativo o positivo son iguales, claro está que entre más se aproxime al 1 o -1 mayor será la fuerza de relación. EJERCICIO: CORRELACIÓN El Banco Central del Ecuador nos presenta La siguiente informacion, la cantidad y el precio del petroleo exportado por el Ecuador en los años 2008 hasta el 2011, se desea conocer si la informacion obtenida posee una correlacion. Año 2008 2009 2010 2011 Meses CANTI PRECIO CANTI PRECIO CANTI PRECIO CANTI PRECIO Enero 11266 29,06 12427 46,69 10304 40,22 3383 76,44 Febrero 10193 32 11568 45,1 9210 46,29 5006 79,55 Marzo 11146 38,89 12428 46,8 10305 48,37 3502 85,49 Abril 10362 38,39 12577 54,67 9315 52,41 5494 91,25 Mayo 10761 35,95 10208 57,15 9224 53,78 5003 103,94 Junio 11521 42,26 10106 58,16 11842 56,94 4177 115,21 Julio 9744 46 9375 61,26 12239 63,73 3565 113,42 Agosto 10307 51,66 11206 59,29 10209 61,22 3989 99,13 Septiembre 10796 50,34 12310 49,34 10910 64,68 3630 87,47 Octubre 10001 45,43 11606 45 10605 71,36 3847 65,42 Noviembre 12569 40,33 12147 43,96 9214 79,81 2680 48,22 Diciembre 12929 42,76 10676 45,83 10722 77,21 5641 26,66 TOTAL 131595 493,07 136634 613,25 124099 716,02 49917 992,2 BANCO CENTRAL DEL ECUADOR
  • 158. DESARROLLO Paso 1: Escogemos la opción Analizar/Correlaciones/Bi-variadas Paso 2 : Seleccionamos las variables con el botón
  • 159. Escogemos la opción Pearson Clic en la opción Bilateral Pasó 3 : Escoger la opción Marcar las correlaciones significativas Clic Aceptar Paso 4 Aparece la tabla en la que constan los datos correspondientes a la correlación.
  • 160. Regresión lineal Fases del modelo de regresión lineal La recta de regresión y el coeficiente de correlación tienen sentido en tanto en cuanto son instrumento para inferir la relación de las variables en la población. El conocimiento exacto del coeficiente de correlación solo es posible si analizamos la totalidad de la población. Sin embargo, a la hora de evaluarlo, nos encontramos con el problema habitual de tener que inferirlo desde la estimación que proporcionan los datos de una muestra. La recta de regresión lineal y=a+bx, es una estimación de la recta de regresión lineal de la población y=α+ßx. Los parámetros α y ß son evaluados a partir de los datos de una muestra, y es fundamental tener unas garantías de que los valores a y b estimados no difieren significativamente de los parámetros poblacionales α y ß. El proceso que se sigue en la construcción del modelo de regresión se compone de tres fases o etapas. En la primera fase, se comprueba si la relación entre las variables que componen el modelo está de acuerdo con la propia forma del modelo. La segunda fase consiste en la estimación de los parámetros de acuerdo con el criterio elegido (en nuestro caso, el método de mínimos cuadrados). La última fase es fundamental para el investigador, que debe comprobar si las inferencias o pronósticos que se pueden hacer de la relación encontrada entre las variables se ajustan a los datos. (VARGAS, 1995) El modelo de regresión lineal El modelo de regresión lineal simple es un proceso experimental en el que intervienen dos variables: una variable dependiente Y, que no es controlada por el experimento, y que depende de otra variable independiente X, que si es controlada por el experimento, por lo que esta no es una variable aleatoria.
  • 161. Para estudiar la relación de dependencia entre estas variables, se dispone de una muestra aleatoria de tamaño N, que vamos a representar por {[x,y]}… n Cuando tomamos distintas muestras para un mismo valor X, es de esperar que varíen los correspondientes valores de Y; por ello, el valor y1 del par (x ,y) se puede considerar como valor de una variable aleatoria por Y, que tendrá una medida M(Y) y una varianza V(Y). (VARGAS, 1995) Por lo tanto, para x=x, tenemos una variable aleatoria a la que vamos a designar por Y, que tendrá una medida M (Y) y una varianza V(Y). Admitir el modelo de regresión lineal supone aceptar que la medida de la variable aleatoria M (Y), está relacionada linealmente con la variable x por medio de la ecuación de la regresión de la población, es decir: (VARGAS, 1995) Donde α y ß son los parámetros de la población. M (Y) es la respuesta promedio; para simplificar la terminología, vamos a designarla por P. Los parámetros de la recta de regresión poblacional α y ß, son desconocidos y deben ser estimados mediante los valores de a y b en la recta de regresión muestral que se obtiene a partir de los datos de la muestra. (VARGAS, 1995) Una vez evaluadas a y b, una estimación de la respuesta promedio P es: EJERCICIO: RELACIÓN LINEAL Con los datos proporcionados por el Banco Central del Ecuador nos piden encontrar una línea recta la cual acoja a todos los datos obtenidos de las exportaciones de petróleo desde 2008 hasta el 2011 para de esta manera elaborar pronósticos que se ajusten a los datos:
  • 162. Año 2008 2009 2010 2011 Meses CANTI PRECIO CANTI PRECIO CANTI PRECIO CANTI PRECIO Enero 11266 29,06 12427 46,69 10304 40,22 3383 76,44 Febrero 10193 32 11568 45,1 9210 46,29 5006 79,55 Marzo 11146 38,89 12428 46,8 10305 48,37 3502 85,49 Abril 10362 38,39 12577 54,67 9315 52,41 5494 91,25 Mayo 10761 35,95 10208 57,15 9224 53,78 5003 103,94 Junio 11521 42,26 10106 58,16 11842 56,94 4177 115,21 Julio 9744 46 9375 61,26 12239 63,73 3565 113,42 Agosto 10307 51,66 11206 59,29 10209 61,22 3989 99,13 Septiembre 10796 50,34 12310 49,34 10910 64,68 3630 87,47 Octubre 10001 45,43 11606 45 10605 71,36 3847 65,42 Noviembre 12569 40,33 12147 43,96 9214 79,81 2680 48,22 Diciembre 12929 42,76 10676 45,83 10722 77,21 5641 26,66 TOTAL 131595 493,07 136634 613,25 124099 716,02 49917 992,2
  • 163. DESARROLLO Paso 1 Clic en la opcion Gráficos/ Cuadro de diálogos antiguos/ Dispercion de puntos Elejimos la dispercion simple En donde nos da como resultado el siguiente cuadro
  • 164. Paso 2 Colocamos las variables en el eje de la X & Y dependiendo de los datos del problema a resolver, dando como resultado el siguiente cuadro: Si queremos encontrar la línea de correlación click en gráficos/cuadros de dialogo antiguo/ lineas
  • 165. Uniendo ENCONTRAR LA ECUACIÓN Paso 1 Escogemos la opción Analizar de la barra de herramientas/ Regresión/ Lineales
  • 166. Paso 2 Elegimos la variable dependiente e independiente según corresponda; después clic en la opción Estadísticos. Paso 3 Se escoge las siguientes opciones de la ventana, Estimaciones, Ajuste del modelo, Cambio en R cuadrado y Descriptivos clic en Continuar.
  • 167. Paso 4 Clic en Aceptar Paso 5 Nos aparecen los resultados del estadístico en donde podemos deducir que la fórmula de la recta de los datos es: F (x)= -20.183x+11795,561
  • 168. Prueba de hipótesis La prueba de hipótesis comienza con una suposición, llamada hipótesis, que hacemos acerca de un parámetro de población. Después recolectamos datos de muestra, producimos estadísticas muéstrales y usamos esta información para decidir qué tan probable es que nuestro parámetro de población hipotético sea correcto. Digamos que suponemos un cierto valor para una medida de población, para probar validez de esa suposición recolectamos datos de muestra y determinamos la diferencia entre el valor hipotético y el valor real de la media de la muestra. Después juzgamos si la diferencia obtenida es significativa o no. Mientras más pequeña sea la diferencia, mayor será la probabilidad de que nuestro valor hipotético para la media sea correcto. Mientras mayor sea la diferencia, más pequeña será la probabilidad. (LEVIN, 2010) Hipótesis nula y alternativa La prueba de hipótesis empieza con algo de teoría, afirmación o aserción con respecto a un parámetro particular de una población. Para fines de análisis estadístico, el gerente de producción escoge como hipótesis inicial que el proceso está bajo control; esto es, el contenido promedio es de 368 gramos y no es necesario efectuar acciones correctivas. La hipótesis de que el parámetro de la población es igual a la especificación de las compañías se conoce como la hipótesis nula. Una hipótesis nula es siempre una de status quo o de no diferencia. Por lo general se le identifica con el símbolo Ho. Nuestro gerente de producción establecería como hipótesis nula que el proceso de llenado está bajo control y funcionando apropiadamente, que la cantidad media de cereal por caja es la aplicación de la compañía de 368 gramos. Esto se establece como: Ho2 µ=0
  • 169. Siempre que especifiquemos una hipótesis nula, también debemos especificar una hipótesis alternativa o una que debe ser verdadera si se encuentra que la hipótesis nula es falsa. La hipótesis alternativa (H1) es lo opuesto a la hipótesis nula (Ho). Para el gerente de producción, la hipótesis alternativa se puede establecer como: Ho2 µx≠0 La hipótesis alternativa representa la conclusión a la que se llegaría si hubiera suficiente evidencia de la información de la muestra para decidir que es improbable que la hipótesis sea verdadera y, por tanto rechazarla. En nuestro ejemplo, si el peso de las cajas muestreadas estuvieran lo suficiente por arriba o por debajo del promedio. Interpretación del nivel de significancia El propósito del nivel de significancia no es cuestionar el valor calculado en el estadístico de la muestra sino hacer un juicio respecto a la diferencia entre ese estadístico y un parámetro hipotético de la población. Si suponemos que la hipótesis es correcta, entonces el nivel de significancia indicará el porcentaje de medias muéstrales que está fuera de ciertos límites. Selección del nivel de significancia No existe un nivel de significancia único estándar o universal para probar hipótesis. En algunos casos se utiliza el nivel de significancia de 5%. Ciertos resultados de investigaciones publicados a menudo prueban hipótesis para un nivel de significancia del 1%. Es posible probar una hipótesis a cualquier nivel de significancia. Cuando más alto sea el nivel de significancia que utilizamos para probar una hipótesis, mayor será la probabilidad de rechazar la hipótesis nula cuando es cierta. (LEVIN, 2010)
  • 170. Error tipo I y Error tipo II Rechazar una hipótesis nula cuando es cierta se denomina error tipo I, y su probabilidad se simboliza con α (alfa). Por otro lado, aceptar una hipótesis nula cuando es falsa se llama Error tipo II, y su probabilidad se simboliza con ß (beta). Existe relación entre estos dos tipos de errores: la probabilidad de cometer un tipo de error puede reducirse solo si estamos dispuestos a aumentar la probabilidad de cometer el otro tipo de error. (LEVIN, 2010) Pasos de una prueba de hipótesis En la prueba de hipótesis que goza de aceptación general figuran siete pasos: Paso 1 Formular la hipótesis nula HO, De manera que pueda determinarse exactamente α, la probabilidad de cometer un error tipo 1. (Esto equivale a determinar el parámetro de población que interesa y proponer la validez de un valor para él) (Signo =) Formular la hipótesis alternativa Ha De manera que el rechazo de la hipótesis nula signifique aceptar la hipótesis alternativa. (Signo > o <) Al formular estas dos hipótesis, se determinan el parámetro y el valor propuesto; Paso 2 Determinar si la prueba es unilateral o bilateral Paso 3 Asumir el nivel de significación Paso 4 Determinar la distribución muestral que se usara en la prueba Paso 5 Elaborar el esquema de la prueba Paso 6 Calcular el estadístico de la prueba Paso 7 Tomar la decisión, para esto, se comparan el esquema de la parte 5, con el estadístico del paso 6
  • 171. T DE STUDENT En probabilidad y estadística, la distribución t-Student es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Una variable aleatoria se distribuye según el modelo de t-Student con n grados de libertad. Propiedades: 1. La gráfica de la función de densidad es en forma de campana. 2. Los datos están más disperso que la curva normal estándar. 3. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1). 4. La gráfica es muy parecida a la de la normal estándar diferenciándose en que las colas de t están por encima de la normal, y el centro se encuentra por debajo del de la normal. 5. Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal. EJERCICIO Paso 1 Elegimos la opción analizar, donde se despliega otra ventana y seleccionamos prueba T para una muestra. Paso 2 Trasladamos la variable precio hacia la ventana derecha, y elegimos aceptar, esperamos un momento y obtendremos los resultados.
  • 172. Paso 1 Escoger la opción Análisis/Regresión/Lineales Paso 2 Se escoge la variable dependiente e independiente según sea el caso de los datos. Clic en la opción Gráficos
  • 173. Paso 3 En la sección de colocar la variable X se utiliza DEPENDENT y para ubicar Y se utiliza la opción *ZPRED, a la vez se escoge las opciones histograma y grafico de prob. Normal. Clic en Continuar Paso 4 Clic en Aceptar
  • 174. Paso 5 Después de comparar los grados de libertad en el ejercicio además del nivel de confianza podemos determinar si el resultado del estadístico se encuentra dentro del rango de aceptación o rechazo. Chi- cuadrado Pruebas paramétricas Se llaman así a las pruebas de hipótesis que cumplen tres requisitos fundamentales: 1 La variable de la prueba debe ser variable cuantitativa. 1 los datos se obtienen por muestreo estadístico. 2 Los datos deben ajustarse a determinadas distribuciones estadísticas. Ejemplo 1) La prueba basada en la distribución normal de probabilidades. 2) La prueba de student. Pruebas no paramétricas Llamadas también pruebas de distribución libre son aquellas en que: 1 la variable de la prueba debe ser cualitativa o cuantitativa 2 los datos se obtienen pos muestreo estadístico 3 son independientes de cualquier distribución de cualquier probabilidad.
  • 175. Ejemplo La prueba del chi-cuadrado Las pruebas paramétricas son más poderosas sin embargo cuando la variable es cualitativa, solo se puede usar las pruebas no paramétricas. Estadístico chi-cuadrado Es un estadístico que sirve de base para una prueba no paramétrica denominada prueba de chi cuadrado que se utiliza especialmente para variables cualitativas, esto es, variables que carecen de unidad y por lo tanto sus valores no pueden expresarse numéricamente. Los valores de estas variables son categorías que solo sirven para clasificar los elementos del universo del estudio. También puede utilizarse para variables cuantitativas, transformándolas, previamente, en variables cualitativas ordinales. El estadístico Chi- Cuadrado se define por: En donde: n=número de elementos de la muestra n-1= números de grados de libertad. =varianza de la muestra = varianza de la población
  • 176. EJERCICIO: Paso1 Clic en analizar, seleccionar la opción tablas de contingencia. Paso 2 Trasladamos las variables precio y volumen a la parte derecha, y hacemos clic en estadísticos. Paso 3 En la ventana que se despliega escogemos la opción chi-cuadrado y hacemos clic en continuar.
  • 177. Paso 4 Cumplido los pasos anteriores, finalmente hacemos clic en aceptar para obtener los resultados de este estadístico. Paso 1 Escoger la opción Análisis/Regresión/Lineales
  • 178. Paso 2 Se escoge la variable dependiente e independiente según sea el caso de los datos. Clic en la opción Gráficos. Paso 3 En la sección de colocar la variable X se utiliza DEPENDENT y para ubicar Y se utiliza la opción *ZPRED, a la vez se escoge las opciones histograma y grafico de prob. Normal. Clic en Continuar Paso 4 Clic en Aceptar
  • 179. Paso 5 Después de comparar los grados de libertad en el ejercicio además del nivel de confianza podemos determinar si el resultado del estadístico se encuentra dentro del rango de aceptación o rechazo. Varianza Cuando es necesario hacer comparaciones entre tres o más medias muéstrales para determinar si provienen de poblaciones iguales utilizamos la técnica de análisis de varianza. Esta técnica se realiza utilizando la distribución de probabilidad F vista anteriormente. Para el uso de esta técnica es necesario seguir los siguientes supuestos: 1) Las poblaciones siguen una Distribución de Probabilidad Normal 2) Las poblaciones tienen desviaciones estándar (σ) iguales 3) Las muestras se seleccionan de modo independiente La técnica del análisis de varianza descompone la variación total en dos componentes de variación llamados variación debida a los tratamientos y variación aleatoria. Cuando estamos frente a un problema de análisis de varianza lo primero que debemos hacer es identificar en términos del problema lo siguiente:
  • 180. Variable dependiente o variable respuesta: Es la variable que nos interesa medir o respuesta que se va a estudiar para determinar el efecto que tiene sobre ella la variable independiente. Variable independiente o factor: Es la variable o factor que puede influenciar en la variabilidad de la respuesta o variable dependiente. Nivel o tratamiento del factor: Es un valor o condición del factor bajo el cual se observa la respuesta medible. Unidad experimental: Es el objeto (persona, animal o cosa) donde se aplica un determinado tratamiento, para obtener una medición de la variable respuesta. Error experimental: Es la variación que no se puede atribuir a un cambio de tratamiento; es decir, la que se produce por los factores extraños que pueden influir en la respuesta y que deben ser eliminados o controlados por el investigador. Aleatorización: Consiste en asignar en forma aleatoria los tratamientos a las unidades experimentales con el propósito de remover los posibles sesgos sistemáticos y neutralizar los efectos de todos aquellos factores externos que no se encuentran bajo el control del investigador, pero pueden estar presentes en el experimento. Nosotros estudiaremos el diseño Completamente Aleatorizado con un solo factor o un factorial. Este modelo es apropiado en aquellas situaciones donde se tiene un solo factor o variable independiente con “c” niveles o tratamientos.
  • 181. Ejercicio Paso 1 Se selecciona la opción analizar, se desplegara otra barra donde se escogerá la opción frecuencias. Paso 2 Se traslada la variable dependiente a la parte derecha, posteriormente hacemos chic en la opción estadísticos. Paso 3 En esta ventana hacemos clic en varianza y luego clic en continuar.
  • 182. Paso 4 Para obtener finalmente los resultados hacemos clic en la opción aceptar, y enseguida saldrán los resultados. ABSTRACT When testing hypotheses, we start from an assumed value (hypothetical) in the population parameter. After collecting a random sample, comparing the statistical sample, as well as the average (x), with the hypothetical parameter is compared with an assumed population mean. Then accepted or rejected the notional value, as appropriate. Notional value is rejected only if the sample result is very unlikely if the hypothesis is true. A statistical test is a method, based on a random sample and meaningful, allowing conclusions to accept or reject a hypothesis previously issued on the value of an unknown parameter of a population.
  • 183. Statistically a hypothesis test is any statement about a population and / or its parameters.A hypothesis test is to contrast two statistical hypotheses. This contrast involves making decisions about the hypothesis. The decision is to reject or not a hypothesis in favor of the other. A statistical hypothesis is denoted by “H” and is two: - Ho: null - H1: alternative hypothesis