martes, 27 de abril de 2010

PRUEBAS DE HIPOTESIS ESTADISTICAS.

PRUEBAS DE HIPÓTESIS ESTADÍSTICAS

INTRODUCCIÓN.

Un test estadístico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el valor de un parámetro desconocido de una población.

La hipótesis nula es aquella que el investigador está dispuesto a sostener y se designa por H0.

La hipótesis alternativa es su negación y se designa por H1.

Características de la hipótesis nula:

1. Se va a considerar como cierta hasta que se tenga suficiente evidencia de lo contrario.

2. SIEMPRE incluye el signo de igualdad .

3. Es la base para el análisis estadístico de la prueba.

Características de la hipótesis alternativa:

1. Es lo contrario a la hipótesis nula (, <, >).

2. En general esta hipótesis se establece en términos de lo que se anda buscando evidencia.

3. Es la que define la dirección de la zona de rechazo.

Ejemplo:

La prueba de hipótesis se parece a un juicio penal. En éste, se parte del supuesto de que el acusado es inocente. La hipótesis nula es de inocencia. Lo contrario de la hipótesis nula es la hipótesis alternativa la cual expresa una creencia de culpabilidad, Por consiguiente, las hipótesis en un juicio criminal se escribirían:

Ho: El acusado es inocente

Ha: El acusado es culpable

Para probar las aseveraciones o hipótesis se lleva a cabo un juicio. El testimonio y las pruebas obtenidas durante el juicio equivalen a la información de la muestra. Si la información de la muestra concuerda con la hipótesis de inocencia, no se puede rechazar la hipótesis nula que el consignado es inocente. Sin embargo, si la información muestral no es consistente con la hipótesis de inocencia, se rechazará la hipótesis nula. En este caso, la acción a tomar se basará en la hipótesis alternativa de que el acusado es culpable.

ERRORES DE TIPO I Y TIPO II

En una prueba de hipótesis pueden cometerse 2 tipos de errores:

Error de tipo I. Se comete cuando la hipótesis nula es verdadera y, como consecuencia del contraste, se rechaza.

Error de tipo II. Se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se acepta.

Situación real desconocida


Ho cierta

Ho falsa

Rechazar Ho

Error tipo II

Decisión correcta


Aceptar Ho

Decisión correcta

Error tipo II

Decisión tomada

Rechazar Ho cuando es cierta se llama error Tipo I, y no rechazar Ho, cuando es falsa, se llama error Tipo II.

Es necesario tener alguna cantidad que mida la posibilidad de cometer alguno de estos errores. Esta medida es una probabilidad.

La probabilidad de rechazar Ho, dado que Ho es verdadera, se define como la probabilidad del error Tipo I y se denota por α.

La probabilidad de no rechazar Ho, dado que Ho es falsa, se define como la probabilidad del error tipo II y se denota por β.

Por tanto las probabilidades de los errores Tipo I y II están dadas por las proposiciones

P (rechazar Ho | Ho verdadera) = α

P ( no rechazar Ho | Ho es falsa) = β

Nótese que tanto α como β son probabilidades condicionales. No pueden obtenerse las probabilidades de los errores Tipo I y II en un sentido absoluto, debido a que el estado de la naturaleza no es conocido. Más bien, puede calcularse la probabilidad α de rechazar Ho sólo si se asume que Ho cierta, o la probabilidad β de equivocarse el rechazar Ho, si se asume que Ho es falsa.

Propiedades de α y β

1. El valor de α se fija al escoger la zona de rechazo.

2. El valor de β dependerá de la hipótesis alternativa que se escoja.

3. Para un tamaño muestral fijo, al aumentar la región de rechazo y por lo tanto α, β disminuye. Si α decrece, β aumentará.

4. Al aumentar el tamaño de la muestra α y β decrecen a la vez

Ejemplo:

Suponga que un método nuevo y más caro, para detectar el cáncer de la matriz en las mujeres, se está probando para ver si es superior al método usado generalmente.

Las hipótesis estadísticas son:

Ho: El nuevo tratamiento no es mejor que el comúnmente usado

Ha: El nuevo tratamiento es mejor que el comúnmente usado

Se tiene un error tipo I cuando se rechaza Ho siendo verdadera; las consecuencias de este error incrementarían los costos médicos. Un error del Tipo II se tiene cuando Ho no se rechaza siendo falsa; sus consecuencias serían una menor eficacia del tratamiento y, posiblemente, una mayor proporción de muertes por cáncer en la matriz. Aquí el error más serio es el error Tipo II.

POTENCIA DE LA PRUEBA

Al probar una hipótesis Ѳ = Ѳ0 en contra de una posibilidad Ѳ = Ѳ1, la probabilidad de un error de tipo II es la probabilidad de que la prueba no rechace la hipótesis Ѳ = Ѳ0. La potencia de esta prueba en Ѳ = Ѳ1 es 1 menos esta probabilidad. Desde el punto de vista alternativo, la potencia de la prueba en Ѳ = Ѳ1 es la probabilidad de que la prueba rechazará la hipótesis Ѳ = Ѳ0 si de hecho Ѳ = Ѳ1. Esta probabilidad en general variará conforme Ѳ1 cambia; es una función de Ѳ1, llamada función de potencia de la prueba.

En resumen:

La función de potencia de una prueba de una hipótesis Ѳ = Ѳ0 es la función cuyo valor en Ѳ = Ѳ1 es la probabilidad de que la prueba rechazará la hipótesis Ѳ = Ѳ0 si de hecho Ѳ = Ѳ1.

Ejemplo:

El experimentador planea hacer 36 mediciones de una resistencia por un método que implica una varianza de 10 ohms2. Establece la hipótesis nula Ho: =50, donde | es la verdadera resistencia. Encontramos que una prueba de Ho en contra de la posibilidad ≠ 50 se obtiene rechazando la hipótesis si | -50|˃1.03, que llamaremos prueba de dos colas p1 ( de esta prueba. El valor en un número de la función de potencia es la probabilidad a priori de que Ho será rechazada si la verdadera media de la población es

P1( = Pr {|- 50| ˃ 1.03} = Pr { ˃ 51.03} + Pr{ ˂ 48.97},

Calculando esta probabilidad en la suposición de que la verdadera media de la población es . Ahora está, aproximadamente, distribuida en forma normal con media y desviación estándar =0.527 por lo que z =(-)/0.527 es aproximadamente normal (0, 1), y

P1= Pr {z˃(51.03-)/0.527}+Pr{z˂(48.97-)/0.527}.

P1(50) es por definición la probabilidad del error de tipo I, y la prueba fue hecha de manera que ésta sea 0.05.(4)

DIFERENTES TIPOS DE HIPÓTESIS ESTADÍSTICAS

Si Ѳ es un parámetro cualquiera y Ѳ0 es una constante en el conjunto de valores que puede tomar el parámetro, la hipótesis es de la siguiente forma:

Ho: Ѳ≤Ѳ0 en oposición a Ha: Ѳ˃Ѳ0.

Cuando la hipótesis indica que tanto la hipótesis nula como la alternativa contienen más de un punto se dice que la hipótesis es compuesta en oposición a compuesta. Además debido al hecho la regla de decisión generalmente es “rechazar Ho si la estadística es mayor o igual que una cierta cantidad”, entonces es una hipótesis de cola derecha.

Hipótesis simple en oposición a Hipótesis simple.

En este caso se tiene un parámetro Ѳ y dos valores Ѳ1 Ѳ0 que son los únicos valores que puede tomar Ѳ, esto se expresa:

Ho: Ѳ = Ѳ0 en oposición a Ha: Ѳ = Ѳ1.

Se debe notar que si Ѳ1 ˃ Ѳ0, se tiene una hipótesis de cola derecha y si Ѳ1 ˂ Ѳ0, se tiene una hipótesis de cola izquierda, indicando que la cola de decisión generalmente será del tipo “Rechazar Ho si X es mayor o igual que una constante”.

Hipótesis simple en oposición a Hipótesis compuesta.

Se tiene un valor Ѳ0, las hipótesis posibles son:

Ho: Ѳ = Ѳ0 en oposición a Ha Ѳ ˃ Ѳ0. Prueba de cola derecha.

Ho: Ѳ = Ѳ0 en oposición a Ha Ѳ ˂ Ѳ0. Hipótesis de cola izquierda, simétrica en comparación con la del caso (a), la diferencia consiste en la regla de decisión que seria del tipo” Rechazar Ho si la estadística es mayor o igual que una cierta constante”.

Ho: Ѳ = Ѳ0 en oposición a Ha Ѳ ≠ Ѳ0. Prueba de hipótesis de dos colas.

Hipótesis compuesta en oposición a Hipótesis simple.

Los posibles juegos serian:

Ho: Ѳ≤Ѳ0 en oposición a Ha: Ѳ = Ѳ1 1 ˃ Ѳ0).

Ho: Ѳ≥Ѳ0 en oposición a Ha: Ѳ = Ѳ1 1 < Ѳ0).

Esta situación sería simétrica en los casos a y b en 2.

Hipótesis compuesta en oposición a Hipótesis compuesta.

En esta categoría se encuentra las situaciones de mayor importancia práctica. Los posibles juegos de hipótesis son:

Ho: Ѳ≤Ѳ0 en oposición a Ha: Ѳ ˃ Ѳ0.

Ho: Ѳ≥Ѳ0 en oposición a Ha: Ѳ < Ѳ0.

Se debe notar que el caso 4-b sería una prueba de cola izquierda.

PRUEBAS DE HIPOTESIS DE UNA Y DOS COLAS

Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la curva de z o de la curva t donde se rechaza H0.

La región puede ser de una cola o de dos dependiendo de la hipótesis alterna.

La prueba de dos colas es apropiada al trabajar con una hipótesis en contra de la probabilidad ≠la prueba de una cola es apropiada en el caso de tener una hipótesis = en contra de la posibilidad ˃ 

a

Ejemplos

Para H1: > valor aceptado, la región de rechazo está dada por:

(cola derecha, z ó t)

a

Para H1 : <>

(cola izquierda, z ó t)

a/2

a/2

Para H1 : valor aceptado, la región de rechazo es de dos colas y está dada por:

(2-colas, z ó t)

Ejemplo 1:

Determine si la región de rechazo es de la cola derecha, de la cola izquierda o de dos colas.

a. H0 : = 15, H1 : 15, a=.05

b. H0 : p  0.7, H1 : p > 0.7, a=.02

Solución: La forma de la región de rechazo está determinada por la hipótesis alterna.

H1 : 15 significa que la región está en ambas colas.


H1 : p > 7 significa que la región está en la cola derecha.



.02


(5).

CÁLCULO DEL TAMAÑO DE LA MUESTRA

A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.

Parámetro. Son las medidas o datos que se obtienen sobre la población.

Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.

Error Muestral, de estimación o Estandar. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.

Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

Varianza Poblacional. Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA DE LA POBLACIÓN

Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:
1.- Obtener el tamaño muestral imaginando que
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img.gif:

http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img1.gif
donde:
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img2.gif: z correspondiente al nivel de confianza elegido
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img3.gif: varianza poblacional
e: error máximo

2.- Comprobar si se cumple
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img4.gif
si esta condición se cumple el proceso termina aquí, y ese es el tamaño adecuado que debemos muestrear.

Si no se cumple, pasamos a una tercera fase:
3.- Obtener el tamaño de la muestra según la siguiente fórmula:
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img5.gif

Veamos un ejemplo: La Consejería de Trabajo planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que empleemos?.

Buscamos en las tablas de la curva normal el valor de http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img6.gif que corresponde con el nivel de confianza elegido: http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img7.gif= ±1.96 y seguimos los pasos propuestos arriba.

1.-
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img8.gif

2.- Comprobamos que no se cumple http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img9.gif, pues en este caso

10000 <>

3.-
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/img10.gif

MÉTODO PARA PROBAR HIPOTESIS ESTADISTICAS.

Pasos secuenciales para la prueba de hipótesis estadísticas.

1.- elegir el modelo probabilístico sobre el cual se trabajará.

2.- en el modelo probabilístico elegido se identifica el parámetro sobre el cual se desea inferir con base en la muestra.

3.- se elige el tipo de juego de hipótesis que se probará. En la práctica los juegos de hipótesis más usuales son:

a) Ho: Ѳ≤Ѳ0 en oposición a Ha: Ѳ˃Ѳ0.

b) Ho: Ѳ≥Ѳ0 en oposición a Ha: Ѳ˂Ѳ0.

c) Ho: Ѳ=Ѳ0 en oposición a Ha: Ѳ≠Ѳ0.

Donde Ѳ es el parámetro sobre el cual se desea inferir y Ѳ0 es una constante elegida por el experimentador.

4.- se elige una estadística de prueba. La distribución de la estadística (variable aleatoria) depende del parámetro Ѳ, ya que esto es lo que permite discernir cuales valores de la estadística son plausibles bajo Ho y cuáles no.

5.- se selecciona una regla de decisión que defina una región de rechazo, que está integrada por valores de la estadística que son improbables bajo Ho. El conjunto de valores que integran la región de rechazo esta constreñida por el nivel de significancia que se desea para la prueba.

6.- una vez que la regla de decisión y su correspondiente región de rechazo han sido elegidas, queda calcular el valor de la estadística de prueba en la muestra que se tiene y determinar si pertenece al subconjunto de su espacio muestral en la región de rechazo o a la región de no rechazo. La decisión que se toma es como sigue:

Si el valor de la estadística está en la región de rechazo decimos que la hipótesis nula se rechaza con un nivel de significancia (máxima probabilidad de rechazarla falsamente) α. Si el valor de la estadística en la muestra está en la región de no rechazo, decimos que Ho no se rechaza al nivel de significancia establecido. En ningún caso se concluye que Ho es falsa o cierta.

PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL.

Ciertamente sospechamos que las pruebas sobre una media poblacional http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1171.gifcon http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gifdesconocida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es idéntica a la del caso de http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1176.gifconocida, con la excepción de que el valor http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1176.gifen la estadística de prueba se reemplaza por la estimación de s calculada y la distribución normal estándar se reemplaza con una distribución t.

Ejemplos:

El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan varios aparatos eléctrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora, ¿esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es normal.

Solución:

Datos:

http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1171.gif= 46 kilowatt-hora

s= 11.9 kilowatt-hora

http://www.itch.edu.mx/academic/industrial/estadistica1/img/image421.gif= 42 kilowatt-hora

n = 12

http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif= 0.05

Ensayo de hipótesis

Ho; http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1171.gif= 46 kilowatt-hora

H1; http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1171.gif<>

http://www.itch.edu.mx/academic/industrial/estadistica1/img/image910.gif

Regla de decisión:

Si tR http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1173.gif-1.796 No se rechaza Ho

Si tR < -1.796 Se rechaza Ho

Cálculos:

http://www.itch.edu.mx/academic/industrial/estadistica1/img/image911.gif

Justificación y decisión:

Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0.05 que el número promedio de kilowwatt-hora que gastan al año las aspiradoras no es significativamente menor que 46.

Solución por el otro método:

http://www.itch.edu.mx/academic/industrial/estadistica1/img/image912.gif

http://www.itch.edu.mx/academic/industrial/estadistica1/img/image913.gif

Regla de decisión:

Si http://www.itch.edu.mx/academic/industrial/estadistica1/img/image490.gifhttp://www.itch.edu.mx/academic/industrial/estadistica1/img/image1173.gif39.83 No se Rechaza Ho

Si http://www.itch.edu.mx/academic/industrial/estadistica1/img/image490.gif<>o

Como la http://www.itch.edu.mx/academic/industrial/estadistica1/img/image490.gif= 42 y este valor no es menor que 39.83 por lo tanto no se rechaza Ho.

Se puede aprovechar este ejemplo para calcular el valor de P , como el valor de t calculada es de –1.16, se busca en la tabla y se ve que el area a la izquierda de este valor es de 0.135 con 11 grados de libertad, por lo tanto no se rechaza Ho., ya que sería un valor alto para un nivel de significancia.

REFERENCIAS

BIBLIOGRAFIAS:

1.-Said Infante Gil.Guillermo P. Zarate De Lara Métodos Estadísticos, Un Enfoque Interdisciplinario. Primera Edición, Editorial Trillas México.

2.-Introduccion A La Estadistica Matematica, H. D. Brunk, Primera Edición En Español Octubre 1979, Editorial Trillas.

3.- Stephen S. Willoughby, Probabilidad Y Estadistica, Quinta Reimpresión Publicaciones Cultural S.A, México, D.F

WEBGRAFIAS:

4.-Http://Www.Itchihuahuaii.Edu.Mx/Academico/Cb/Meg/Documentos/3.1.Htm

5.- Http://Www.Itch.Edu.Mx/Academic/Industrial/Estadistica1/Cap03.Html#Tres_Prueba_Media_Var_Desconocida

6.- Http://Www.Vitutor.Net/2/12/Prueba_Hipotesis.Html

No hay comentarios:

Publicar un comentario