Criterios y métodos para probar hipótesis estadísticas, ejemplos

Tabla de contenido:

Criterios y métodos para probar hipótesis estadísticas, ejemplos
Criterios y métodos para probar hipótesis estadísticas, ejemplos
Anonim

La prueba de hipótesis es un procedimiento necesario en estadística. Una prueba de hipótesis evalúa dos declaraciones mutuamente excluyentes para determinar qué declaración está mejor respaldada por los datos de muestra. Cuando se dice que un hallazgo es estadísticamente significativo, se debe a una prueba de hipótesis.

Métodos de verificación

Los métodos para probar hipótesis estadísticas son métodos de análisis estadístico. Por lo general, se comparan dos conjuntos de estadísticas, o se compara un conjunto de datos de muestra con un conjunto de datos sintéticos de un modelo idealizado. Los datos deben interpretarse de tal manera que agreguen nuevos significados. Puede interpretarlos asumiendo una determinada estructura del resultado final y utilizando métodos estadísticos para confirmar o rechazar la suposición. La suposición se denomina hipótesis y las pruebas estadísticas utilizadas para este fin se denominan hipótesis estadísticas.

H0 y H1 hipótesis

Hay dos principaleslos conceptos de prueba estadística de hipótesis: las llamadas "hipótesis principal o nula" e "hipótesis alternativa". También se les llama hipótesis de Neyman-Pearson. La suposición de la prueba estadística se denomina hipótesis nula, hipótesis principal o H0 para abreviar. A menudo se le conoce como la suposición predeterminada o la suposición de que nada ha cambiado. Una violación de la suposición de prueba a menudo se denomina primera hipótesis, hipótesis alternativa o H1. H1 es la abreviatura de alguna otra hipótesis, porque todo lo que sabemos al respecto es que los datos de H0 se pueden descartar.

prueba de hipótesis nula
prueba de hipótesis nula

Antes de rechazar o no la hipótesis nula, se debe interpretar el resultado de la prueba. Una comparación se considera estadísticamente significativa si es poco probable que la relación entre los conjuntos de datos sea la implementación de la hipótesis nula de acuerdo con el umbral de probabilidad: el nivel de significancia. También existen criterios de bondad de ajuste para las pruebas de hipótesis estadísticas. Este es el nombre del criterio de prueba de hipótesis, que está asociado a la supuesta ley de la distribución desconocida. Esta es una medida numérica de la discrepancia entre las distribuciones empírica y teórica.

Procedimiento y criterios para la prueba de hipótesis estadísticas

Los métodos de selección de hipótesis más comunes se basan en el criterio de información de Akaike o en el coeficiente bayesiano. La prueba de hipótesis estadística es una técnica clave tanto en la inferencia como en la inferencia bayesiana, aunque los dos tipos tienen diferencias notables. Pruebas de hipótesis estadísticasdefinir un procedimiento que controle la probabilidad de decidir erróneamente sobre un incumplimiento incorrecto o una hipótesis nula. El procedimiento se basa en la probabilidad de que funcione. Esta probabilidad de tomar una decisión equivocada es la improbabilidad de que la hipótesis nula sea verdadera y que no exista ninguna hipótesis alternativa en particular. La prueba no puede mostrar si es verdadero o falso.

Métodos para probar hipótesis estadísticas
Métodos para probar hipótesis estadísticas

Métodos alternativos de la teoría de la decisión

Existen métodos alternativos de teoría de la decisión, en los que las hipótesis nula y primera se consideran en pie de igualdad. Otros enfoques de toma de decisiones, como la teoría bayesiana, intentan equilibrar las consecuencias de las malas decisiones entre todas las posibilidades en lugar de centrarse en una sola hipótesis nula. Una serie de otros enfoques para decidir cuál de las hipótesis es correcta se basan en los datos, cuáles de ellos tienen las propiedades deseadas. Pero la prueba de hipótesis es el enfoque dominante para el análisis de datos en muchos campos de la ciencia.

Comprobando la hipótesis estadística

Siempre que un conjunto de resultados difiera de otro conjunto, uno debe basarse en pruebas de hipótesis estadísticas o pruebas de hipótesis estadísticas. Su interpretación requiere una comprensión adecuada de los valores p y los valores críticos. También es importante comprender que, independientemente del nivel de significación, las pruebas aún pueden contener errores. Por lo tanto, la conclusión puede no ser correcta.

El proceso de prueba consiste enmúltiples pasos:

  1. Se está creando una hipótesis inicial para la investigación.
  2. Se indican hipótesis nulas y alternativas relevantes.
  3. Explica las suposiciones estadísticas sobre la muestra en la prueba.
  4. Determinación de la prueba adecuada.
  5. Seleccione el nivel de significación y el umbral de probabilidad por debajo del cual se rechazará la hipótesis nula.
  6. La distribución del estadístico de prueba de hipótesis nula muestra los posibles valores en los que se rechaza la hipótesis nula.
  7. Cálculo en curso.
  8. Se toma la decisión de rechazar o aceptar la hipótesis nula a favor de una alternativa.

Hay una alternativa que usa un valor p.

Ejemplos de prueba de hipótesis estadísticas
Ejemplos de prueba de hipótesis estadísticas

Pruebas de significación

Los datos puros no tienen utilidad práctica sin interpretación. En estadística, cuando se trata de hacer preguntas sobre datos e interpretar resultados, se utilizan métodos estadísticos para garantizar la precisión o probabilidad de las respuestas. Cuando se prueban hipótesis estadísticas, esta clase de métodos se denomina prueba estadística o prueba de significación. El término “hipótesis” recuerda a los métodos científicos, donde se investigan hipótesis y teorías. En estadística, una prueba de hipótesis da como resultado una cantidad dada una suposición dada. Le permite interpretar si una suposición es verdadera o si se ha cometido una infracción.

Interpretación estadística de las pruebas

Pruebas de hipótesisse utilizan para determinar qué resultados de investigación conducirán al rechazo de la hipótesis nula para un nivel de significación predeterminado. Los resultados de una prueba de hipótesis estadística deben interpretarse para que se pueda continuar trabajando en ella. Hay dos formas comunes de criterios estadísticos de prueba de hipótesis. Estos son el valor p y los valores críticos. Dependiendo del criterio seleccionado, los resultados obtenidos deben interpretarse de forma diferente.

¿Qué es un valor p?

La salida se describe como estadísticamente significativa cuando se interpreta el valor p. De hecho, este indicador significa la probabilidad de error si se rechaza la hipótesis nula. En otras palabras, se puede usar para nombrar un valor que se puede usar para interpretar o cuantificar el resultado de una prueba y para determinar la probabilidad de error al rechazar la hipótesis nula. Por ejemplo, puede realizar una prueba de normalidad en una muestra de datos y encontrar que hay pocas posibilidades de valores atípicos. Sin embargo, no es necesario rechazar la hipótesis nula. Una prueba de hipótesis estadística puede devolver un valor p. Esto se hace comparando el valor de p con un valor de umbral predeterminado llamado nivel de significancia.

Prueba estadística de hipótesis nulas
Prueba estadística de hipótesis nulas

Nivel de importancia

El nivel de significación a menudo se escribe con la letra minúscula griega "alfa". El valor general utilizado para alfa es 5% o 0,05. Un valor alfa más pequeño sugiere una interpretación más confiable de la hipótesis nula. El valor p se compara convalor alfa preseleccionado. El resultado es estadísticamente significativo si el valor p es menor que alfa. El nivel de significación se puede invertir restándolo de uno. Esto se hace para determinar el nivel de confianza de la hipótesis dados los datos de muestra observados. Cuando se utiliza este método de prueba de hipótesis estadísticas, el valor P es probabilístico. Esto significa que en el proceso de interpretación del resultado de una prueba estadística, uno no sabe qué es verdadero o falso.

Teoría de la prueba de hipótesis estadística

El rechazo de la hipótesis nula significa que hay suficiente evidencia estadística de que parece probable. De lo contrario, significa que no hay suficientes estadísticas para rechazarlo. Uno puede pensar en las pruebas estadísticas en términos de la dicotomía de rechazar y aceptar la hipótesis nula. El peligro de la prueba estadística de la hipótesis nula es que, si se acepta, puede parecer verdadera. En cambio, sería más correcto decir que la hipótesis nula no se rechaza porque no hay suficiente evidencia estadística para rechazarla.

Criterios de bondad de ajuste de las pruebas de hipótesis estadísticas
Criterios de bondad de ajuste de las pruebas de hipótesis estadísticas

Este momento a menudo confunde a los extras novatos. En tal caso, es importante recordar que el resultado es probabilístico y que, incluso aceptando la hipótesis nula, existe una pequeña posibilidad de error.

Hipótesis nula verdadera o falsa

La interpretación del valor de p no significa que cerola hipótesis es verdadera o falsa. Esto significa que se ha optado por rechazar o no la hipótesis nula a un cierto nivel de significación estadística en función de los datos empíricos y la prueba estadística elegida. Por lo tanto, el valor p puede considerarse como la probabilidad de los datos dados bajo una suposición predeterminada incluida en las pruebas estadísticas. El valor p es una medida de la probabilidad de que se observe la muestra de datos si la hipótesis nula es verdadera.

Interpretación de valores críticos

Algunas pruebas no devuelven pág. En su lugar, pueden devolver una lista de valores críticos. Los resultados de tal estudio se interpretan de manera similar. En lugar de comparar un solo valor p con un nivel de significación predeterminado, la estadística de prueba se compara con un valor crítico. Si resulta ser menor, significa que no fue posible rechazar la hipótesis nula. Si es mayor o igual, se debe rechazar la hipótesis nula. El significado del algoritmo estadístico de prueba de hipótesis y la interpretación de su resultado es similar al valor p. El nivel de significancia elegido es una decisión probabilística de rechazar o no rechazar la suposición de prueba base dados los datos.

Errores en pruebas estadísticas

La interpretación de una prueba de hipótesis estadística es probabilística. La tarea de probar hipótesis estadísticas no es encontrar una afirmación verdadera o falsa. La evidencia de prueba puede ser errónea. Por ejemplo, si el alfa fue del 5 %, esto significa que, en su mayor parte, 1 de cada 20la hipótesis nula será rechazada por error. O no lo hará debido al ruido estadístico en la muestra de datos. Dado este punto, un valor de p pequeño para rechazar la hipótesis nula puede significar que es falsa o que se ha cometido un error. Si se comete este tipo de error, el resultado se denomina falso positivo. Y tal error es un error de primer tipo cuando se prueban hipótesis estadísticas. Por otro lado, si el valor p es lo suficientemente grande como para significar el rechazo de la hipótesis nula, puede significar que es verdadera. O no es correcto, y ocurrió algún evento improbable por el cual se cometió el error. Este tipo de error se denomina falso negativo.

Prueba estadística de hipótesis nulas
Prueba estadística de hipótesis nulas

Probabilidad de errores

Al probar hipótesis estadísticas, aún existe la posibilidad de cometer cualquiera de estos tipos de errores. Los datos falsos o las conclusiones falsas son bastante probables. Idealmente, se debe elegir un nivel de significación que minimice la probabilidad de uno de estos errores. Por ejemplo, la prueba estadística de hipótesis nulas puede tener un nivel de significación muy bajo. Aunque los niveles de significación como 0,05 y 0,01 son comunes en muchos campos de la ciencia, el nivel de significación más utilizado es 310^-7, o 0,0000003. A menudo se lo denomina "5-sigma". Esto significa que la conclusión fue aleatoria con una probabilidad de 1 en 3,5 millones de repeticiones independientes de los experimentos. Los ejemplos de prueba de hipótesis estadísticas a menudo conllevan tales errores. Esta es también la razón por la cual es importante tener resultados independientes.verificación.

Ejemplos del uso de la verificación estadística

Hay varios ejemplos comunes de prueba de hipótesis en la práctica. Una de las más populares es la conocida como “Degustación de Té”. La Dra. Muriel Bristol, colega del fundador de la biometría, Robert Fisher, afirmó poder saber con certeza si se agregó primero a una taza de té o leche. Fisher se ofreció a darle ocho tazas (cuatro de cada variedad) al azar. La estadística de la prueba era simple: contar el número de aciertos en la elección de una taza. La región crítica fue el único éxito de 4, posiblemente basado en el criterio de probabilidad habitual (< 5%; 1 en 70 ≈ 1,4%). Fisher argumentó que no se requiere una hipótesis alternativa. La señora identificó correctamente cada taza, lo que se consideró un resultado estadísticamente significativo. Esta experiencia condujo al libro de Fisher Métodos estadísticos para investigadores.

Ejemplo de demandado

El procedimiento de juicio estadístico es comparable a un tribunal penal en el que se presume la inocencia del acusado hasta que se pruebe su culpabilidad. El fiscal trata de probar la culpabilidad del acusado. Solo cuando hay pruebas suficientes para un cargo, el acusado puede ser declarado culpable. Al comienzo del procedimiento, hay dos hipótesis: "El acusado no es culpable" y "El acusado es culpable". La hipótesis de inocencia sólo puede rechazarse cuando el error es muy improbable porque no se quiere condenar a un acusado inocente. Este tipo de error se denomina error de tipo I y su apariciónraramente controlado. Como consecuencia de este comportamiento asimétrico, el error tipo II, es decir, la absolución del autor, es más común.

Ejemplos de validación estadística
Ejemplos de validación estadística

Las estadísticas son útiles cuando se analizan grandes cantidades de datos. Esto se aplica igualmente a la prueba de hipótesis, que puede justificar las conclusiones incluso si no existe una teoría científica. En el ejemplo de la degustación de té, era "obvio" que no había diferencia entre verter leche en el té o verter té en la leche.

La aplicación práctica real de la prueba de hipótesis incluye:

  • probando si los hombres tienen más pesadillas que las mujeres;
  • atribución del documento;
  • Evaluación de la influencia de la luna llena en el comportamiento;
  • determinar el rango en el que un murciélago puede detectar un insecto usando un eco;
  • elección de los mejores medios para dejar de fumar;
  • Comprobar si las pegatinas de parachoques reflejan el comportamiento del propietario del coche.

La prueba de hipótesis estadística juega un papel importante en las estadísticas en general y en la inferencia estadística. La prueba de valor se utiliza como reemplazo de la comparación tradicional del valor predicho y el resultado experimental en el núcleo del método científico. Cuando una teoría solo es capaz de predecir el signo de una relación, las pruebas de hipótesis dirigidas pueden configurarse de tal manera que solo un resultado estadísticamente significativo apoye la teoría. Esta forma de teoría de la evaluación es la más rígidacrítica al uso de la prueba de hipótesis.

Recomendado: