Modelo estadístico: la esencia del método, construcción y análisis

Tabla de contenido:

Modelo estadístico: la esencia del método, construcción y análisis
Modelo estadístico: la esencia del método, construcción y análisis
Anonim

Un modelo estadístico es una proyección matemática que incorpora un conjunto de suposiciones diferentes sobre la generación de algunos datos de muestra. El término se presenta a menudo en una forma muy idealizada.

Los supuestos expresados en el modelo estadístico muestran un conjunto de distribuciones de probabilidad. Muchos de los cuales están destinados a aproximar correctamente la distribución de la que se extrae un conjunto particular de información. Las distribuciones de probabilidad inherentes a los modelos estadísticos son las que distinguen la proyección de otras modificaciones matemáticas.

Proyección general

modelos de procesos estadísticos
modelos de procesos estadísticos

El modelo matemático es una descripción del sistema usando ciertos conceptos y lenguaje. Se aplican a las ciencias naturales (como física, biología, ciencias de la tierra, química) y disciplinas de ingeniería (como informática, ingeniería eléctrica), así como a las ciencias sociales (como economía, psicología, sociología, ciencia política).

El modelo puede ayudar a explicar el sistema yestudiar la influencia de varios componentes y hacer predicciones de comportamiento.

Los modelos matemáticos pueden tomar muchas formas, incluidos sistemas dinámicos, proyecciones estadísticas, ecuaciones diferenciales o parámetros de teoría de juegos. Estos y otros tipos pueden superponerse, y este modelo incluye muchas estructuras abstractas. En general, las proyecciones matemáticas también pueden incluir componentes lógicos. En muchos casos, la calidad de un campo científico depende de qué tan bien concuerden los modelos matemáticos desarrollados teóricamente con los resultados de experimentos repetidos. La f alta de concordancia entre los procesos teóricos y las mediciones experimentales a menudo conduce a avances importantes a medida que se desarrollan mejores teorías.

En las ciencias físicas, el modelo matemático tradicional contiene una gran cantidad de los siguientes elementos:

  • Ecuaciones de control.
  • Submodelos adicionales.
  • Definir ecuaciones.
  • Ecuaciones constituyentes.
  • Supuestos y limitaciones.
  • Condiciones iniciales y de contorno.
  • Restricciones clásicas y ecuaciones cinemáticas.

Fórmula

Un modelo estadístico, por regla general, se establece mediante ecuaciones matemáticas que combinan una o más variables aleatorias y, posiblemente, otras variables naturales. De manera similar, la proyección se considera "el concepto formal de un concepto".

Todas las pruebas de hipótesis estadísticas y las evaluaciones estadísticas se obtienen a partir de modelos matemáticos.

Introducción

modelos matemáticos estadísticos
modelos matemáticos estadísticos

De manera informal, un modelo estadístico puede verse como una suposición (o un conjunto de suposiciones) con una propiedad específica: permite calcular la probabilidad de cualquier evento. Como ejemplo, considere un par de dados ordinarios de seis caras. Es necesario explorar dos supuestos estadísticos diferentes sobre el hueso.

La primera suposición es:

Para cada uno de los dados, la probabilidad de obtener uno de los números (1, 2, 3, 4, 5 y 6) es: 1/6.

A partir de esta suposición, podemos calcular la probabilidad de ambos dados: 1:1/6×1/6=1/36.

Más generalmente, puedes calcular la probabilidad de cualquier evento. Sin embargo, debe entenderse que es imposible calcular la probabilidad de cualquier otro evento no trivial.

Solo la primera opinión recoge un modelo matemático estadístico: debido a que con una sola suposición es posible determinar la probabilidad de cada acción.

En el ejemplo anterior con permiso inicial, es fácil determinar la posibilidad de un evento. Con algunos otros ejemplos, el cálculo puede ser difícil o incluso poco realista (por ejemplo, puede requerir muchos años de cálculos). Para una persona que diseña un modelo de análisis estadístico, tal complejidad se considera inaceptable: la implementación de los cálculos no debería ser prácticamente imposible ni teóricamente imposible.

Definición formal

En términos matemáticos, el modelo estadístico de un sistema se suele considerar como un par (S, P), donde S esel conjunto de posibles observaciones, es decir, el espacio muestral, y P es el conjunto de distribuciones de probabilidad en S.

La intuición de esta definición es la siguiente. Se supone que existe una distribución de probabilidad "verdadera" causada por el proceso que genera ciertos datos.

Conjunto

Es él quien determina los parámetros del modelo. La parametrización generalmente requiere diferentes valores para dar como resultado diferentes distribuciones, es decir,

Modelo Consecuencia
Modelo Consecuencia

debe contener (en otras palabras, debe ser inyectiva). Se dice que una parametrización que cumple con el requisito es identificable.

Ejemplo

Gráfico de estadísticas
Gráfico de estadísticas

Supongamos que hay un cierto número de estudiantes de diferentes edades. La altura del niño estará relacionada estocásticamente con el año de nacimiento: por ejemplo, cuando un escolar tiene 7 años, esto afecta la probabilidad de crecimiento, solo que la persona medirá más de 3 centímetros.

Puede formalizar este enfoque en un modelo de regresión de línea recta, por ejemplo, de la siguiente manera: altura i=b 0 + b 1edadi + εi, donde b 0 es la intersección, b 1 es el parámetro por el cual la edad se multiplica al obtener el seguimiento de la elevación. Este es un término de error. Es decir, asume que la edad predice la altura con cierto error.

Un formulario válido debe coincidir con todos los puntos de información. Por lo tanto, la dirección rectilínea (nivel i=b 0 + b 1agei) no puede ser una ecuación para un modelo de datos, si no responde claramente a todos los puntos. Es decirsin excepción, toda la información se encuentra perfectamente en la línea. El margen de error εi debe ingresarse en la ecuación para que el formulario coincida absolutamente con todos los elementos de información.

Para hacer una inferencia estadística, primero debemos asumir algunas distribuciones de probabilidad para ε i. Por ejemplo, se puede suponer que las distribuciones de ε i tienen una forma gaussiana con media cero. En este caso, el modelo tendrá 3 parámetros: b 0, b 1 y la varianza de la distribución Gaussiana.

Puede especificar formalmente el modelo como (S, P).

En este ejemplo, el modelo se define especificando S, por lo que se pueden hacer algunas suposiciones sobre P. Hay dos opciones:

Este crecimiento se puede aproximar mediante una función lineal de la edad;

Que los errores en la aproximación se distribuyen como dentro de una Gaussiana.

Comentarios generales

Los parámetros estadísticos de los modelos son una clase especial de proyección matemática. ¿Qué diferencia a una especie de otra? Así es que el modelo estadístico es no determinista. Así, en ella, a diferencia de las ecuaciones matemáticas, ciertas variables no tienen determinados valores, sino que tienen una distribución de posibilidades. Es decir, las variables individuales se consideran estocásticas. En el ejemplo anterior, ε es una variable estocástica. Sin ella, la proyección sería determinista.

Con frecuencia se utiliza la construcción de un modelo estadístico, incluso si el proceso material se considera determinista. Por ejemplo, lanzar monedas al aire es, en principio, una acción predeterminante. Sin embargo, esto todavía se modela en la mayoría de los casos como estocástico (a través de un proceso de Bernoulli).

Según Konishi y Kitagawa, hay tres objetivos para un modelo estadístico:

  • Predicciones.
  • Extracción de información.
  • Descripción de estructuras estocásticas.

Tamaño de proyección

Supongamos que hay un modelo de predicción estadística, El modelo se llama paramétrico si O tiene una dimensión finita. En la solución, debes escribir que

Diferencia de modelo
Diferencia de modelo

donde k es un número entero positivo (R representa cualquier número real). Aquí k se llama la dimensión del modelo.

Como ejemplo, podemos suponer que todos los datos provienen de una distribución gaussiana univariada:

Fórmula estadística
Fórmula estadística

En este ejemplo, la dimensión de k es 2.

Y como otro ejemplo, se puede suponer que los datos constan de puntos (x, y), que se supone que están distribuidos en línea recta con residuos gaussianos (con media cero). Entonces la dimensión del modelo económico estadístico es igual a 3: la intersección de la recta, su pendiente y la varianza de la distribución de residuos. Cabe señalar que en geometría una línea recta tiene una dimensión de 1.

Aunque el valor anterior es técnicamente el único parámetro que tiene dimensión k, a veces se considera que contiene k valores distintos. Por ejemplo, con una distribución gaussiana unidimensional, O es el único parámetro con un tamaño de 2, pero a veces se considera que contiene dosparámetro individual - valor medio y desviación estándar.

Un modelo de proceso estadístico no es paramétrico si el conjunto de valores O es de dimensión infinita. También es semiparamétrico si tiene parámetros de dimensión finita e infinita. Formalmente, si k es una dimensión de O y n es el número de muestras, los modelos semiparamétricos y no paramétricos tienen

fórmula del modelo
fórmula del modelo

entonces el modelo es semiparamétrico. De lo contrario, la proyección no es paramétrica.

Los modelos paramétricos son las estadísticas más utilizadas. Con respecto a las proyecciones semiparamétricas y no paramétricas, Sir David Cox afirmó:

"Por lo general, involucran la menor cantidad de hipótesis sobre la textura y la forma de distribución, pero incluyen poderosas teorías sobre la autosuficiencia".

Modelos anidados

No las confunda con proyecciones multinivel.

Dos modelos estadísticos están anidados si el primero se puede convertir en el segundo imponiendo restricciones a los parámetros del primero. Por ejemplo, el conjunto de todas las distribuciones gaussianas tiene un conjunto anidado de distribuciones de media cero:

Es decir, debe limitar la media en el conjunto de todas las distribuciones gaussianas para obtener distribuciones con media cero. Como segundo ejemplo, el modelo cuadrático y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) tiene un modelo lineal incrustado y=b 0 + b 1 x + ε, ε ~ N (0,σ 2) - es decir, el parámetro b2 es igual a 0.

En ambos ejemplos, el primer modelo tiene una dimensionalidad mayor que el segundo modelo. Esto es a menudo, pero no siempre el caso. Otro ejemplo es el conjunto de distribuciones gaussianas con media positiva, que tiene dimensión 2.

Comparación de modelos

modelo estadístico
modelo estadístico

Se supone que existe una distribución de probabilidad "verdadera" subyacente a los datos observados inducidos por el proceso que los generó.

Y también los modelos se pueden comparar entre sí, mediante análisis exploratorio o confirmatorio. En un análisis exploratorio, se formulan diferentes modelos y se evalúa qué tan bien cada uno de ellos describe los datos. En un análisis confirmatorio, la hipótesis previamente formulada se compara con la original. Los criterios comunes para esto incluyen P 2, factor bayesiano y probabilidad relativa.

El pensamiento de Konishi y Kitagawa

“La mayoría de los problemas en un modelo matemático estadístico pueden considerarse preguntas predictivas. Suelen formularse como comparaciones de varios factores.”

Además, Sir David Cox dijo: "Como traducción del tema, el problema en el modelo estadístico suele ser la parte más importante del análisis".

Recomendado: