La estadística matemática es una metodología que le permite tomar decisiones informadas frente a condiciones inciertas. El estudio de métodos para recopilar y sistematizar datos, procesar los resultados finales de experimentos y experimentos con aleatoriedad masiva y descubrir cualquier patrón es lo que hace esta rama de las matemáticas. Considere los conceptos básicos de las estadísticas matemáticas.
Diferencia con la teoría de la probabilidad
Los métodos de las estadísticas matemáticas se cruzan estrechamente con la teoría de la probabilidad. Ambas ramas de las matemáticas se ocupan del estudio de numerosos fenómenos aleatorios. Las dos disciplinas están conectadas por teoremas de límite. Sin embargo, hay una gran diferencia entre estas ciencias. Si la teoría de la probabilidad determina las características de un proceso en el mundo real sobre la base de un modelo matemático, entonces la estadística matemática hace lo contrario: establece las propiedades del modelo parabasado en información observada.
Pasos
La aplicación de la estadística matemática sólo puede realizarse en relación con eventos o procesos aleatorios, o mejor dicho, con datos obtenidos al observarlos. Y esto sucede en varias etapas. Primero, los datos de los experimentos y los experimentos se someten a cierto procesamiento. Están ordenados para mayor claridad y facilidad de análisis. Luego se realiza una estimación exacta o aproximada de los parámetros requeridos del proceso aleatorio observado. Pueden ser:
- evaluación de la probabilidad de un evento (su probabilidad es inicialmente desconocida);
- estudiando el comportamiento de una función de distribución indefinida;
- estimación de expectativas;
- estimación de varianza
- etc.
La tercera etapa es la verificación de las hipótesis establecidas antes del análisis, es decir, obtener una respuesta a la pregunta de cómo los resultados de los experimentos se corresponden con los cálculos teóricos. De hecho, esta es la etapa principal de la estadística matemática. Un ejemplo sería considerar si el comportamiento de un proceso aleatorio observado está dentro de la distribución normal.
Población
Los conceptos básicos de las estadísticas matemáticas incluyen poblaciones generales y muestrales. Esta disciplina se ocupa del estudio de un conjunto de ciertos objetos con respecto a alguna propiedad. Un ejemplo es el trabajo de un taxista. Considere estas variables aleatorias:
- carga o número de clientes: por día, antes del almuerzo, después del almuerzo, …;
- tiempo medio de viaje;
- número de solicitudes entrantes o su vinculación a los distritos de la ciudad y mucho más.
También vale la pena señalar que es posible estudiar un conjunto de procesos aleatorios similares, que también serán una variable aleatoria que se puede observar.
Entonces, en los métodos de las estadísticas matemáticas, el conjunto completo de objetos bajo estudio o los resultados de varias observaciones que se llevan a cabo bajo las mismas condiciones en un objeto dado se denomina población general. En otras palabras, matemáticamente más estrictamente, es una variable aleatoria que se define en el espacio de los eventos elementales, con una clase de subconjuntos designados en ella, cuyos elementos tienen una probabilidad conocida.
Población de muestra
Hay casos en los que es imposible o poco práctico por alguna razón (costo, tiempo) realizar un estudio continuo para estudiar cada objeto. Por ejemplo, abrir cada frasco de mermelada sellada para verificar su calidad es una decisión dudosa, y tratar de estimar la trayectoria de cada molécula de aire en un metro cúbico es imposible. En tales casos, se utiliza el método de observación selectiva: se selecciona un cierto número de objetos (normalmente al azar) de la población general, y se someten a su análisis.
Estos conceptos pueden parecer complicados al principio. Por lo tanto, para comprender completamente el tema, debe estudiar el libro de texto de V. E. Gmurman "Teoría de la probabilidad y estadística matemática". Así, un conjunto muestral o muestra es una serie de objetos seleccionados al azar del conjunto general. En términos matemáticos estrictos, se trata de una secuencia de variables aleatorias independientes, uniformemente distribuidas, para cada una de las cuales la distribución coincide con la indicada para la variable aleatoria general.
Conceptos básicos
Consideremos brevemente otros conceptos básicos de las estadísticas matemáticas. El número de objetos en la población general o muestra se llama volumen. Los valores muestrales que se obtienen durante el experimento se denominan realización muestral. Para que una estimación de la población general basada en una muestra sea confiable, es importante contar con una muestra denominada representativa o representativa. Esto significa que la muestra debe representar completamente a la población. Esto solo se puede lograr si todos los elementos de la población tienen la misma probabilidad de estar en la muestra.
Las muestras distinguen entre devolución y no devolución. En el primer caso, en el contenido de la muestra, el elemento repetido se devuelve al conjunto general, en el segundo caso, no. Por lo general, en la práctica, se utiliza el muestreo sin reemplazos. También cabe señalar que el tamaño de la población general siempre supera significativamente el tamaño de la muestra. Existirmuchas opciones para el proceso de muestreo:
- simple: los elementos se seleccionan al azar uno a la vez;
- typed: la población general se divide en tipos y se elige de cada uno; un ejemplo es una encuesta de residentes: hombres y mujeres por separado;
- mecánico: por ejemplo, seleccione cada décimo elemento;
- serial: la selección se realiza en series de elementos.
Distribución estadística
Según Gmurman, la teoría de la probabilidad y la estadística matemática son disciplinas sumamente importantes en el mundo científico, especialmente en su parte práctica. Considere la distribución estadística de la muestra.
Supongamos que tenemos un grupo de estudiantes que fueron evaluados en matemáticas. Como resultado, tenemos un conjunto de estimaciones: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5: este es nuestro material estadístico principal.
En primer lugar, debemos ordenarlo o realizar una operación de clasificación: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5, y así obtener una serie variacional. El número de repeticiones de cada una de las evaluaciones se denomina frecuencia de evaluación y su relación con el tamaño de la muestra se denomina frecuencia relativa. Hagamos una tabla de la distribución estadística de la muestra, o simplemente una serie estadística:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
o
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Tengamos una variable aleatoria en la que realizaremos una serie de experimentos y veremos qué valor toma esta variable. Supongamos que tomó el valor a1 - m1 veces; a2 - m2 veces, etc. El tamaño de esta muestra será m1 + … + mk=m. El conjunto ai, donde i varía de 1 a k, es una serie estadística.
Distribución de intervalos
En el libro de VE Gmurman "Teoría de la probabilidad y estadística matemática" también se presenta una serie estadística de intervalos. Su compilación es posible cuando el valor de la característica en estudio es continuo en un cierto intervalo y la cantidad de valores es grande. Considere un grupo de estudiantes, o mejor dicho, su altura: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 estudiantes en total. Obviamente, la altura de una persona es un valor continuo. Necesitamos definir el paso del intervalo. Para ello se utiliza la fórmula de Sturges.
h= | máximo - mínimo | = | 190 - 156 | = | 33 | = | 5, 59 |
1+registro2m | 1+registro230 | 5, 9 |
Así, como tamaño del intervalo se puede tomar el valor de 6. También hay que decir que el valor 1+log2m es la fórmula paradeterminando el número de intervalos (por supuesto, con redondeo). Así, según las fórmulas, se obtienen 6 intervalos, cada uno de los cuales tiene un tamaño de 6. Y el primer valor del intervalo inicial será el número determinado por la fórmula: min - h / 2=156 - 6/2=153. Hagamos una tabla que contenga intervalos y el número de estudiantes cuyo crecimiento cayó dentro de cierto intervalo.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Por supuesto, esto no es todo, porque hay muchas más fórmulas en estadística matemática. Hemos considerado solo algunos conceptos básicos.
Horario de distribución
Los conceptos básicos de las estadísticas matemáticas también incluyen una representación gráfica de la distribución, que se distingue por su claridad. Hay dos tipos de gráficos: polígono e histograma. El primero se utiliza para una serie estadística discreta. Y para distribución continua, respectivamente, la segunda.