Distribución de Pearson: definición, aplicación

Tabla de contenido:

Distribución de Pearson: definición, aplicación
Distribución de Pearson: definición, aplicación
Anonim

¿Qué es la ley de distribución de Pearson? La respuesta a esta amplia pregunta no puede ser simple y concisa. El sistema Pearson se diseñó originalmente para modelar observaciones distorsionadas visibles. En ese momento, era bien sabido cómo ajustar un modelo teórico para que coincidiera con los dos primeros cumulantes o momentos de los datos observados: cualquier distribución de probabilidad se puede expandir directamente para formar un grupo de escalas de ubicación.

La hipótesis de Pearson sobre la distribución normal de los criterios

Excepto en casos patológicos, la escala de ubicación se puede hacer coincidir con la media observada (primer cumulante) y la varianza (segundo cumulante) de manera arbitraria. Sin embargo, no se sabía cómo construir distribuciones de probabilidad en las que la asimetría (tercer cumulante estandarizado) y la curtosis (cuarto cumulante estandarizado) pudieran controlarse con la misma libertad. Esta necesidad se hizo evidente al tratar de ajustar modelos teóricos conocidos a los datos observados.que mostró asimetría.

En el siguiente video puedes ver el análisis de la distribución chi de Pearson.

Image
Image

Historia

En su trabajo original, Pearson identificó cuatro tipos de distribuciones (numeradas del I al IV) además de la distribución normal (que originalmente se conocía como tipo V). La clasificación depende de si las distribuciones se apoyan en un intervalo limitado, en un semieje o en toda la línea real, y si eran potencialmente sesgadas o necesariamente simétricas.

Se corrigieron dos omisiones en el segundo artículo: redefinió la distribución tipo V (originalmente era solo la distribución normal, pero ahora con gamma inversa) e introdujo la distribución tipo VI. Juntos, los dos primeros artículos cubren los cinco tipos principales del sistema Pearson (I, III, IV, V y VI). En el tercer artículo, Pearson (1916) introdujo subtipos adicionales.

Funciones de distribución de Pearson
Funciones de distribución de Pearson

Mejorar el concepto

Rind inventó una forma sencilla de visualizar el espacio de parámetros del sistema de Pearson (o la distribución de criterios), que luego adoptó. Hoy en día, muchos matemáticos y estadísticos utilizan este método. Los tipos de distribuciones de Pearson se caracterizan por dos cantidades, generalmente llamadas β1 y β2. El primero es el cuadrado de la asimetría. El segundo es la curtosis tradicional, o el cuarto momento estandarizado: β2=γ2 + 3.

Los métodos matemáticos modernos definen la curtosis γ2 como cumulantes en lugar de momentos, por lo que para una curva normaldistribución tenemos γ2=0 y β2=3. Aquí vale la pena seguir el precedente histórico y usar β2. El diagrama de la derecha muestra de qué tipo es una distribución de Pearson en particular (indicada por el punto (β1, β2).

Estadísticas de Pearson
Estadísticas de Pearson

Muchas de las distribuciones sesgadas y/o no mesokúrticas que conocemos hoy en día aún no se conocían a principios de la década de 1890. Lo que ahora se conoce como distribución beta fue utilizado por Thomas Bayes como el parámetro posterior de la distribución de Bernoulli en su artículo de 1763 sobre la probabilidad inversa.

La distribución beta s altó a la fama debido a su presencia en el sistema de Pearson y fue conocida hasta la década de 1940 como la distribución de tipo I de Pearson. La distribución Tipo II es un caso especial del Tipo I, pero por lo general ya no se destaca.

La distribución Gamma se originó a partir de su propio trabajo y se conocía como Distribución Normal Tipo III de Pearson antes de adquirir su nombre moderno en las décadas de 1930 y 1940. Un artículo de 1895 de un científico presentó la distribución Tipo IV, que contiene la distribución t de Student, como un caso especial, anterior al uso posterior de William Seely Gosset por varios años. Su artículo de 1901 presentó una distribución con primos gamma inversos (tipo V) y beta (tipo VI).

Otra opinión

Según Ord, Pearson desarrolló la forma básica de la ecuación (1) basada en la fórmula para la derivada del logaritmo de la función de densidad de distribución normal (que da una división lineal por la función cuadráticaestructura). Muchos especialistas todavía se dedican a probar la hipótesis sobre la distribución de los criterios de Pearson. Y demuestra su eficacia.

Distribución alternativa de Pearson
Distribución alternativa de Pearson

Quién fue Karl Pearson

Karl Pearson fue un matemático y bioestadístico inglés. Se le atribuye la creación de la disciplina de la estadística matemática. En 1911 fundó el primer departamento de estadística del mundo en el University College London e hizo importantes contribuciones a los campos de la biometría y la meteorología. Pearson también fue partidario del darwinismo social y la eugenesia. Fue el protegido y biógrafo de Sir Francis G alton.

Biometría

Karl Pearson jugó un papel decisivo en la creación de la escuela de biometría, que era una teoría en competencia para describir la evolución y la herencia de las poblaciones a principios del siglo XX. Su serie de dieciocho artículos "Contribuciones matemáticas a la teoría de la evolución" lo estableció como el fundador de la escuela biométrica de la herencia. De hecho, Pearson dedicó gran parte de su tiempo durante 1893-1904 a desarrollo de métodos estadísticos para la biometría. Estos métodos, que se utilizan ampliamente en la actualidad para el análisis estadístico, incluyen la prueba de chi-cuadrado, la desviación estándar, la correlación y los coeficientes de regresión.

Coeficiente de correlación de Pearson
Coeficiente de correlación de Pearson

La cuestión de la herencia

La ley de herencia de Pearson establece que el germoplasma consta de elementos heredados de los padres, así como de ancestros más lejanos, cuya proporción variaba según diversas características. Karl Pearson era seguidor de G alton, y aunque suobras diferían en algunos aspectos, Pearson utilizó una cantidad significativa de los conceptos estadísticos de su maestro al formular una escuela biométrica para la herencia, como la ley de regresión.

distribución Pearson
distribución Pearson

Características de la escuela

La escuela biométrica, a diferencia de los mendelianos, no se centró en proporcionar un mecanismo para la herencia, sino en proporcionar una descripción matemática que no fuera de naturaleza causal. Si bien G alton propuso una teoría discontinua de la evolución en la que las especies cambiarían a grandes s altos en lugar de pequeños cambios que se acumularan con el tiempo, Pearson señaló fallas en este argumento y, de hecho, usó sus ideas para desarrollar una teoría continua de la evolución. Los mendelianos preferían la teoría discontinua de la evolución.

Mientras que G alton se centró principalmente en la aplicación de métodos estadísticos al estudio de la herencia, Pearson y su colega Weldon ampliaron su razonamiento en esta área, la variación, las correlaciones de la selección natural y sexual.

Distribución típica
Distribución típica

Una mirada a la evolución

Para Pearson, la teoría de la evolución no pretendía identificar el mecanismo biológico que explica los patrones de herencia, mientras que el enfoque mendeliano declaraba que el gen era el mecanismo de herencia.

Pearson criticó a Bateson ya otros biólogos por no adoptar métodos biométricos en su estudio de la evolución. Condenó a los científicos que no se centraron envalidez estadística de sus teorías, afirmando:

"Antes de que podamos aceptar [cualquier causa de cambio progresivo] como un factor, no solo debemos mostrar su plausibilidad, sino, si es posible, demostrar su capacidad cuantitativa".

Los biólogos han sucumbido a "especulaciones casi metafísicas sobre las causas de la herencia" que han reemplazado el proceso de recopilación de datos experimentales, lo que en realidad puede permitir a los científicos reducir las posibles teorías.

puente estadístico
puente estadístico

Leyes de la naturaleza

Para Pearson, las leyes de la naturaleza eran útiles para hacer predicciones precisas y resumir tendencias en los datos observados. La razón fue la experiencia de "que cierta secuencia sucedió y se repitió en el pasado".

Por lo tanto, identificar un mecanismo particular de la genética no ha sido un esfuerzo valioso para los biólogos, quienes en su lugar deberían centrarse en las descripciones matemáticas de los datos empíricos. Esto condujo en parte a una amarga disputa entre biometristas y mendelianos, incluido Bateson.

Después de que este último rechazara uno de los manuscritos de Pearson que describía una nueva teoría de la variación de la descendencia u homotipia, Pearson y Weldon fundaron la empresa Biometrika en 1902. Aunque el enfoque biométrico de la herencia finalmente perdió su perspectiva mendeliana, los métodos que desarrollaron en ese momento son vitales para el estudio de la biología y la evolución en la actualidad.

Recomendado: