Estadísticas bayesianas

La estadística bayesiana es un enfoque matemático para calcular la probabilidad en el que las conclusiones son subjetivas y se actualizan a medida que se recopilan datos adicionales. Este enfoque puede contrastarse con las estadísticas clásicas o frecuentistas, en las que la probabilidad se calcula analizando la frecuencia de eventos aleatorios particulares en una serie larga de ensayos repetidos, y las conclusiones se consideran objetivas.

La inferencia estadística, en general, es el proceso de sacar conclusiones de un gran conjunto de datos mediante el análisis de conjuntos más pequeños de datos de muestra. Los científicos de datos bayesianos primero analizan los datos de muestra y extraen una conclusión. A esto se le llama inferencia previa. Luego, analizan otra muestra y revisan su conclusión. La conclusión revisada se llama inferencia posterior. El uso del conocimiento de eventos anteriores para predecir eventos futuros se conoce como lógica bayesiana.

La estadística bayesiana lleva el nombre de Thomas Bayes, un clérigo y matemático del siglo XVIII, que estaba interesado en la probabilidad como una forma de medir la creencia de uno en una determinada hipótesis. Aunque la teoría bayesiana tiene sus raíces en el siglo XVIII, el concepto tomó vuelo a mediados del siglo XX y se ha vuelto más popular en las últimas décadas para aplicaciones que incluyen la cría de animales en la década de 18, la medición de la educación en las décadas de 18 y 20, las estadísticas espaciales en los ochenta y el marketing y las ciencias políticas en los noventa.

Su enfoque iterativo permite a los científicos de datos hacer predicciones más precisas de lo que sería posible utilizando cualquiera de los conjuntos de datos por separado. Hoy en día, las estadísticas bayesianas juegan un papel importante en el aprendizaje automático debido a la flexibilidad que brinda a los científicos de datos que trabajan con big data. Los modelos y métodos bayesianos se utilizan en muchas industrias, incluida la previsión financiera, la previsión meteorológica, la investigación médica y la tecnología de la información (TI).