Estadística en la Antártida

Mi nuevo libro de estadística cada día me trae una nueva anécdota. La de hoy tiene que ver con el agujero en la capa de ozono, localizado en la zona de la Antártida.

En estadística, se denomina outlier a las medidas extrañas, de frecuencia de aparición baja y cuyos valores divergen en gran medida de la mayoría de los datos recogidos. Es una práctica bastante habitual ignorar los outliers considerándolos como fallos del sistema de medida para poder construir modelos estadísticos más precisos y robustos.

Eso ocurrió en la Antártida. Cuando al tomar las habituales medidas de radiación incidente se encontraron valores altísimos y «sin sentido», se ignoraron durante años. Tardaron en descubrir que no había nada de erróneo en las mediciones, y que la causa de tan altos niveles de radiación era que el agujero de la capa de ozono había dejado de filtrarla.

¿Conclusión? Muchas veces nos podemos permitir ignorar los outliers, pero ¡cuidado! porque muchas otras van a ser la solución al problema.

Minería de Datos

Con la vista puesta en mi beca Repsol, estoy dedicando una pequeña parte del mes de agosto al libro de estadística The handbook of Data Mining.

Al principio me pareció un poquito denso (los primeros capítulos tienen demasiada carga histórica y filosófica) pero ya me está pareciendo más fluido. Hay que reconocer que empecé sin saber si quiera qué narices era la minería de datos, y está consiguiendo que no sólo me entere de lo básico sino que también vaya profundizando en conceptos más avanzados. Los ejemplos que utiliza son muy clarificadores y según avanzas vas moviéndote de la teoría pura y dura a la práctica.
Desgraciadamente esto no suma puntos en mi concesión o no de la beca, pero ya que he decidido hacer este proyecto independientemente del resultado; me está viniendo super bien para entrar en contacto con una parte de la ingeniería totalmente desconocida para mí