Академический Документы
Профессиональный Документы
Культура Документы
Los siete pilares son el principal soporte de la sabidura estadstica; no constituyen la sabidura
por s mismos. Se pueden rastrear al menos a la primera mitad del siglo XX, algunos hasta la
antigedad; se han probado a s mismos con el largo uso y sin embargo se adaptan a nuevos usos
cuando se necesita. Son la base de la ciencia de la estadstica, la original y an preeminente
ciencia de los datos; pueden entenderse como una taxonoma intelectual de dicha ciencia. Pueden
asociarse bien con otras ciencias de la informacin, tales como las ciencias de la computacin y
otras con nuevos nombres que an no han obtenido una identidad completa. Y sin embargo, estos
pilares son ideas radicales, peligrosas si se usan mal y capaces de despertar una respuesta
antagnica cuando invaden territorios desconocidos. Ninguno de ellos est pasado de moda, pero
an podemos preguntarnos si se requiere ms en la poca actual. Deberamos labrarnos un
octavo pilar? Y de ser as, con qu objetivo? Como una aproximacin estadstica a esta
pregunta, revisemos los datos, los siete pilares, para ver si nos sugieren una respuesta.
El tercero, la Verosimilitud, el uso de la probabilidad para calibrar las inferencias y darle una
escala a la medicin de la incertidumbre es a la vez especialmente peligroso y especialmente
valioso. Requiere mucho cuidado y entendimiento para su uso positivo, pero las recompensas son
igualmente grandes. El ms simple de tales usos es la prueba de significacin, donde los usos
engaosos han sido presentados como si fueran evidencia para condenar a toda la empresa en vez
de al uso particular. Su uso creciente durante el siglo pasado es testimonio de la necesidad de un
resumen calibrado de la evidencia a favor o en contra de una proposicin. El mal uso del sumario
puede confundir, pero eso no nos debe cegar a la mucho mayor a confundir con sumarios
verbales que carecen de siquiera una pequea inclinacin hacia un intento de calibracin con
respecto a un estndar generalmente aceptado. La verosimilitud puede no slo proveer una
medicin de nuestras conclusiones, puede ser una gua para los anlisis, para el mtodo de
agregacin y para la tasa con la que la informacin se acumula.
El cuarto, la Intercomparacin, nos entrega estndares internos y una forma de juzgar los
efectos y su significacin puramente al interior de los datos a mano. Es una espada de doble filo,
pues la falta de referencia a un estndar externo puede alejar a nuestras conclusiones de cualquier
relevancia. Cuando se emplea con cuidado e inteligencia, puede, junto con los diseos del sexto
pilar, entregar una ruta casi mgica al entendimiento en algunos entornos de muchas
dimensiones.
El pilar ltimo, el Residuo, es la comparacin lgica de modelos complejos como una ruta a la
exploracin de datos de muchas dimensiones, y el uso de la misma lgica cientfica en el anlisis
grfico. Es aqu que hoy en da encaramos la mayor necesidad, al encarar las cuestiones para las
que nosotros, despus de todos estos siglos, permanecemos menos capaces de proveer respuestas
amplias. Es aqu que podemos ver la necesidad potencial de un octavo pilar.
Con paquetes de datos cada vez ms grandes vienen ms preguntas que deben ser resueltas y
ms preocupacin respecto a que la flexibilidad inherente a la computacin moderna sobrepase
nuestra capacidad de calibrar, de juzgar la certeza de nuestras respuestas. Cuando podemos
limitar la atencin a pocas alternativas o a modelos paramtricos bien estructurados, nos sentimos
como en casa. Pero en muchas situaciones falta ese confort, o es ilusorio. Considrese, por
ejemplo, estos tres tipos de problemas: (1) la formulacin de predicciones o clasificadores datos
masivos, datos de muchos casos individuales con muchas medidas dimensionales en cada caso;
(2) problemas de grandes comparaciones mltiples, y (3) anlisis en casos donde las preguntas
enfocadas vienen como la etapa final de un estudio cientfico que era, al menos en parte,
exploratorio.
He identificado un lugar para el octavo pilar, pero no he dicho qu es. Es un rea donde un
nmero muy grande de procedimientos ha sido elaborado con respuestas parciales para algunas
preguntas especficas. El pilar puede existir, pero ninguna estructura general ha atrado an en
consenso general necesario para su reconocimiento. La historia sugiere que no aparecer con
facilidad ni en un paso. Cada ciencia viva tiene sus misterios: la astronoma, su energa oscura y
su materia oscura; la fsica, sus cuerdas y su teora cuntica; las ciencias de la computacin, su
acertijo P-NP; las matemticas, su hiptesis de Riemann. Los siete pilares existentes pueden
sostener al menos respuestas parciales incluso para los casos ms difciles. La estadstica es una
ciencia viva; el soporte de los siete es fuerte. Entramos a una era desafiante con aliados fuertes en
otros campos y grandes esperanzas de estar al nivel del reto.
Conclusin
1
Cox (1965).
2
Marshall (1885), pp. 167-168.
3
Borges ([1941] 1998), pp. 119-128.