Artículos

Karl Pearson y la importancia de los datos

Con la tranquilidad que proporciona la distancia respecto al día concreto, me gustaría hacer algunas apreciaciones con respecto a los resultados del 9-N en Cataluña

| 5 Mar, 2015 | 4 minutos de lectura

Con la tranquilidad que proporciona la distancia respecto al día concreto, me gustaría hacer algunas apreciaciones con respecto a los resultados del 9-N en Cataluña. Tienen razón los que explican que lo ocurrido no fue un referéndum. También los que afirman que no tuvo las mínimas garantías para que los resultados fueran homologables.

Pero, lo que no se puede negar es que fue un éxito de movilización social. Los medios de comunicación social, en muchos casos, tampoco ayudaron mucho a leer adecuadamente la realidad social, ni sustentaron sus argumentos en datos específicos.

En este sentido, hace ya un tiempo, me cuestionaba en un artículo para abogados en The Lawyer si: Should Statistics be included in the Law’s degree? A esta pregunta, como es de sentido común, contestaba afirmativamente. De hecho, ya estamos en el tiempo que vaticinaba el escritor H.G. Wells cuando aseguraba: "Llegará el día en que el pensamiento estadístico será tan necesario para una ciudadanía eficiente como la habilidad de leer y escribir".

Viene entonces a colación recordar el valor que tuvo, para sus contemporáneos, el estadístico Karl Pearson, delfín del también estadístico Francis Galton quien desarrolló el modelo estadístico de regresión, y que, a su vez, era primo de Charles Darwin. Pues bien, Pearson se atrevió, por primera vez, a decirles a destacados economistas como Alfred Marshall o John Maynard Keynes: statistics on the table. Es decir, que sus teorías económicas requerían evidencias cuantitativas susceptibles de evaluación estadística.

El CIS podría calcular fácilmente el tamaño de la muestra necesaria para comprobar si las afirmaciones que se hicieron, en su momento, desde la Generalitat sobre el número de votantes eran acertadas. Porque convendría releer la realidad social en base a los datos y no a opiniones. El primer paso sería pedir a la Generalitat el “censo ad hoc que fue confeccionado a partir del DNI de los votantes. Como estará digitalizado, se comprobará si realmente fueron 2,3 millones, y al ordenarlo alfabéticamente se podrá observar si hay duplicados (los que votan más veces, si se da el caso)

El CIS confirmaría que, con los márgenes de error y de confianza habituales, la muestra, necesariamente aleatoria, debe estar en alrededor de 2.400. Entonces, se escoge un número al azar entre el 1 y los 2,3 millones de ese “censo, alfabéticamente ordenado. A partir de este número, se selecciona un votante cada 958 votantes (2300000/2400= 958) hasta completar los 2.400. Este procedimiento, que se conoce como aleatorio sistemático, tal como hizo Pearson en su momento, podría facilitar la argumentación a sociólogos, politólogos, periodistas y tertulianos, que a menudo muestran poco rigor científico y escaso manejo del conocimiento estadístico.

Además, sólo contactando a 2.400 personas se podría estimar la proporción de los que votaron una opción u otra. Aunque de esta muestra no se podrán hacer inferencias válidas sobre los catalanes, para leer la realidad social, la verdad, se necesitan más statistics on the table como aducía Pearson.