image_statistics_how_to_lie2Hace unos meses estuve curioseando sobre las temperaturas medias, máximas y mínimas de las ciudades costeras españolas para ver de establecer una relación con el turismo. Me asaltó la duda cuando estudiaba la llamada Costa Tropical, que ya saben es la costa de Granada (Motril, Salobreña, Almuñécar, La Herradura). Las temperaturas para Granada son las de la estación de toma de datos del aeropuerto de Granada, que está a 570 metros de altitud, y cuando comprobé que me daba una temperatura mínima extrema de -14,2º, bajo cero, para el mes de enero (16-1-87) comprendí que no me iba a servir, que nadie se iba a creer aquello de “Costa Tropical”. Así que llamé a la Agencia Estatal de Meteorología, desde donde amablemente me explicaron que efectivamente era el caso que en Granada los datos provinciales eran los de su aeropuerto, muy distintos de los de buena parte de la provincia. Pero que no había otros.

Es uno de los problemas de la Estadística, la falta de información. Se toma un dato puntual y, a falta de otros para construir las conclusiones, se utiliza la única información disponible, casi siempre sin avisar. Ya saben la historieta… “si yo me comí un pollo y usted ninguno… entonces nos comimos medio pollo cada uno…”

Luego, cuando me he ido metiendo en recovecos de Internet para obtener información variada con que sustentar mínimamente mis afirmaciones, me he encontrado a menudo con lagunas importantes que no parecen recibir mucha atención. Así por ejemplo la información que da el Servicio Público de Empleo Estatal sobre los nuevos contratos de trabajo y el cruce de esos datos con niveles de educación o renta o composición familiar es inexistente. Y ello en el ámbito del desempleo, cuyas consecuencias sociales y financieras son hoy de primera magnitud.

Pero cuando he estudiado el comercio del vino (que ya saben que son dos de mis debilidades, el comercio y el vino), o la exportación, la criminalidad, la educación, los accidentes o los precios de la vivienda –qué viviendas en qué sitios de qué tramos de precios, etc.- u otros múltiples sectores y negocios, a menudo he pensado que sufrimos de alguno de estos problemas:

• Parcialidad en la toma de datos (se manejan los datos que más interesan al resultado que interesa defender, como puede sospecharse en la intención de voto)

• Tamaño de la muestra y margen de error (como el clima al que cito aquí arriba)

• No se cruza y contrasta la información de forma suficiente (caso de los precios de la vivienda de que ya he hablado en otro post)

Aunque creo que la cuestión más importante a resolver, más que la calidad de nuestras estadísticas, es la falta de muchas de ellas. Hay mucha información. Y cada día Internet nos vuelca por la ventana un camión de nuevos datos, que para entenderlos hay que procesarlos y en los que la primera visión es a menudo la estadística. Por eso vengo escuchando que una de las profesiones con más futuro en la actualidad es la de estadístico, porque cada vez nos hará más falta tomar decisiones basadas en mayor cantidad de información.

Y por otro lado, hará falta que la gente entendamos las estadísticas y nos acostumbremos a exigirlas, manejarlas y cuestionarlas en su caso, a hacerlas parte de nuestra cultura y a intentar demostrar que, al fin y al cabo, Mark Twain estaba equivocado… Esta desde luego me la creo...