¿ Estamos seguros de que hemos utilizado la fuente de datos adecuada?.
Por absurdo que pueda parecer, en no pocos casos, el intercambio sucesivo de ficheros con diferentes versiones por correo electrónico con el cliente ha llevado a más de un error grave. Nuestro primer paso debería ser asegurarnos de que usamos la fuente de datos más actualizada y, por supuesto, validada por el cliente.
Otro hecho con el que nos hemos encontrado en ocasiones es que dicha fuente de datos, siendo la última versión, presenta errores. Un caso clásico es que el campo que alberga los resultados (variable dependiente a explicar) no tiene la información correcta porque en el proceso de creación de la misma se ha cometido un error.
¿ Podemos garantizar que la toma de datos es correcta?
Este punto es mucho más difícil de verificar, trataremos de exponerlo a través de un ejemplo. Supongamos que queremos establecer la relación entre la temperatura ambiente de una ciudad y el gasto en energía eléctrica en los hogares.
Nuestra primera impresión es que dicha relación existe: es lógico suponer que cuando las temperaturas son muy bajas o muy altas, se dispara el consumo de equipos de calefacción/aire acondicionado. Pero esta impresión debe ser confirmada con los datos.
Como es obvio, recurriremos a dos fuentes de datos:
a. Registro de temperatura ambiente
b. Datos de consumo eléctrico de los hogares
Nuestra preocupación en este caso pasaría por garantizar que los equipos de medida son correctos en ambos casos. Por ejemplo, no deberíamos tener en cuenta datos de termómetros como los que se pueden ver en postes publicitarios de muchas ciudades. Estas mediciones no son fiables, dado que los equipos de medida:
a. No han sido calibrados inicialmente.
b. No respetan los criterios estándar definidos para realizar mediciones de temperatura (a título orientativo, la temperatura nunca se mide al sol, sino a la sombra, entre otros criterios).Se muestra a continuación una comparativa entre la temperatura ambiente y la registrada en dichos termómetros en la ciudad de Sevilla (fuente ElTiempoSevilla.es).
c. No se revisan con la periodicidad establecida.
La alternativa en este caso pasaría por utilizar registros de estaciones meteorológicas de las Agencias de Meteorología oficiales. Todas estas estaciones de medida cuentan con criterios de validación de los registros y someten a sus equipos a calibraciones periódicas.