En la jerarquía de la validación metrológica, el coeficiente de correlación ($R^2$) es un indicador necesario pero insuficiente; es, en el mejor de los casos, una medida de bondad de ajuste global que puede enmascarar deficiencias locales severas. La verdadera prueba de fuego para cualquier modelo de calibración reside en el análisis minucioso de sus residuos. Definido formalmente como la diferencia entre el valor observado y el valor predicho por la ecuación de regresión ($e_i = y_i - \hat{y}_i$), el residuo no es simplemente un "desecho" aritmético, sino el contenedor de toda la información que el modelo matemático no fue capaz de capturar o explicar.
La premisa fundamental de la regresión por Mínimos Cuadrados Ordinarios (OLS) es que el modelo determinista ($X\beta$) ha extraído la totalidad de la "señal" física sistemática contenida en los datos. Si esta premisa se cumple, lo único que debería quedar en el vector de residuos es "Ruido Blanco": una secuencia de valores puramente aleatoria, sin estructura, sin memoria y sin patrones discernibles, que obedece a una distribución Normal con media cero y varianza constante. Draper y Smith (1998) utilizan una analogía clínica potente: el examen de los residuos es equivalente al diagnóstico médico de un paciente; si el modelo está "sano", los residuos no deben mostrar síntomas de patología. La presencia de cualquier tendencia, ciclo o estructura geométrica en los residuos es una prueba irrefutable de que el modelo propuesto es inválido o incompleto, independientemente de cuán alto sea su $R^2$. Un residuo estructurado grita que hay física remanente que hemos ignorado.
Antes de proceder a pruebas estadísticas confirmatorias, la norma ISO 11095 recomienda encarecidamente el diagnóstico visual mediante el gráfico de residuos estandarizados frente a los valores predichos ($\hat{y}_i$). Este gráfico es el "electrocardiograma" de la calibración. En un modelo válido, los puntos deben distribuirse como una nube amorfa y horizontal alrededor de la línea cero, contenida mayoritariamente (aprox. 95%) entre las bandas de $\pm 2$ desviaciones estándar.