3.2 Búsqueda de valores atípicos
3.2.1 Cálculos previos
- Sobre los datos anteriormente agrupados:
- El usuario define en que ventanas temporales (desfase o lags) desea buscar valores anómalos.
- El usuario define el rango intercuantil (por defecto, el percentil 25 y 75) y el coeficiente de búsqueda (por defecto, 1.5).
- El usuario define el número mínimo de observaciones en el periodo a considerar. Por defecto, un mínimo de 50 reclamos en todo el periodo de análisis.
- El usuario define el período de búsqueda, entre que fechas se harán los análisis.
- Se calcula para el número de reclamos (
N
) la diferencia con respecto a otros períodos de tiempo (definidos por los desfases). En el caso mensual, se calcula la diferencia en reclamos con respecto al o los meses anteriores definidos (si se por ejemplo, se solicitan los lags 1 y 2, se calcula la diferencia enN
con respecto al mes anterior y transanterior). - La proporción de reclamos acogidos y el tiempo de respuesta del proveedor, no son sometidos a la diferenciación del paso anterior.
- En total, el número de variables a monitorear aumentar según el número de desfases que define el usuario.
Por ejemplo, si no consideramos el tiempo de respuesta del proveedor y fijamos como desfases de interés de 1 a 6 meses, se termina con las siguientes variables:
- proporción de reclamos acogidos (
prop_acogidos
), - número de reclamos (
N
), - y la diferenciación en el número de reclamos a 1, 2, 3, 4, 5 y 6 meses (
d1N
,d2N
,d3N
,d4N
,d5N
yd6N
).
3.2.2 Métricas
- Los datos son estandarizados (para poder comparar agrupaciones, con sus respectivas agrupaciones basales; ver 3.4.2 para más detalles).
- Para cada una de las variables se buscan los percentiles definidos, en este caso \(Q.(25)\) y \(Q.(75)\).
- Se calculan los límites superior e inferior con respecto al rango intercuantil (ver 3.4.1 para más detalles).
- Se buscan y marcan las observaciones que sobrepasan estos límites superior (ascendente) e inferior (descendente).