Sistema de detección de valores atípicos en datos del SERNAC
2020-08-27
Resumen
El propósito de este trabajo, es la creación de una herramienta que permita monitorear el flujo de reclamos que recibe SERNAC (SERvicio NAcional del Consumidor). El principal objetivo, es encontrar los sectores (mercados, industrias, empresas, productos, entre otros) que presentan un aumento o disminución en el número habitual de reclamos, para así poder dedicar de mejor manera los recursos con los que disponen y proteger de mejor manera los intereses de los consumidores. Un problema importante, fue tratar la base de datos que carecía de estandarización en el nombre y tipo de columnas, aunque no presentaba mayores datos faltantes en las variables de interés. La detección de un número atípico de reclamos, se realizó principalmente por medio del análisis de percentiles en base a diferentes métricas, especialmente diferenciaciones a distintos períodos de tiempo. Debido a la naturaleza de los datos, esta metodología simple pero robusta, presenta varias ventajas con respecto a otras opciones para la detección de outliers. El resultado es por un lado un visor interactivo que permite explorar los resultados y por otro lado, una serie de tablas resumen con las alertas encontradas. Al no contar con una variable que indique si una determinada observación es o no realmente atípica, la evaluación de la funcionalidad de esta herramienta se realizó por medio del juicio experto de los profesionales de SERNAC.
Palabras claves: reclamos, alerta, valores atípicos, anomalías, serie temporal.

Creative Commons License