• Alertas SERNAC
  • Resumen
  • Prefacio
    • Estructura
    • Sobre esta herramienta
  • 1 Introducción
    • Objetivo general
    • Objetivos específicos
    • 1.1 Preparación/Instalación
    • 1.2 Consideraciones
  • 2 Homologación
    • 2.1 Variables de interés
      • 2.1.1 Marcar una columna como variable a utilizar
      • 2.1.2 Agregar una columna como variable a utilizar
      • 2.1.3 Resumen de variables
    • 2.2 Homologación en base a variables externas
      • 2.2.1 Motivos legales
      • 2.2.2 Códigos comunales
      • 2.2.3 Datos del SII
    • 2.3 Homologación en base a variables internas
    • 2.4 Ejemplo homologación R
    • 2.5 Análisis exploratorio
  • 3 Metodología
    • 3.1 Agrupación
      • 3.1.1 Ejemplo de agrupamiento en R
    • 3.2 Búsqueda de valores atípicos
      • 3.2.1 Cálculos previos
      • 3.2.2 Métricas
    • 3.3 Ranking
      • 3.3.1 Ranking por Número
      • 3.3.2 Ranking por Puntaje
      • 3.3.3 Ranking Mixto
    • 3.4 Anexo metodológico
      • 3.4.1 Cálculo del rango intercuantil
      • 3.4.2 Estandarización
  • 4 Interpretación
    • 4.1 Visor de resultados
      • 4.1.1 Pestaña ranking
      • 4.1.2 Pestaña detalle alertas
    • 4.2 Exportar información
  • 5 Scripts
    • 5.1 Cargas preliminares
    • 5.2 Versión 0.3 de la base de datos
      • 5.2.1 Homologación de la base de datos
      • 5.2.2 Ejecución alertas
    • 5.3 Versión 0.5 de la base de datos
      • 5.3.1 Homologación de la base de datos
      • 5.3.2 Ejecución alertas
    • 5.4 Exportar tablas
  • Consideraciones finales
  • Referencias
  • Generado con bookdown

Sistema de detección de valores atípicos en datos del SERNAC

2.4 Ejemplo homologación R

setwd("ruta a mi directorio") # reemplazar por la ruta propia
rm(list=ls())
library(SERNAC)
load("./DATA/dbf_v03.RData") # modificar por la ruta propia y el archivo apropiado

#-- Datos de homologacion
diccionario_columnas <- "homologacion_columnas.xlsx"
codigos_comunales <- "codigos_comunales.xlsx"
arbol_motivo_legal <- "arbol_de_mercado.xlsx"
datos_sii <- "compilado_2018.csv"

#-- Datos nuevos
db1 <- "DATA/2019/B_Reclamos_al_31122019_extraida_24022020_liviana.csv" # base de datos del 2019
db2 <- "DATA/2020/B_Reclamos_al_15062020_extraida_16062020_amplia.csv" # base de datos de lo que va del 2020

dbfM <- agregar_dbs(base=dbf, 
                    diccionario_columnas=diccionario_columnas,
                    codigos_comunales=codigos_comunales,
                    arbol_motivo_legal=arbol_motivo_legal,
                    datos_sii=datos_sii,
                    db1, db2)

Una salida del resultado del código anterior, puede ser encontrado en la figura 2.1, el cual a pesar de las advertencias que contiene, terminó sin incovenientes, y la base de datos se encuentra lista para ser analizada.

Resultado de un proceso de homologación exitoso.

Figura 2.1: Resultado de un proceso de homologación exitoso.