1 Superintendencia Nacional de Aduanas y Administración Tributaria PERÚ Identificación de perfiles y diseño de Reglas de selección Junio 2012
2 Agenda de Presentación I.ELABORACIÓN DE PERFILES PARA DETECCIÓN DE INCIDENCIAS POR INFORMACIÓN DE ADUANAS OPERATIVAS. Normatividad Relacionada – Retroalimentación Obligatoria Forma y contenido de la retroalimentación Flujo para elaboración de un perfil Variables de perfiles más comunes. II.SISTEMA DE SELECCIÓN, REGLAS Y ELABORACIÓN DE PERFILES MEDIANTE TÉCNICAS DE MINERIA DE DATOS: Evolución del Sistema de Selección a Control Criterios de Selección y Herramientas de selección. Reglas para evaluación y consulta del canal de control por régimen aduanero Selección basada en modelos predictivos. Caso Practico: Elaboración de perfiles por la técnica de arboles de Clasificación.
3 “Si como consecuencia de las acciones de control y/o cambios en la normatividad legal las Unidades Orgánicas de la SUNAT, identifican patrones de comportamiento que permitan establecer indicadores y/o perfiles de riesgo que presuman la comisión de infracciones y/o incidencias, comunica este hecho a su jefe inmediato superior, quien luego de evaluar y validar el sustento, designa al funcionario responsable que formulará el documento electrónico tipo “Acción de Control y/o Mejora Preventiva del SGC” a través del Sistema de Gestión Documentaria (SIGED) dirigido a la jefatura de la DAR, emitido en forma confidencial, precisando la hipótesis de la infracción y/o incidencia, su modalidad de ocurrencia y los indicadores que lo explican o sustentan, según lo previsto en el Anexo de este procedimiento….” Elaboración de Perfiles por Información de Aduanas Operativas - Normatividad Según el numeral 1 del rubro VII.A.2 “Filtros de Múltiples Variables” del procedimiento IFGRA-PE.02: Selección a Control Aduanero
4 ¿Cuándo? Cuando producto de las acciones de control se identifiquen indicadores o perfiles de riesgo con los que se presuma la comisión de fraude que no están registrados en el icono ver riesgo (*) En general en las acciones de control previo (depósito o verificación de guías y DUAs verdes) Casos de presunto delito (falsificación) ¿Quién? El SIGED, es emitido por el funcionario aduanero designado por el jefe del área en la que se identifican los indicadores de riesgo. Es de tipo Confidencial Es dirigido al jefe de la División de Análisis de Riesgo de la IFGRA. Si no está la jefatura correspondiente emplear correo. Contenido Debe contener los siguientes datos Hipótesis de la infracción o incidencia Modalidad de ocurrencia Indicadores que sustentan la infracción y/o incidencia Observaciones adicionales (*) En importación en acotaciones superiores a 3000 USD/DUA Comunicar también selección inadecuada o ineficiente. Elaboración de Perfiles por Información de Aduanas Operativas – Forma y Contenido
5 Acción de Control y/o Mejora Correctiva del SGC.N° 00013 - 2011 - 3B1200-Division De Programación Fraude o Incidencia Modalidad Indicadores Elaboración de Perfiles por Información de Aduanas Operativas – Ejemplo de comunicación
6 Acción de Control y/o Mejora DAR evalúa Requerimiento ¿Hay otro Perfil o Filtro? Modifica r o dar de baja al FMV Identificar Indicadores de Riesgo Estimar Impacto en la selección Registrar FMV Previa autorización Jefe DAR Simular FMV Pase a Producción de FMV Evaluar Resultados de lo solicitado Responder Requerimiento Generada por: - Aduana Operativa - Gerencia de Inteligencia - Gerencia de Fiscalización Nuevo FMV Elaboración de Perfiles por Información de Aduanas Operativas – Flujo de Elaboración SI No FIN
7 Elaboración de Perfiles por Información de Aduanas Operativas – Variables más relevantes País_Orig País_AdqPto_Embar Estado Mcía Trat_Prefer Reg_Preced. Incidencia Tipo de Empresa Proveedor Ubigeo Ratio FOB/PN CIIU Segmento Monto Ajus_Valor FMV Desc_Mcia Num_Manif Variables Dependientes Partida Aranc. Variables Predictivas
8 2001 MMH (Discriminante lineal), reglas fijas; un canal por herramienta (excluyente) 2003 Perfiles o Filtros Multivariados (paramétrico) 2004 Red Neuronal (No paramétrico y no lineal) 2005-2009 Mejoras (alertas, selectividad) 2010 Nuevo Sistema de Selección (java) - NLGA Ejecuta selección en momento de invocación Implantación paramétrica de modelos y reglas obtenidos con algoritmos de minería de datos Selección canal, scanner y alerta – carga destinada y sin destinar Evolución del Sistema de Selección a Control SUNAT – Perú.
9 Criterios de Riesgo Basado en Predicción de Incidencias Históricas Análisis de Riesgos Potenciales Criterios Normativos Criterios Aleatorios Modelos Minería Datos Filtros Reglas de Jerarquía Selección No Selección % Aleatorio Control Selección No Selección Invocación Remite parámetros Matriz Selec- ción Módulo SISTEMA SELECCION Devuelve Acciones Control Comunicar/ Consulta 1 2 3 Sistema de Selección a Control Criterios y Herramientas de selección Esquema de Herramientas de Selección
10 Sistema de selección - Reglas para invocar (ejecutar) y/o mostrar el canal por régimen aduanero
11 Selección basada en Modelos Predictivos Data Histórica: Declaraciones Aduaneras de Mercancías Incidencias (Monto y frecuencia) Indicadores de Operadores (Fuentes Internas o Externas) Definir : Régimen Aduana, Fraude Sector Granula- ridad Preparación de los Datos (Atributos) Limpieza de datos, Segmentación, Construcción, Transformación y Tratamiento, Agregacion y Desagregación Definición de VARIABLE OBJETIVO TARGET ó Dependiente: 1: Con Incidencia ó 0: Sin Incidencia Monto Incidencia (UM) Evaluación del Modelo (Partición) Para Entrenamiento: Estima Parámetros (Coeficientes y relaciones entre variables) Para validación: Evaluar modelo en iteraciones de entrenamiento Para Testeo: Estimar desempeño de Modelo en casos nuevos (realidad) Comprensión de datos Extracción y Recopilación de Casos, Tabulación variables, Análisis Exploratorio Modelado de la Solución Elección de algoritmos en un software Obtención del Modelo (incluye variables) Criterio: Error mala clasificación (menor valor) Decisión para implantar Modelo: Buena Clasificación en Matriz de Confusión METODOLOGIA DE OBTENCION DE MODELOS DE MINERIA DE DATOS
12 Selección basada en Modelos Predictivos MATRIZ DE CONFUSION A un % de selección de la data total = a+b+c+d % Clasificación correcta modelo: (a+d)/(a+b+c+d)x100 % Eficiencia Modelo: d/(b+d)x100
13 CASO PRACTICO: Sector: Textiles SPN Nandina: 6110309000 Régimen: Importación para el Consumo Fraude o Incumplimiento: Subvaloración Impacto: Recaudación Momento: Control concurrente al Despacho Selección basada en Modelos Predictivos
14 CASO PRACTICO Extracción Data: Granularidad: Nivel de series de la DUA Periodo: Octubre 2009 a Setiembre 2010 Nivel Nacional: 680 DUAS, Control: 98.4%, Incidencia: 13.9%, Monto Incidencia: US$ 460,314 Movimiento, Control e Incidencias por Aduana Selección basada en Modelos Predictivos
15 CASO PRACTICO Análisis en la Aduana del Callao Criterios: Mayor movimiento en DUAS, alto nivel de control y bajo nivel de Incidencias en DUAS, alto impacto de Montos con Incidencia Objetivo: Evaluar Modelo que mejore probabilidad de ocurrencia liberando el control y mantenga al menos el impacto en los Montos Algoritmo para modelar: Arboles de Clasificación (Método CHAID) Variable Dependiente: Monto Incidencia (Tributos) en Serie DUA por Ajuste de Valor 15 Variables Independientes: Puerto de embarque, país de origen, país de adquisición, tipo de flete, seguro, FOB, Peso neto, valor unitario, dependiente, tipo de empresa, tamaño de empresa, CIIU, Ubigeo (lugar), estado de la empresa….. Selección basada en Modelos Predictivos
16 Resultados Nodos terminales: 27; Profundidad:3; 14 Nodos con Incidencia; 9 Variables predictoras Selección basada en Modelos Predictivos CASO PRACTICO Nodo 28: Mayor Prob. y Consecuencia 197 series de DUA con una Media de Incidencia de US$ 1751 (83.9% del total) Representa el 4.8% de las series totales Nodo 28
17 Resultados a nivel de DUA Nodos terminales: 27; Profundidad:3; 14 Nodos con Incidencia; Nodo 28 es más importante en Ocurrencia y Consecuencia; 9 Variables predictoras Selección basada en Modelos Predictivos CASO PRACTICO
18 Severo, Alto, Moderado, Significante, Muy Bajo Raro Medida de Riesgo Probabilidad y Consecuencia Selección basada en Modelos Predictivos CASO PRACTICO ModeradoCasi Certero Insignificante Extremo Medio Moderado Severo Muy bajo
19 CASO PRACTICO Manejo de Riesgos RiesgoNodoTratamiento Severo28100% F Moderado26100% F Medio38,20,39100% D Muy BajoLos demásNo implementar, Monitoreo Por consiguiente, la perfil para el nodo 28 será: “SPN = 6110309000, Peso Neto > 576.72 y Código de seguro (1) o (2), ds decir, con seguro global o poliza específica.” Selección basada en Modelos Predictivos
20 CASO PRACTICO Evaluación del Impacto en la Selección nuevos casos Se libera el control de 2.5% a 75.1% (Canal V) Facilitación CX: Reducción de Costos y Tiempos Se reduce control de 97.5.% a 24.9% Incidencias F se incrementa de 31.7% a 64.3% (Probabilidad) Incidencias D se incrementa de 13.8% a 43.8% (Probabilidad) Selección basada en Modelos Predictivos Los % a control reales son mayores por la concurrencia de otras herramientas
21 % Incidencia F Al 30 Set 39MMUs % DUAS F Facilitación CX Eficiencia Selección - GR % DUAS V Resultados del Sistema de Selección Contexto CX 2003 a 2010 CIF: 8,400 MMUS$ a 26,000 MMUS$ DUAS 315 M a 600 M
22 MUCHAS GRACIAS