1 Analytics: 20 Años ± 4 siglos 1990s: CRISP-DM, Machine Learning 2000s: SEMMA, Decision Support 2010s: Business Case, Big Data Ciencias de la Administración 6sigma / Mejora Continua Investigación de Operaciones Investigación de Mercado Operaciones en 2da Guerra Mundial Estadística industrial Decisiones gubernamentales Método científico Juegos de azar
2 Hoy, una oficina de analytics… Contrata: Director, gerente MBAs, DBAs, OR Analistas, Actuarios, MatAp, Com Sci Programadores DB Generadores de valor: Plataforma (Red + DB + ML) Operaciones (Casos de negocio) Destreza (Entrenamiento + Disposición)
3
4 http://science.sciencemag.org/content/349/6251/aac4716.full p-values cuestionados American Psychology Association La industria veloz sobre-usó una métrica de significado difuso. p-value
5 Análisis genético poblacional Efecto de tratamientos Prescripciones óptimas Análisis personalizado Prescripción personalizada Análisis
6 Análisis genético poblacional Efecto de tratamientos Prescripciones óptimas Análisis personalizado Prescripción personalizada Análisis Irrepetible http://www.cbsnews.com/news/deception-at-duke-fraud-in-cancer-care/
7 He visto …
8 Modelos útiles Interpretación geométrica Aplicabilidad Simulación de recomendaciones
9 { } En el espacio de atributos, clasificar es hallar las fronteras de decisión. Es una simplificación que pierde detalle. Pero nos permite automatizar la acción conveniente. simular anticipar
10 Tres clases artificialmente distribuidas en tres centros separados
11 Linear Discriminant Analysis
12 Quadratic Discriminant Analysis
13 Quadratic Discriminant Analysis (Mayor incertidumbre)
14 Regresión Logística
15 Árbol de Clasificación
16 Nearest Neighbour (1 voto)
17 Nearest Neighbour (3 votos)
18 Red Neuronal 2 Neuronas de salida
19 Red Neuronal Promediada
20
21 Árbol de Clasificación
22 Paquete R usado: MASS
23 Paquete R usado: e1071
24 Tres deberes para el analista Los datos deben representar los hechos. Los modelos deben hallar oportunidades. Se debe respaldar cada acción recomendada. Ejercicios: http://ipe.mx/ejercicio01.R http://ipe.mx/ejercicio02.R http://ipe.mx/ejercicio03.R
25 © Octavio Ocampo http://es.slideshare.net/enquica/pinturas-con-doble-imagen ¿Cómo se refleja la vida real en la “vida digital”? En tiendas-internet, el registro es la transacción. ¿Cuánto de la vida real queda en los registros? Los datos representan hechos
26 Modelos en el espacio de atributos Algunas regiones representan una oportunidad de actuar. Se aprende del pasado, o de mediciones costosas. (Predicciones, observabilidad.) Se acepta una “calidad” estadística en las afirmaciones.
27 Decisión Acción ¿Control? ¿Capacidad? ¿Oportuna? ¿Viabilidad? ¿Auditabilidad? ¿Lazo cerrado?
28 Ejercicios Clustering Red neuronal Text Mining