BASES DE DATOS DATAWAREHOUSE BALANCED SCORECARD

1 BASES DE DATOS DATAWAREHOUSE BALANCED SCORECARD71.45 In...
Author: Sofia Castilla Silva
0 downloads 1 Views

1 BASES DE DATOS DATAWAREHOUSE BALANCED SCORECARD71.45 Informática para la Gestión de la Empresa BASES DE DATOS DATAWAREHOUSE BALANCED SCORECARD

2 Elementos caracterizadores del ConocimientoDATOS INFORMACION INTELIGENCIA APRENDIZAJE CONOCIMIENTO Se genera a partir de datos seleccionados, organizados y procesados de acuerdo a criterios preestablecidos. La existencia de criterios dota de significado y de intencionalidad a la información resultante, con el objetivo de modificar alguna percepción de los receptores de la misma Es una entidad específicamente humana y no materializable en ningún tipo de soporte Es el proceso mediante el cual se adquiere el conocimiento son la representación más o menos aislada de elementos abstraídos de la realidad a partir de los modelos mentales de un individuo o conjunto de ellos La capacidad de plantear y resolver problemas de forma no rutinaria

3 Conocimiento ExplicitoTipos de Conocimiento Formulas Ecuaciones Reglas Libros Bases de datos Textos Modelos Patrones mentales Percepciones Introspecciones Experiencia Know how Conocimiento Tacito Conocimiento Explicito Mejores practicas Procedimientos y Politicas Productos Maquinas Disenos Prototipos Capacidades Artesania Creencias Valores Empaquetable Comunicable Transferible Puede ser expresado en lenguaje formal Personal Especifico a contexto Dificil de formalizar Dificil de comunicar Mas dificil de transferir

4 DEFINICIONES Una base de datos está constituida por cierto conjunto de datos persistentes utilizado por los sistemas de aplicaciones de una empresa determinada. (Introducción a los S.G.B.D. – C.J.Date – Editorial Pearson ) Una base de datos es un conjunto de informaciones sobre un tema determinado, exhaustivo, no redundante y estructurado. (Técnicas avanzadas para las BD. – Daniel Martín – Editorial Omega) Una base de datos es un conjunto de datos relacionados entre sí. (Introducción a los S.G.B.D. – Universidad del Comahue)

5 Características de la informaciónen las BD Integrada: unificación de varios archivos de datos que eliminan cualquier redundancia Compartida: es usada por usuarios distintos Persistente: que perdura en el tiempo (datos entrada, datos salida)

6 SGBD o DBMS Un sistema de software que permite a sus usuarios crear, mantener y controlar el acceso a una base de datos. (Connolly & Begg)

7 SGBD o DBMS Aplicaciones tradicionalesInventario Reservas Compras Seguimiento Logística Transporte Educación Estadísticas Bancos Adm. Clientes Bibliotecas Campus global Etc.

8 Tipos de DBMS Según modelo de datos Según número de usuariosSistemas gestores de datos relacionales Sistemas gestores de datos orientados a objetos Sistemas gestores de datos objeto-relacionales Según número de usuarios Monousuario Multiusuario Según número de sitios Centralizado Distribuido

9 Modelo general Cliente-servidor Otras arquitecturasServidor: gestiona la base de datos Cliente: permite enviar comandos al servidor Otras arquitecturas Múltiples capas para llegar al servidor Distribuída Paralela etc.

10 Arquitectura general (Modelo ISO)Nivel Externo Nivel Conceptual Abstracción Nivel Físico

11 Nivel Interno Descripción de la organización física de los datos: estructuras de datos en disco y rutas de acceso. Estructura física de almacenamiento Todos los detalles de cómo el DBMS utiliza el disco duro la memoria, etc. Tema principal El sistema debe ser rápido en responder y eficiente en el uso de espacio Administrador de la base de datos

12 Nivel Conceptual Descripción de la estructura lógica de la base de datos completa (ej.: a través de diagramas entidad-relación). Se omiten los detalles del almacenamiento físico. Estructura lógica de almacenamiento Diseño conceptual de la base de datos Tablas, columnas, etc. Tema principal El diseño debe reflejar conceptualmente el problema a modelar Administradores de datos

13 Nivel Externo Descripción de la estructura lógica de una parte de la base de datos que es de interés a un grupo particular. Vistas sobre las tablas Requiere sólo acceso parcial a los datos Público objetivo Desarrolladores de aplicaciones Usuarios finales Tema principal Cada vista debe reflejar adecuadamente la parte de los datos que interesa a cada uno

14 Servicios de un SGBD Permite la definición de la base de datos (datos, reglas de integridad, ) mediante el lenguaje de definición de datos (LDD). Permite la inserción, actualización, eliminación y consulta de datos mediante el lenguaje de manejo de datos (LMD). Hay dos tipos de lenguajes de manejo de datos: Procedurales. No procedurales (SQL). Proporciona un acceso controlado a la base de datos mediante: Un sistema de seguridad. Un sistema de integridad. Un sistema de control de concurrencia. Un sistema que garantice el procesamiento de las transacciones.

15 Servicios de un SGBD

16 Situación Real La cadena de Video Club El brujo videófilo ha decidido, para mejorar su servicio, emplear una base de datos para almacenar la información referente a las películas que ofrece en alquiler. Esta información es la siguiente: Una película se caracteriza por su título, nacionalidad, productora y fecha. – Quo Vadis, Estados Unidos, MGM, 1955 – Star Wars, Estados Unidos, Fox Studio, 1977 • En una película pueden participar varios actores (nombre, nacionalidad, sexo), algunos de ellos como actores principales

17 Situación Real Una película está dirigida por un director, del cual quiere almacenarse su nombre y nacionalidad. • De cada película se dispone de uno o varios ejemplares, diferenciados por un número de ejemplar y caracterizados por su estado de conservación Un ejemplar se puede encontrar alquilado a algún cliente. Se desea almacenar la fecha de comienzo del alquiler y la de devolución.

18 Situación Real Una película está dirigida por un director, del cual quiere almacenarse su nombre y nacionalidad. • De cada película se dispone de uno o varios ejemplares, diferenciados por un número de ejemplar y caracterizados por su estado de conservación Un ejemplar se puede encontrar alquilado a algún cliente. Se desea almacenar la fecha de comienzo del alquiler y la de devolución.

19 Situación Real • De cada cliente se identifica el nombre, la dirección y el teléfono. • Cada socio puede alquilar como máximo 4 ejemplares. Un socio tiene que ser avalado por otro socio, que responda de él en caso de tener problemas en el alquiler.

20 Diagrama Entidad - Relación

21 Diagrama Entidad - RelaciónApellido Año Actúa Película Actor Nombre Título Id_Pelic Id_Actor Produce Empresa Estudio Id_Estu

22 Diagrama Entidad - RelaciónPelícula Estudio Id_Pel Título Año 1 La guerra de las galaxias 1977 2 El señor de los anillos I 2001 3 Mar Adentro 2004 4 El viaje de Chihiro Id_Est Empresa 1 Ghibli 2 New Line Cinema 3 LucasFilm 4 Sogecine Actúa Produce Actor Id_Actor Id_Pel 1 2 3 4 Id_Pel Id_Est 1 3 2 4 Id_Actor Apellido Nombre 1 Hamill Mark 2 Lee Christopher 3 Bardem Javier 4 Weaving Hugo

23 Diagrama Pata de Cuervo

24 FORMAS NORMALES 1FN: Eliminar los grupos repetidos de datos (isomorfa)2FN: Verificar que todos los datos dependen de la clave en las filas cuyas claves se basen en más de una columna 3FN: Eliminar todas las dependencias transitivas 4FN: Requiere que las entidades de datos independientes no se almacenen en la misma tabla si existen relaciones varios a varios entre ellas. 5FN: Requiere que sea posible reconstruir la tabla original a partir de las tablas resultantes del proceso de norma lización

25 Primera forma normal No hay orden de arriba-a-abajo en las filas.No hay orden de izquierda-a-derecha en las columnas. No hay filas duplicadas. Cada intersección de fila-y-columna contiene exactamente un valor del dominio aplicable (y nada más). Todas las columnas son regulares [es decir, las filas no tienen componentes como IDs de fila, IDs de objeto, o timestamps ocultos]. Id_Cli Nom_Apel Tel 1 Juan Perez 2 Claudio Ramirez 3 Ramiro tuco /

26 Segunda forma normal Si dada cualquier clave candidata y cualquier atributo que no sea un constituyente de la clave candidata, el atributo no clave depende de toda la clave candidata en vez de solo una parte de ella Asociado Deporte Domicilio J.M. del Barco Tenis Callao CABA U.M.García Futbol H.Yrigoyen ° - CABA M. Pallerco Caseros 2390 – CABA Ciclismo Caseros CABA

27 Tercera forma normal Si cada atributo que no forma parte de ninguna clave, depende directamente y no transitivamente, de la clave primaria Torneo Año Ganador Nacimiento U.S. Open 2008 Roger Federer 8 de agosto de 1981 Australian Open 2009 Rafael Nadal 3 de junio de 1986 Roland Garros Wimbledon Juan Martín del Potro 23 de septiembre de 1988

28 Instalación del SGBD MySQL

29 Instalación del SGBD MySQL

30 Instalación del SGBD MySQL

31 Instalación del SGBD MySQL

32 Instalación del SGBD MySQL

33 Instalación del SGBD MySQL

34 Instalación del SGBD MySQL

35 Instalación del SGBD MySQL

36 Instalación del SGBD MySQL

37 Instalación del SGBD MySQL

38 Instalación del SGBD MySQL

39 DATAWAREHOUSE

40 Definiciones - Bill Inmon“Un warehouse es una colección de datos subject- oriented, integrated, time-variant y non-volatile para ayudar al proceso de toma de decisiones gerenciales” Subject-Oriented: datos que brindan información sobre un “sujeto” del negocio en particular, en lugar de concentrarse en la dinámica de las transacciones de la organización. Integrated: los datos con los que se nutre el data warehouse vienen de diferentes fuentes y son integrados para dar una visión de un “todo” coherente. Time-variant: todos los datos en el data warehouse son asociados con un período de tiempo específico. Non-Volatile: los datos son estables en el data warehouse. Más datos son agregados pero los datos existentes no son removidos.

41 Definiciones - Ralph Kimball“Un warehouse es una copia de los datos transaccionales específicamente estructurados para consultas y análisis”

42 Proceso de desarrollo de un DWHSe comienza con una matriz donde se determina la dimensionalidad de cada indicador y luego se especifican los diferentes grados de detalle (atributos) dentro de cada concepto del negocio (dimensión), como así también la granularidad de cada indicador (variable o métrica) y las diferentes jerarquías que dan forma al modelo dimensional del negocio (BDM) o mapa dimensional. Se focaliza sobre recursos, perfiles, tareas, duraciones y secuencialidad. El plan de proyecto resultante identifica todas las tareas asociadas con el BDL e identifica las partes involucradas. Los diseñadores de los data warehouses deben entender los factores claves que guían al negocio para determinar efectivamente los requerimientos y traducirlos en consideraciones de diseño apropiadas.

43 Proceso de desarrollo de un DWHSe focaliza sobre la selección de las estructuras necesarias para soportar el diseño lógico. Algunos de los elementos principales de este proceso son la definición de convenciones estándares de nombres y seteos específicos del ambiente de la base de datos. La indexación y las estrategias de particionamiento son también determinadas en esta etapa.

44 Proceso de desarrollo de un DWHPlan: 1. Crear un diagrama de flujo fuente-destino esquemático, de una página y de muy alto nivel. 2. Probar, elegir e implementar una herramienta de data staging. 3. Profundizar en detalle por tabla destino, gráficamente describir las reestructuraciones o transformaciones complejas. Gráficamente ilustrar la generación de las claves surrogadas. Desarrollo preliminar de la secuencialidad de los trabajos.

45 Proceso de desarrollo de un DWHCarga de dimensiones: 4. Construir y probar la carga de una tabla dimensional estática. La principal meta de este paso es resolver los problemas de infraestructura que pudieran surgir (conectividad, transferencia, seguridad, etc.) 5. Construir y probar los procesos de actualización de una dimensión. 6. Construir y probar las cargas de las restantes dimensiones. Fact Tables y automatización: 7. Construir y probar la carga histórica de las fact tables (carga masiva de datos). Incluyendo búsqueda y sustitución de claves. 8. Construir y probar los procesos de cargas incrementales. 9. Construir y probar la generación de agregaciones. 10. Diseñar, construir y probar la automatización de los procesos.

46 Proceso de desarrollo de un DWHSe debe tener en cuenta tres factores: los requerimientos del negocio, los actuales ambientes técnicos y las directrices técnicas estratégicas futuras planificadas. De esta forma poder establecer el diseño de la arquitectura técnica del ambiente de data warehousing

47 Proceso de desarrollo de un DWHUtilizando el diseño de arquitectura técnica como marco, es necesario evaluar y seleccionar componentes específicos de la arquitectura como ser la plataforma de hardware, el motor de base de datos, la herramienta de ETL o el desarrollo pertinente, herramientas de acceso, etc.

48 Proceso de desarrollo de un DWHLos diferentes roles o perfiles de usuarios determinan la interfase o ventana al warehouse. Herramientas de diseño de reportes y consultas avanzadas para analistas, tableros de control para gerentes, acceso mediante inter/intra net para usuarios internos/externos remotos, envío de información por dispositivos no estándares para usuarios internos/externos, etc.

49 Proceso de desarrollo de un DWHUna vez que se ha cumplido con todos los pasos de la especificación y se tiene la posiblidad de trabajar con algunos datos de prueba, comienza el desarrollo de la aplicación Selección de un enfoque de implementación Desarrollo de la aplicación Prueba y verificación de datos Documentación y Roll Out Mantenimiento

50 Proceso de desarrollo de un DWHLectura de la transparencia. Como se sabe una de las soluciones fue Oracle, que ya no hablarán la semana que viene y Visión un producto de referenciación de datos La implementación representa la convergencia de la tecnología, los datos y las aplicaciones de usuarios finales accesible desde el escritorio del usuario del negocio. Hay varios factores extras que aseguran el correcto funcionamiento de todas estas piezas, entre ellos se encuentran la capacitación, el soporte técnico, la comunicación, las estrategias de feedback.

51 Proceso de desarrollo de un DWHUna vez que se ha construido e implantado el data warehouse no hay tiempo para el descanso, rápidamente debemos estar preparados para administrar el mantenimiento y crecimiento del mismo. Si bien las tareas pueden llegar a parecer similares a las tratadas en otras etapas del BDL, existe una diferencia clave: los usuarios están ahora accediendo al warehouse. Lectura de la transparencia. Como se sabe una de las soluciones fue Oracle, que ya no hablarán la semana que viene y Visión un producto de referenciación de datos

52 Proceso de desarrollo de un DWHLectura de la transparencia. Como se sabe una de las soluciones fue Oracle, que ya no hablarán la semana que viene y Visión un producto de referenciación de datos El gerenciamiento del proyecto asegura que las actividades del BDL se lleven en forma y sincronizadas. Como lo indica el diagrama, el gerenciamiento acompaña todo el ciclo de vida. Entre sus actividades principales se encuentra el monitoreo del estado del proyecto y la comunicación entre los requerimientos del negocio y las restricciones de información para poder manejar correctamente las expectativas en ambos sentidos.

53 Arquitectura de un DWH Lectura de la transparencia. Como se sabe una de las soluciones fue Oracle, que ya no hablarán la semana que viene y Visión un producto de referenciación de datos

54 OLTP vs. OLAP: ObjetivosAsistir a aplicaciones específicas y mantener integridad de los datos Asistir en el análisis del negocio, identificando tendencias, comparando períodos, gestiones, mercados, índices, etc. mediante el almacenamiento de datos históricos

55 OLTP vs. OLAP: Alineación de los datosPor aplicación. Cada una tiene distintos tipos de datos Por dimensión. Los datos integrados en un solo sistema.

56 OLTP vs. OLAP: Integración de los datosTípicamente no integrados, son calificados como datos primitivos o datos operacionales Deben estar integrados. Son conocidos como datos derivados o datos DSS.

57 Retienen datos para 60 a 90 días, después son resguardados por losOLTP vs. OLAP: Historia Retienen datos para 60 a 90 días, después son resguardados por los administradores de base de datos en almacenamientos secundarios fuera de línea Almacenan tanta historia como sea necesario para el análisis del negocio, típicamente dos a cinco años de datos históricos

58 OLTP vs. OLAP: Acceso y manipulaciónRealizan una manipulación de datos registro por registro con grandes cantidades de inserts, updates y deletes. Además necesitan de rutinas de validación y transacciones a nivel registro Carga y acceso masivo de datos, no se realizan inserts, updates o deletes. La carga y refresco es batch (lo que se conoce como proceso BULK COPY). La validación de datos se realiza antes o después de la carga.

59 OLTP vs. OLAP: Patrones de uso Constante requiriendograndes cantidades de recursos y consumiendo sólo el tiempo referido a la transacción Uso liviano con picos de usos eventuales en el tiempo (afectados por la disponibilidad de los datos y el flujo de trabajo del negocio)

60 OLTP vs. OLAP: Granularidad de los datosNivel detallado o nivel transaccional. Una transacción incluye a nivel atómico cada uno de los componentes de su estructura Información sumarizada hasta cierto nivel

61 OLTP vs. OLAP: Perfil del usuarioEmpleados operacionales de una organización Comunidad gerencial, la cual esta a cargo de la toma de decisiones.

62 OLTP vs. OLAP: Perfil del usuarioSDLC (Ciclo de vida del desarrollo de sistemas Guiado por los requerimientos CLDS (Cycle Lyfe Development System) Guiado por los datos

63 Componentes básicos • Dimensiones (Dimensions)• Atributos (Attributes) Elementos (Attributes Elements) • Relaciones (Attribute Relationships) Jerarquías (Hierarchies) • Variables o Indicadores (Facts o Metrics)

64 Componentes básicos: DimensionesSon las áreas temáticas, líneas del negocio o sujetos del negocio. Las mismas proveen un método general para organizar la información corporativa. Definidas como un grupo de uno o más atributos, separados y distintos uno de otros (es decir, que no se comparten atributos), según el esquema de implementación elegido, puede ser que no se encuentren explícitamente en el data warehouse, sino que se presenten sólo como un recurso conceptual o lógico que ayuda a mostrar múltiples perspectivas de los datos permitiendo realizar análisis por diferentes dimensiones o incluso cruzando información entre distintas dimensiones

65 Componentes básicos: AtributosLos atributos son una agrupación de elementos o items dentro de una dimensión. Representan categorías o clases de elementos que tienen el mismo nivel lógico dentro de una dimensión donde todos los elementos de un atributo se relacionan con otros atributos de la dimensión de la misma forma. La finalidad de los atributos es ver la información de cada dimensión a diferentes niveles de detalle y agrupar los datos para ser analizados.

66 Componentes básicos: ElementosSon las instancias o valores de los atributos que, como componentes atómicos del modelo, permiten clasificar el rendimiento del negocio. Es importante aclarar que si bien no forman parte del BDM es aconsejable su incorporación para un mayor entendimiento del modelo en etapas tempranas del ciclo de vida (relevamiento)

67 Componentes básicos: JerarquíasRepresentadas por un ordenamiento lógico dentro de la dimensión, se encuentran formadas por los diferentes tipos de relaciones entre los atributos de una misma dimensión. Pueden existir múltiples jerarquías dentro de una dimensión pero siempre es posible identificar una jerarquía principal o columna vertebral de la dimensión y jerarquías secundarias o descriptivas compuestas por atributos característicos definidos desde la jerarquía principal.

68 ... Las prioridades cambiaron ...1999 Administración estratégica del servicio al cliente 1997 Base de datos de marketing directo 1998 Administración estratégica de larga distancia Soporte de toma de decisiones de marketing 1996 Lectura de la transparencia. Fijense como fue cambiando la orientación del DWH a lo largo de los años, al principio se limitaba a decisiones de marketing mientras en el '99, el conocimiento del cliente

69 EL PRIMER PASO : 1996 EL SISTEMA DE SOPORTE DE DECISIONES DE MARKETINGLos cambios: No es para OBTENER datos, pero sí para ORGANIZARLOS SITUAR al cliente, la disponibilidad de servicios y los datos del censo en la cartografía Integración con el Sistema Corporativo Lectura de la transparencia. Queda definido que no es un cúmulo de datos de los viejos sistemas que habia en la empresa sino una integración de los datos organizada, que sirve para conocer al cliente y las posibilidades de productos que tiene la empresa en ese lugar, y además poder dar apoyo al sistema corporativo

70 EJEMPLO EN UNA TELEFONICAINSTALACION, PRODUCTOS & SERVICIOS FACTURACION CENTRALES PLANTEL CONTACTOS FACTURACION DE CLIENTES TRAFICO HISTORIA DE CONTACTOS RECLAMO DE CLIENTES OPERACIONAL CLIENTES PRODUCTOS & SERVICIOS DETALLE DE LLAMADAS INGRESOS DEMOGRAFIA PEDIDOS HISTORIA DE CONTACTOS Existían en la empresa distintos subsistemas como el de facturación, el de centrales, el plantel y el manejo de contactos y fue transformado en una base de datos relacional integrada por **********, para el soporte de decisión SOPORTE DE DECISION

71 EL PRIMER PASO : 1996 EL PODER DE LA SOLUCION INTEGRADA RDBM (ORACLE)VISION*: Visualización y análisis geográfico SOPORTE Y SERVICIOS IMPROMPTU: Segmentación,reporte & análisis Aplicaciones de Marketing + Rentabilidad de las Ventas Buscador de conocimiento: Data mining Software analítico + GDMS Información de marketing, datos de clientes y lugares demografía -cartografía - segmentación Lectura de la transparencia RDBM (ORACLE) SISTEMAS HEREDADOS INFORMACION EXTERNA

72 LOS BENEFICIOS Una base de datos corporativaTodos los usuarios comparten la misma visión de negocios, con datos organizados de los clientes. El componente geográfico como parte del modelo (incrementar el valor de la información) Clientes y servicios son geo-referenciados en el mismo mapa base El SISTEMA DE REPORTES DINAMICO que se puede adaptar a las demandas cambiantes

73 EL TERCER PASO : 1997 EL DATA WAREHOUSE DE CLIENTESLos cambios: Incorporar el detalle de llamadas para crear el perfil potenciado de cliente Evaluación estratégica de mercado para direccionar el negocio Creación proactiva de promociones de promociones personalizadas Reacción rápida al cambio de condiciones del mercado Análisis de rentabilidad y características del cliente Modelos predictivos

74 EL “HOY” DEL SISTEMA Análisis de la transparencia

75 Seguridad Escalabilidad ProducciónCubre los requerimientos de Seguridad Informática Seguridad de datos según sea el perfil del usuario. Escalabilidad De diez a miles de usuarios finales Pocos gigabytes a multiples terabytes de datos Gran performance en los queries Lectura de la transparencia Producción Entorno abierto y flexible, disponibilidad 7*24 horas Seguridad en la organización y manejo de los datos

76 Modelo Relacional (OLAP)El modelo de datos puede reflejar el modelo de negocio La identificación de datos es única (nombre = significado) Capacidades de “navegación” (profundizar, buscar otro...) Características de “slice & dice” Lectura de la transparencia Posibilidad de incorporación de “alertas” Seguimiento del uso, lo que posibilta la mejora progresiva Administración de perfiles de usuarios flexible

77 El DWH : como hacer “inteligencia de negocio”¿Cual es el modelo de negocio de la empresa? ¿Cuales son las dimensiones de la empresa? ¿Que queremos medir en la empresa? Se modeliza la empresa en diferentes dimensiones (para poder navegar en la información) y se definen métricas (para poder medir las variables del modelo).

78 Dimensiones: . PRODUCTOS . TIEMPO . CANALESEstán vinculadas con las preguntas : ¿Que vendemos?, ¿Cuando vendemos?, ¿A quien vendemos?, ¿En donde vendemos?, ¿Quien vende?, Etc. Tomemos a modo de ejemplo cuatro dimensiones tradicionales. . TIEMPO . MERCADO . CANALES . PRODUCTOS CLIENTES MACRO SEGMENTOS MICRO SEGMENTOS NICHOS LINEAS SERVICIOS PRODUCTOS UN, UO, REGION, CS, AC AÑO, MES, DIA, ULTIMO MES, etc.

79 Como navegar ? . PRODUCTOS . TIEMPO . MERCADO . CANALES DRILL UP DRILLANY WHERE DRILL ACROSS DRILL DOWN

80 LA EMPRESA PUEDE HACER:Analizar la información del producto Analizar la información del cliente Analizar patrones de comportamientos Estrategia de precios Entender los hábitos del cliente Chequear la calidad de los datos Segmentar clientes Geomarketing

81 Reportes visuales : ¿Dónde están nuestros clientes más probables para esta promoción?

82 Preguntas visuales : ¿Quiénes son los clientes que viven en esta área y usan nuestro servicio de Internet?

83 Una vista integrada : 1ro: selección por condición de datos, 2doUna vista integrada : 1ro: selección por condición de datos, 2do. selección por condición geográfica, 3rd. obtención del listado

84 Nuevos desarrollos : Mapas temáticos Producto X / 100 personas del estado

85 Una visión detallada : Demanda versus disponibilidad, por manzana

86 71.45 Informática para la Gestión de la EmpresaDATAMINING

87 DATAMINING ¿Qué es Data Mining? Qué no es Data Mining Usos Técnicas71.45 Informática para la Gestión de la Empresa DATAMINING ¿Qué es Data Mining? Qué no es Data Mining Usos Técnicas Características

88 DATAMINING - ¿Qué es? Es un proceso de descubrimiento que permite al usuario conocer la esencia y las relaciones entre sus datos. Herramienta de análisis y exploración automática de grandes bases de datos para extraer información útil y no evidente

89 DATAMINING - ¿Qué es? Es el proceso de seleccionar, explorar, modificar, modelizar y valorar grandes cantidades de datos con el objetivo de descubrir patrones desconoci- dos (SAS Institute) Valoración CONOCIMIENTO Datos transformados Modelización Proble- ma Objetivos Modelos Datos procesados Modificación Datos Exploración Selección de los datos Preproceso de los datos Transformación de los datos Selección Datos objetivo

90 DATAMINING Costos del proceso70% del tiempo total dedicado al proyecto se insume en definir el problema y preparar la tabla de datos

91 DATAMINING - ¿Qué no es? Queries/ Informes Data WarehouseSistemas Expertos Estadística

92 DATAMINING – Usos Credit scoring Fidelidad: ¿quién se dará de baja?Mejora de campañas: ¿quién de mis clientes es más propenso a comprar mi producto? Próximo producto: ¿qué producto ofrecer al cliente X? ¿Cuál es la nómina de este cliente? Ventas en el próximo mes ¿Cuál será el Merval de la próxima semana? Como son nuestros clientes Por que compran ciertos productos y como evolucionan

93 DATAMINING - Técnicas Modelos predictivos: ClasificaciónModelos predictivos: Predicción de valores Segmentación de BD: Clustering no jerárquico Segmentación de BD: Clustering jerárquico Análisis de relaciones: Asociaciones Análisis de relaciones: Patrones secuenciales Análisis de relaciones: Patrones en series temp.

94 DATAMINING - EstadísticasÚtiles en Descripción y visualización simple de datos Test de hipótesis max, min, medias, sigma, frecuencias, …. histogramas 2D búsqueda de correlaciones regresiones lineales Dificultades en relaciones no lineales entre variables distribuciones no gaussianas

95 DATAMINING – “Clusterización”Todas ellas agrupan los clientes pero con distintos métodos y criterios Las técnicas más usadas son: clásicas: Se agregan registros hasta llegar al número de grupos deseados o a la distancia mínima redes neuronales Kohonen. Método: el ganador se lo lleva todo Neural-Gas. Simula un gas formado de moléculas Es muy recomendable hacer una Clusterización: Podemos descubrir agradable sorpresas

96 DATAMINING - Arboles Herramientas muy populares para clasificaciónAtractivo: sus resultados pueden expresarse mediante reglas ejecutables directamente en SQL Problemas: el número de reglas generalmente es enorme son superadas por las redes (predicción)

97 DATAMINING - Arboles Cada rama se divide en otras para disminuir la diversidad diversidad: como más baja es, indica predominio de una clase El proceso termina por criterios de ganancia de información, entropía,...

98 DATAMINING - ClasificaciónEn la base hay un 7% de presencia de tarjeta GOLD Si el cliente tiene más de 3 débitos automáticos, es casado y tiene más de 37 años el porcentaje de tarjeta GOLD sube al 25% Comentario: En cada nivel, la rama que deriva a la izquierda es SI, la derecha NO

99 DATAMINING – CaracterísticasAcceso directo a la base de Datos Capacidad de análisis visual Capaz de absorber grandes cantidades de datos Sensibilidad a la calidad de los datos

100 DWH - Software Bases de Datos Data MiningRelacionales (Oracle, Sybase, Informix, DB2, Adabas) Aceleradoras (Teradata, VDB, IQ, Synera, Red-Brick) Multidimensionales (Oracle-OLAP-Express, SAS-MDDB, Hyperion-Essbase) Data Mining Enterprise Miner de SAS Oracle Data Miner de Oracle Clementine de SPSS Intelligent Miner de IBM

101 DWH - Software Herramientas de OLAP-Q&R y VisualizaciónDSS de MicroStrategy Business Objects OLAP-Express, Discoverer (ORACLE) Enterprise Report, EIS (SAS) BIW de SAP Gentia Cognos (IBM) Insight/Dynasight de Arcplan

102 71.45 Informática para la Gestión de la EmpresaBALANCE SCORECARD

103 BALANCE SCORECARD Cantidad o escala de producción Epoca industrial71.45 Informática para la Gestión de la Empresa BALANCE SCORECARD Epoca industrial Cantidad o escala de producción Baja de costos Epoca información Nuevas capacidades para el éxito competitivo Activos intangibles

104 BALANCE SCORECARD Entorno operativo Funciones cruzadasVínculos con los clientes y proveedores Segmentación de los clientes Escala global Innovación Empleados de nivel

105 BALANCE SCORECARD Modelo Contabilidad financiera (histórica)71.45 Informática para la Gestión de la Empresa BALANCE SCORECARD Modelo tradicional Contabilidad financiera (histórica) BSC Modelo actual Como las UN crean valor para sus clientes actuales y futuros Como deben potenciar las capacidades internas y las inversiones en personal, sistemas y procedimientos para su actuación futura

106 BALANCE SCORECARD Visión y Estrategia Finanzas Procesos internos¿Cómo deberíamos aparecer ante nuestros accionistas, para tener éxito financiero? Objetivos Indicador Iniciativas Finanzas Objetivos Indicador Iniciativas ¿Cómo deberíamos aparecer ante nuestros clientes, para tener alcanzar nuestra visión? Clientes Objetivos Indicador Iniciativas ¿En qué procesos debemos ser excelentes para satisfacer a nuestros accionistas y clientes? Procesos internos Visión y Estrategia Objetivos Indicador Iniciativas ¿Cómo mantendre-mos y sustentaremos nuestra capacidad de cambiar y mejorar, para conseguier alcanzar nuestra visión? Formación y crecimiento

107 BALANCE SCORECARD Como proceso de gestión, el BSC es útil paraClarificar y traducir la visión y la estrategia Comunicar y vincular los objetivos y los indicadores estratégicos Planificación, establecimiento de objetivos y alineación de iniciativas estratégicas Aumentar el feed-back y la formación estratégica

108 BALANCE SCORECARD El BSC es un nuevo marco o estructura para integrar indicadores de la estrategia SISTEMA DE INDICADORES SISTEMA DE GESTION

109 BALANCE SCORECARD Clarificar la estrategia y conseguir el consenso sobre ella Comunicar la estrategia a toda la organización Alinear los objetivos personales y departamentos con la estrategia Vincular los objetivos estratégicos con los objetivos a largo plazo y los presupuestos anuales Identificar y alinear las iniciativas estratégicas Realizar revisiones estratégicas periódicas y sistemáticas Obtener feed-back para aprender sobre la estrategia y mejorarla

110 BALANCE SCORECARD La “perspectiva financiera” indica“Si la estrategia de una empresa, su puesta en práctica y ejecución están contribuyendo a la mejora del mínimo aceptable.” Ej.: Rendimiento sobre inversiones, Valor añadido económico

111 BALANCE SCORECARD Temas estratégicosCrecimiento y diversi- ficación de los ingresos Reducción de Costes/mejora de la productividad Utilización de los activos Estrategia de la unidad de negocio Crecimiento Tasa de crecimiento de las ventas por segmento Porcentaje de los ingresos procedentes de nuevos productos, servicios y clientes Ingresos/Empleados Inversiones (porcentaje de ventas) I + D (porcentaje de ventas) Sostenimiento Cuota de cuentas y clientes seleccionados Venta cruzada Porcentaje de ingresos de nuevas aplicaciones Rent. de la línea de prod. y clientes Coste frente a competidores Tasas de reducción de costes Gastos indirectos (porcentaje de ventas) Ratios de capital circulante (ciclo de maduración) ROCE por categorías de activos clave Tasas de utilización de los activos Recolección Rentabilidad de la línea de producto y clientes Porcentaje de clientes no rentables Costes por unidad (por unidad de output, por transacción) Período de recuperación (Pay- Back) Throughput

112 BALANCE SCORECARD La “perspectiva del cliente” permite:“Equiparen sus indicadores clave sobre los clientes y mercado seleccionados.” “Identificar y medir de forma explícita las propuestas de valor agregado que entregarán a los segmentos de clientes y de mercado seleccionados.”

113 BALANCE SCORECARD Cuota de Mercado Adquisición de ClientesRentabilidad de clientes Retención de clientes Satisfacción de los clientes Cuota de Mercado Refleja la proporción de ventas, en un mercado dado (en términos de número de clientes, dinero gastado o volumen de unidades vendidas) que realiza una unidad de negocio. Incremento de clientes Mide, en términos absolutos o relativos, la tasa en que la unidad de negocio atrae o gana nuevos clientes o negocios. Retención de clientes Sigue la pista, en términos relativos o absolutos, a la tasa que la unidad de negocio retiene o mantiene las relaciones existentes con sus clientes. Satisfacción de clientes Evalúa el nivel de satisfacción de los clientes según unos criterios de actuación específicos dentro de la propuesta de valor añadido. Rentabilidad del cliente Mide el beneficio neto de un cliente o de un segmente, después de descontar los únicos Gastos necesarios para mantener ese cliente..

114 BALANCE SCORECARD La “perspectiva del proceso interno” permite:Identificar los procesos críticos internos en los que la organización debe ser excelente Centrarse en los procesos internos que tendrán el mayor

115 BALANCE SCORECARD Cadena de valor Diseñar Desa-rrollar Hacer Merca-doLas necesidades del cliente han sido identificadas Las necesidades del cliente están satisfechas Diseñar Desa-rrollar Hacer Merca-do Servicio Tiempo que se tarda en llegar al mercado Cadena de suministro

116 BALANCE SCORECARD La “perspectiva de aprendizaje y crecimiento” permite: Identificar la infraestructura que la empresa debe construir para crear una mejora y crecimiento a largo plazo.

117 BALANCE SCORECARD Indicadores clave Medios Resultado Retención delempleado Retención del empleado Satisfacción del empleado Medios Competencias del personal Infraestructura tecnológica Clima laboral

118 BALANCE SCORECARD - EjemploMetrobank se enfrentaba a dos problemas: Una dependencia excesivo de un solo producto (depósitos) Una estructura de coste que hacía no rentable trabajar con el 80% de sus clientes a la tasa de interés imperantes. Estrategia 1: Crecimiento de los ingresos: Reducir la volatilidad de los beneficios, ampliando las fuentes de ingresos con productos adicionales para los clientes existentes. Estrategia 2: Productividad: Mejorar la eficiencia operativa pasando clientes no rentables a canales de distribución más rentables (por ejemplo, la banca electrónica).

119 BALANCE SCORECARD - EjemploMejorar los rendimientos Financiera Ampliar la mezcla de ingresos Mejorar la eficiencia operativa Cliente Aumentar la confianza del cliente en nuestro asesoramiento financiero Aumentar la satisfacción del cliente por medio de una ejecución superior Interna Comprender a los segmentos de clientes Desarrollar nuevos productos La venta cruzada de la lí- nea de productos Pasar al canal adecuado Reducir al mínimo los problemas Proporcionar una respuesta rápida Crecimiento y aprendizaje Aumentar la productividad de los empleados Desarrollar las habilidades estratégicas Acceder a la información estratégica Alinear las metas personales