1 Taller Administración 2.1 Enlazando Datos de la Administración Pública
2 Pasos a seguir ● Identificación ● Modelado ● Transformación ● Enriquecimiento ● Publicación ● Consumo
3 Pasos a seguir ● Identificación ● Modelado ● Transformación ● Enriquecimiento ● Publicación ● Consumo
4 Identificación (estratégica) ● Conjuntos de datos que puedan ser expuestos ● Datos ya publicados (HTML, TXT, PDF, etc.) ● Datos no publicados – Bases de datos – Ficheros aislados en máquinas – Ficheros accesibles desde la Intranet –... ● A tener en cuenta ● Licencias, normativa legal, política
5 Identificación (técnica) ● Formatos y esquemas de los datos ● Tablas de bases de datos, XML, HTML, hojas de cálculo, CSV, texto plano, … ● Acceso a la información ● Base de datos remota ● HTTP (petición a una dirección web) ● Servicio Web (RESTful o SOAP) ● Acceso a un sistema de ficheros – FTP, WebDAV, etc.
6 No siempre XML es lo mejor John Smith [email protected] 3489912827 …
7 Preferencia de Selección ● Información fundamental ● Estructura organizativa de la administración ● Edificios públicos ● Calendario, intervalos de tiempo, … ● Localizaciones ● Agenda de eventos ● Información con mayor demanda (potencial) ● Turismo ● Servicios,...
8 Ejemplo: “Oferta Formativa” ● Identificación de datos ● Ya expuestos en el portal del Servicio Público de Empleo del Gobierno del Principado de Asturias ● Conjuntos de datos analizados – Acciones Formativas – Organizaciones Colaboradoras – Centros Colaboradores ● Acceso y formato ● Servicio Web que devuelve un XML
9 Ejemplo: XML origen (cursos) 314 EIMAN24 MANTENEDOR DE SISTEMAS ELECTROHIDRAÚLICOS IMA INSTALACIÓN Y MANTENIMIENTO IMAN MECÁNICA FORMACIÓN PARA EL EMPLEO (2009) "" MEDIOS PROPIOS 2009 SARA ACERO F0 INDEFINIDO 90 DESEMPLEADOS EN GENERAL "" 269 15 AV. DE ALEMANIA, 76 AVILÉS 33400 ASTURIAS (ESPAÑA) E0535 CENTRO DE FORMACIÓN OCUPACIONAL DE AVILÉS C0961 CENTRO DE FORMACIÓN OCUPACIONAL DE AVILÉS AV. DE ALEMANIA, 76 AVILÉS 33400 ASTURIAS ESPAÑA ""
10 Pasos a seguir ● Identificación ● Modelado ● Transformación ● Enriquecimiento ● Publicación ● Consumo
11 Modelado de los recursos ● Cualquier recurso está identificado con un URI ● Identificador de Recurso Uniforme ● Accesible desde cualquier punto de la Web ● Cada recurso debe modelarse semánticamente ● RDF (Infraestructura de Descripción de Recursos) ● Usando un vocabulario (preferiblemente estándar) http://.../ curso#1 http://.../ centro#7
12 Definición del esquema de URIs ● ¡Muy importante! ● Define la procedencia de los datos ● Debe ser persistente en el tiempo ● Debe ser intuitivo http://risp.asturias.es/{tema}/{dataset}/{clase}/{ID} http://risp.asturias.es/empleo/oferta-formativa/Centro-Colaborador/C1146
13 Identificando los recursos 314 EIMAN24 MANTENEDOR DE SISTEMAS ELECTROHIDRAÚLICOS IMA INSTALACIÓN Y MANTENIMIENTO IMAN MECÁNICA http://risp.asturias.es/{tema}/{dataset}/{clase}/{ID} http://risp.asturias.es/empleo/oferta-formativa/Accion-Formativa/2009_15
14 Modelando los recursos ● Vocabularios “estándar” internacionales ● Dublin Core ● vCard ● iCalendar ● FOAF ● Vocabulario específico ● http://risp.asturias.es/vocab/empleo/oferta-formativa# http://risp.asturias.es/vocab/empleo/oferta-formativa ● Define clases y propiedades de la Oferta Formativa – Acciones Formativas, Convocatorias, etc.
15 Modelo estático / dinámico
16 Pasos a seguir ● Identificación ● Modelado ● Transformación ● Enriquecimiento ● Publicación ● Consumo
17 Transformación XML – RDF ● Transformación XSL ● In: – XML Acciones Formativas – XML Centros – XML Organizaciones ● Out: – RDF con información estructurada y semántica
18 Transformación XSL 314 2009/15 IMAN EIMAN24 MANTENEDOR IMA... /SERVICIO/@fecha MANTENEDOR DE SISTEMAS ELECTROHIDRAÚLICOS 2009-09-04 2009-12-04 PT269H SARA ACERO 15
19 Pasos a seguir ● Identificación ● Modelado ● Transformación ● Enriquecimiento ● Publicación ● Consumo
20 Enriquecer los datos originales ● Incluir información útil para la reutilización ● Por ejemplo: ● Dirección sin estructura → estructurada ● Dirección estructurada → coordenadas ● Taxonomías – Familias Profesionales > Áreas Profesionales > Cursos
21 Enriquecimiento Semántico ● Buscar información enlazada enriquezca los datos generados ● DBpedia ● Geonames
22 Enriquecimiento de direcciones ● Propiedades geo:lat, geo:long, foaf:based_near
23 Pasos a seguir ● Identificación ● Modelado ● Transformación ● Enriquecimiento ● Publicación ● Consumo
24 Publicación HTML, RDF, JSON...
25 Metadatos de cada dataset
26 Consultas SPARQL
27 Pasos a seguir ● Identificación ● Modelado ● Transformación ● Enriquecimiento ● Publicación ● Consumo
28 Consumo de Linked Data http://bit.ly/ctic_sintrafor
29 Consultas SPARQL SELECT * WHERE { ?curso a of:Accion-Formativa; ical:description ?description; ical:summary ?summary; ical:dtstart ?dtstart; ical:dtend ?dtend; of:centro ?centro; of:area ?area; of:organizacion ?organizacion; of:aforo ?aforo. ?centro rdfs:label ?nombreCentro; vcard:adr ?adr. ?adr geo:long ?long; geo:long ?long; geo:lat ?lat; loc:localidad ; vcard:locality ?locality; vcard:label ?address. OPTIONAL {?curso of:uc ?uc} }
30 Múltiples aplicaciones coste ≈ cero
31
32 Nuevas tecnologías: HTML5 http://bit.ly/ctic_canvas
33 Portal Datos de Asturias