Repositorio en la Nube Coral Calero Grupo Alarcos

1 Repositorio en la Nube Coral Calero Grupo AlarcosEscuel...
Author: Carlos Herrera Farías
0 downloads 0 Views

1 Repositorio en la Nube Coral Calero Grupo AlarcosEscuela Superior de Informática Universidad de Castilla-La Mancha, España Santo Domingo, 27 de Noviembre de 2016

2 Universidad de Castilla-La ManchaCiudad Real está a 55 minutos de Madrid con tren de alta velocidad (AVE)

3 Universidad de Castilla-La ManchaTalavera de la Reina Cuenca Ciudad Real Toledo Almadén Albacete Provincias de Albacete, Ciudad Real(2), Cuenca y Toledo (2) (6 campus) ~ estudiantes, docentes

4 Universidad de Castilla-La ManchaTOLEDO 1000+ estudiantes, 65 docentes Grado, Máster, Doctorado

5 Grupo de Investigación AlarcosProfesores a Tiempo Completo Prof. Mario Piattini Manuel Serrano Aurora Vizcaino Macario Polo Marian Moraga Felix García Eduardo Fernández-Medina Marcela Genero David García Ismael Caballero José Cruz-Lemus Prof. Francisco Ruiz Ignacio García Prof. Coral Calero

6 Grupo de Investigación Alarcos14 (Full-time) PhD en informática Dr. Mario Piattini (Full Professor) Dr. Coral Calero (Full Professor) Dr. Francisco Ruiz (Full Professor) 20 estudiantes PhD España Méjico Holanda Francia Cuba Hemos tenido estudiantes de otros países: Brazil, Uruguay, Chile, Argentina, …

7 Grupo de Investigación AlarcosDatabases Software Engineering Information Systems Programming Project Management Management Skills Research Methods Software quality Testing Security Business process Knowledge Management Grado y Máster Doctorado

8 Grupo de Investigación AlarcosDos labs en la ESI

9 Grupo de Investigación AlarcosOtro labo en el ITSI

10 Grupo de Investigación AlarcosOBJETIVOS DE LA INVESTIGACIÓN techniques methods tools processes IS QUALITY

11 Grupo de Investigación AlarcosGreen and Sustainable Software: Coral Calero, M. Ángeles Moraga Software maintenance, reengineering, testing: Ignacio García Macario Polo Quality in MDD: Marcela Genero, José Antonio Cruz-Lemus Data quality: Ismael Caballero Manuel Serrano IS security: Eduardo Fernández-Medina, David García Software and business processes: Francisco Ruiz, Félix García Knowledge management & GSD: Aurora Vizcaíno

12 Agenda ¿Qué es Cloud Computing? Costes de la nube Seguridad en la nubeComparativa de sitios para guardar documentos en la nube Repositorios

13 Agenda ¿Qué es Cloud Computing? Costes de la nube Seguridad en la nubeComparativa de sitios para guardar documentos en la nube Repositorios

14 ¿Qué es Cloud Computing?Gartner Webinar. Technology Trends You Can’t Afford to Ignore. Ray Paquet, 2016

15 ¿Qué es Cloud Computing?

16 ¿Qué es Cloud Computing?

17 ¿Qué es Cloud Computing?

18 ¿Qué es Cloud Computing?Modelo que permite el acceso bajo demanda a una serie de recursos informáticos compartidos (redes, servidores, sistemas de almacenamiento, aplicaciones y servicios) que pueden ser rápidamente aprovisionados y puestos en funcionamiento con un mínimo esfuerzo de gestión e interacción con el proveedor de servicios. National Institute of Standards and Technology

19 ¿Qué es Cloud Computing?

20 ¿Qué es Cloud Computing?Auto-servicio por demanda El usuario puede acceder a capacidades de computación "en la nube" conforme las necesita Acceso amplio desde la red Los recursos son accesibles por medio de mecanismos estándar que son utilizados por una amplia variedad de dispositivos de usuario Compartición de recursos Los recursos (almacenamiento, memoria, ancho de banda, etc.) de los proveedores son compartidos por múltiples usuarios Rápida elasticidad Los recursos se asignan y liberan rápidamente, lo que da al usuario la impresión de que los recursos a su alcance son ilimitados y están siempre disponibles. Servicio medido El proveedor es capaz de medir el servicio efectivamente entregado a cada usuario, lo que posibilita el pago por uso de los servicios

21 ¿Qué es Cloud Computing?SaaS – Software as a Service Modelo de distribución de software en el que una aplicación es ofrecida como un servicio proporcionado a través de internet Salesforce, Zoho, Google App PaaS – Platform as a Service Modelo que ofrece todo lo necesario para soportar el ciclo de vida completo de construcción y puesta en marcha de aplicaciones y servicios web completamente disponibles en internet Windows Azure Platform IaaS – Infrastructure as a Service Modelo de distribución de infraestructura de computación como un servicio, normalmente a través de una plataforma de virtualización (asignación de máquinas virtuales bajo demanda) Amazon Elastic Compute Cloud (EC2)

22 ¿Qué es Cloud Computing?Proveedor Cloud Computing Cliente Cloud Computing Aplicación Servicio, Máquina Virtual Sistema Operativo, Almacenamiento … SaaS PaaS IaaS

23 ¿Qué es Cloud Computing?Nube privada Sirve a una organización con su propia infraestructura y dota de servicios a dicha organización o los clientes de ésta. También puede ser un espacio privado dentro de los recursos del proveedor de servicios en la nube. Nube comunitaria Dos o más organizaciones forman una alianza para implementar una infraestructura cloud orientada a objetivos similares y con un marco de seguridad y privacidad común Nube pública Infraestructura y recursos lógicos que forman parte del entorno se encuentran disponibles para el público en general a través de Internet. Problemas de seguridad y privacidad Nube híbrida Utilización conjunta de varias infraestructuras cloud de cualquiera de los tres tipos anteriores

24 ¿Qué es Cloud Computing?

25 ¿Qué es Cloud Computing?

26 Agenda ¿Qué es Cloud Computing? Costes de la nube Seguridad en la nubeComparativa de sitios para guardar documentos en la nube Repositorios

27 Costes de la nube La nube puede usarse por una empresa o por un particular. En el caso de una empresa, hay que tener en cuenta: Coste de licencias Coste de infraestructura En el caso de un particular, hay que tener en cuenta: El uso que le vamos a dar La capacidad que necesitamos

28 Costes de la nube Si somos una empresa, tenemos que tener en cuenta las licencias software. Las licencias tradicionales se computan en base a las CPUs donde correrán los programas. Al migrar a la nube, deberemos tener en cuenta: Tipo de criterio de uso que soportan las licencias Hora/CPU, usuario, instancia, etc. Si las licencias son aptas para entornos virtualizados

29 Costes de la nube Existe el modelo de licencias de código abierto:No existen acuerdos de licencias. No existen costes por uso (sea cual sea el criterio) Podemos concentrarnos en las verdaderas dificultades que supone la migración a la nube. Linux, MySQL, Apache son ejemplos de sistemas de código abierto que ofrecen licencias para recibir un soporte adicional para la nube

30 Costes de la nube La licencia software más interesante para la nube es la que computa por horas/CPU. Microsoft, Valtira , Red Hat, Vertica, Sun, Oracle, etc. Hay licencias por usuario que pueden ser útiles para la nube. Sin embargo, ¿cómo nos aseguramos de no violar el número de usuarios contratados? El escenario más complejo en términos de licencias: Uso por CPU y por usuario. Necesidad de crear instalaciones personalizadas para cada instancia. No son compatibles con la filosofía flexible de la nube.

31 Costes de la nube En cuanto a la infraestructura, la inversión en la nube tiene que compensar el coste de una infraestructura propia Coste estimado de un servidor virtual. Coste estimado de las licencias para el servidor virtual. Coste estimado de las herramientas de gestión de la infraestructura de la nube (si fueran necesarias). Costes derivados de la inicialización del entorno por parte de otras empresas.

32 Costes de la nube Si eres un particular puedes encontrar almacenamiento gratuito pero: No es infinito No siempre es gratuito ¿Cuánto puedes almacenar gratis? OneDrive de Microsoft Google Drive iCloud Drive Amazon Cloud Drive Dropbox A de junio 2015 5GB 15GB 2GB

33 Costes de la nube Como referencia, asumiendo no profesionales y que cada foto pesa una media de 2,5MB: En 1GB cabrían 400 fotos. En 100GB cabrían fotos. Y en 1TB cabrían fotos. ¿Cuánto cuesta almacenar 1TB? OneDrive de Microsoft Google Drive Dropbox iCloud Drive Amazon Cloud Drive Precios mensuales en junio 2015 US$6,99 US$9,99 US$19,99 -----

34 Agenda ¿Qué es Cloud Computing? Costes de la nube Seguridad en la nubeComparativa de sitios para guardar documentos en la nube Repositorios

35 Seguridad en la nube

36 Seguridad en la nube Al Cloud se le atribuyen ciertas deficiencias de seguridad Los datos ya no están en los servidores de la empresa, sino en los de un proveedor externo No es fácil garantizar que los datos no van a salir del país No tengo derecho a auditar la seguridad del proveedor donde tengo alojados mis datos Si mi proveedor tiene una caída, me quedo sin servicio Tengo que fiarme de las medidas de seguridad que mi proveedor tenga en producción Los sistemas de detección y prevención de intrusiones de mi proveedor no lo paran todo

37 Seguridad en la nube La nueva forma de plantear la infraestructura en la nube obliga a replantearse muchas cosas sobre la misma…y la seguridad con más razón. Implicaciones que se presentan: Aspectos legales que se convierten en problemas de seguridad. Las leyes y estándares relacionados con las TIC no están pensados para los conceptos en la nube (ej. Virtualización). La normativa es diferente en cada país, pero Internet es universal

38 Seguridad en la nube Existen recomendaciones descritas por los líderes del sector Organización internacional CSA (Cloud Security Alliance) Consultora Gartner Instituto norteamericano NIST (National Institute of Standards and Technology).

39 Seguridad en la nube Riesgos de seguridad CloudAccesos de usuarios con privilegios Cumplimiento normativo Localización de los datos Aislamiento de datos Recuperación Soporte investigativo Viabilidad a largo plazo

40 Seguridad en la nube Accesos de usuarios con privilegiosEl procesamiento o tratamiento de datos sensibles fuera de las instalaciones de la empresa conlleva un riesgo inherente Estos servicios externos sortean los controles físicos, lógicos y humanos siendo, por este motivo, necesario conocer quién maneja dichos datos. Recomendación: Consensuar con el proveedor los usuarios que tendrán acceso a esos datos, para minimizar así los riesgos de que haya usuarios con elevados privilegios que no deberían tener acceso a los datos.

41 Seguridad en la nube Cumplimento normativo Recomendación:Los clientes son en última instancia responsables de la seguridad e integridad de sus datos Aunque estos se encuentren fuera de las instalaciones y gestionados por un proveedor de servicios cloud. Recomendación: Los prestadores de servicios tradicionales se hallan sujetos a auditorías externas y certificaciones de seguridad, los proveedores de servicios en la nube también deben Si se negasen, no se les debería confiar los datos sensibles de la empresa.

42 Seguridad en la nube Localización de los datos Recomendación:Al utilizar entornos en la nube no se conoce de forma exacta en qué país están alojados. Recomendación: Se debe consultar con los proveedores cuál es el marco regulatorio aplicable al almacenamiento y procesado de datos Buena práctica: cerrar un acuerdo con el proveedor para que el tratamiento de los datos se subyugue al marco legal del país del suscriptor del servicio.

43 Seguridad en la nube Aislamiento de datos Recomendación:Los datos de distintos clientes comparten infraestructura El proveedor debe garantizar el aislamiento de los datos de cada cliente Buena práctica: cifrado de los datos Problema: cómo aislar los datos cuando se encuentran en reposo ya que el cifrado puede resultar costoso Recomendación: El prestador del servicio debe garantizar que los datos en reposo estarán correctamente aislados y por personal experimentado

44 Seguridad en la nube Recuperación Recomendación:Los proveedores de servicio deben tener una política de recuperación de datos en caso de desastre. Asimismo, es muy recomendable que los datos sean replicados en múltiples infraestructuras para evitar que sean vulnerables a un fallo general. Recomendación: Se debe exigir a los proveedores los datos sobre la viabilidad de una recuperación completa y el tiempo que podría tardar.

45 Seguridad en la nube Soporte investigativo Recomendación:La investigación de actividades ilegales en entornos cloud puede ser una actividad casi imposible Los datos y logs (registros de actividad) de múltiples clientes pueden estar juntos e incluso desperdigados por una gran cantidad de equipos y centros de datos. Recomendación: Que el proveedor garantice que los logs y los datos de los incidentes se gestionan de una forma centralizada.

46 Seguridad en la nube Viabilidad a largo plazo Recomendación:En un entorno ideal un proveedor de servicios cloud siempre permanecerá en el mercado dando un servicio de calidad y con una disponibilidad completa El mercado es cambiante y cabe la posibilidad de que el proveedor sea comprado o absorbido por alguno con mayores recursos. Recomendación: El cliente debe asegurarse que podrá recuperar sus datos aunque el proveedor sea comprado (absorbido) o hacer que sea posible que los datos puedan ser migrados a la nueva infraestructura.

47 Seguridad en la nube Entonces, ¿Podemos fiarnos del Cloud Computing?Tres reglas de oro: La seguridad en la nube es (casi) igual a la seguridad interna Aspectos de seguridad en Cloud pueden ser resueltos por las herramientas actuales de las empresas Si se elige un proveedor de cloud computing de calidad, la seguridad será igual, o incluso mejor, en la nube que con una gestión interna.

48 Seguridad en la nube Para estar seguros hay que escoger un proveedor de Cloud que tenga: Alta disponibilidad en su CPD Cortafuegos Control de código malicioso Detección y prevención de intrusiones Debe aportar confianza de una forma clara: Certificaciones de tercera parte (ISO 9001, ISO 27001, etc.) Certificaciones personales del equipo técnico CPD en el país, si eso es un requerimiento para el cliente Buen nivel de soporte 24x7

49 Seguridad en la nube ¿Qué debe tener en cuenta un proveedor para cubrir las expectativas en torno a seguridad en la nube? Garantizar la seguridad a lo largo de toda la cadena de suministro, desde los proveedores de cloud computing hasta los usuarios del servicio, pasando por la organización en sí. Tener planes de contingencia, para lo cual resulta crucial que el compromiso del proveedor esté alineado con las necesidades de la organización Tener planes de recuperación ante catástrofes: centros de datos distribuidos, instalaciones con medidas de seguridad apropiadas para diversificar los riesgos de pérdida de información.

50 Seguridad en la nube Y, como usuario, ¿qué debo tener en cuenta?Algunas recomendaciones: No utilizar la nube para almacenar información sensible (contraseñas, datos personales en general), ya sea propia o ajena, de tipo personal o corporativo. Si subimos información importante, que sea como copia de seguridad. Utilizar una contraseña lo suficientemente robusta (al menos con ocho caracteres, combinando mayúsculas, minúsculas, números y símbolos del teclado)

51 Seguridad en la nube Utilizar el sistema de verificación en dos pasos si está disponible, ya que se amplía considerablemente la seguridad de nuestros archivos La sincronización de carpetas en varios equipos es muy útil, pero también arriesgada No debemos mantener copias de archivos con derechos de autor y menos aún compartirlos Hay que conocer el funcionamiento de las herramientas para compartir archivos y carpetas para no mostrar información accidentalmente a quien no deberíamos.

52 Agenda ¿Qué es Cloud Computing? Costes de la nube Seguridad en la nubeComparativa de sitios para guardar documentos en la nube Repositorios

53 Comparativa de sitios …

54 Comparativa de sitios …Y la seguridad? En general todos tienen seguridad en la transmisión y autenticación (el menos con usuario y contraseña) No todos guardan las claves encriptadas por lo que son visibles si el sitio es atacado Entre los sitios más seguros está MEGA aunque hay otros menos conocidos que también le dan mucha importancia a la seguridad: SpiderOak (2GB de almacenamiento gratuito, 100 GB por 10$/mes) Tresorit (5GB de almacenamiento gratuito, 1000 GB por 25$/mes y planes business)

55 Agenda ¿Qué es Cloud Computing? Costes de la nube Seguridad en la nubeComparativa de sitios para guardar documentos en la nube Repositorios

56 Repositorios El movimiento Open Access (OA) defiende el acceso libre e inmediato, sin restricciones, a material digital educativo, académico, científico,... Promueve eliminar las barreras económicas, legales y tecnológicas para que a cambio se consiga una mayor accesibilidad para los documentos y una mayor visibilidad para los autores En los últimos años el movimiento OA se ha expandido exponencialmente: Declaración de Budapest (2002), Declaración de Bethesda (2003),Declaración de Berlín (2003).

57 Repositorios Para la puesta en marcha de un repositorio, conviene establecer un plan estratégico y tener en cuenta: costes: recursos humanos, apoyo administrativo, software, almacenamiento y hardware, difusión, documentación, formación… personal: gestor del repositorio, administrador del repositorio, bibliotecarios… partes implicadas: investigadores como autores y/o como usuarios, institución, financiadores, biblioteca… objetivos y servicios que se van a ofertar: comunicación científica, necesidad de compartir información, mejorar la gestión de la investigación…

58 Repositorios Una vez puesto en marcha el repositorio es importante pensar en la preservación de sus contenidos para asegurar al usuario un acceso permanente a los mismos. Se recomienda: desarrollar una política de preservación (qué se va a preservar y por cuánto tiempo), identificar el esquema de metadatos apropiado para la preservación, identificar las herramientas para la preservación (tecnología, formatos de ficheros, posibles riesgos), almacenar los objetos digitales en más de una ubicación.

59 Repositorios Existen directorios internacionales de repositorios. ROAROpenDOAR Buscarepositorios También existen repositorios temáticos internacionales: ArXiv: física, matemáticas, computación, biología cuantitativa Cogprints: psicología, neurociencias y biología Repec: economía E-LIS: ciencias de la información y biblioteconomía Pubmed central: medicina, biomedicina y ciencias de la vida

60 Repositorios Crecimiento de los repositorios a nivel global (mayo 2007)

61 Repositorios Proporción de repositorios por continentes (mayo 2007)

62 Repositorios Los autores son reticentes a depositar sus publicaciones en repositorios institucionales o temáticos Es fundamental realizar una buena campaña de difusión y promover el cambio de hábitos entre los miembros de la comunidad Una de las rutas para alcanzar el acceso abierto a la producción científica es el auto-archivo (lo hace el propio autor) El repositorio institucional debe tener su propia política de auto-archivo que paute quién puede depositar, qué puede depositarse, a qué derechos de explotación están sujetos los objetos digitales, etc.

63 Repositorios En cuanto a los derechos de autor, varían según la jurisdicción de cada país Para que el autor pueda disponer de sus trabajos, los derechos deben ser del autor o de la institución. Se dan varias posibilidades: cesión en exclusiva a una editorial: el autor pierde sus derechos y es la editorial quien debe autorizar derechos compartidos: se establecen los términos para la reutilización posterior de los trabajos inclusión de un adenda: que especifica que el autor puede disponer de su artículo para el depósito en repositorios o en su web personal con mención a la fuente donde se haya publicado.

64 Repositorios Los repositorios institucionales albergan, exponen públicamente y preservan recursos digitales diversos (textuales, de imagen o sonido, etc.) de una institución o de una comunidad científica Responden al compromiso de una institución de hacer visible y preservar la producción de sus profesores o investigadores, Implican el establecimiento de políticas para su desarrollo y la implicación de los distintos estamentos de la comunidad

65 Repositorios  Las principales características de un repositorio institucional son: Su naturaleza institucional. Su carácter científico, acumulativo y perpetuo. Su carácter abierto e interoperable con otros sistemas.

66 Repositorios En los repositorios institucionales hay tres capas de actividades: De contenido: conjunto de prestaciones que hacen posible la incorporación y la publicación de documentos en el repositorio, así como su intercambio y acceso por parte de otros, gracias a la interoperabilidad que aportan los protocolos OAI. De archivo: utilidades dedicadas a la preservación y permanencia en el tiempo de los documentos, muy relacionada con la capa de contenido. De servicio: servicios de valor añadido para el usuario final, como el proceso de registro, la certificación de la calidad del contenido y la notificación o información de su disponibilidad.

67 Repositorios Entre los beneficios que aportan los repositorios institucionales para la comunicación científica se encuentran: Permiten a la institución elevar la visibilidad de sus investigaciones Se proporciona un acceso más fácil y rápido a las investigaciones desarrolladas en otras instituciones. La inclusión de un trabajo científico aumenta la proyección del perfil del autor a escala mundial y el impacto de la investigación realizada. Permiten realizar estudios de producción científica e impacto de la investigación. Favorecen la preservación de las investigaciones

68 Repositorios Los repositorios temáticos se definen como un conjunto de objetos digitales resultantes de la investigación relacionada con un campo disciplinario específico Tienen mucha menos presencia que los Repositorios Institucionales. Aunque va avanzando por el éxito de iniciativas como el ArXiv, Pubmed y Eprints Todo lo explicado para los institucionales es aplicable aqui

69 Repositorios Repositorios latinoamericanosRed de repositorios latinoamericanos. Tiene como objetivo proporcionar una herramienta de fácil acceso a las publicaciones electrónicas en texto completo en diferentes repositorios latinoamericanos. Permite realizar búsquedas simultáneas a través de una sola interfaz, en 75 universidades de Argentina, Brasil, Chile, Colombia, Costa Rica, Ecuador, El Salvador, Guyana, Honduras, México, Perú, Puerto Rico, Trinidad y Tobago y Uruguay.

70 Repositorios Repositorios en Argentina Repositorios en VenezuelaFILO Digital, de la Facultad de Filosofía y Letras (UBA) FAUBA Digital, de la Facultad de Agronomia (UBA) SeDiCI, de la Universidad Nacional de La Plata. José María Rosa, de la Universidad Nacional de Lanús. CONICET, del Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET) Repositorios en Venezuela USB, de la Universidad Simón Bolívar Saber ULA, de la Universidad de los Andes Saber UCV, de la Universidad Central de Venezuela UDOSPace,de la Universidad de Oriente

71 Repositorios Repositorios en Chile Repositorios en EcuadorCaptura, de la Universidad de Chile ONEMI, servicio de información ciudadana de información científico – técnica Sinapsis, del Museo Nacional de Medicina Repositorios en Ecuador ESPE, de la Escuela Politécnica del Ejército Repositorios en Colombia UNAL, de la Universidad Nacional de Colombia RIUIS, de la Universidad Industrial de Santander IDU, del Instituto de Desarrollo Urbano IDU.

72 Repositorios Repositorios en República DominicanaRI-INTEC, del Instituto Tecnológico de Santo Domingo, incluye libros, memorias, publicaciones docentes, fondo histórico (fotografías), tesis y trabajos de investigación en formato digital. ¿Proyecto República Digital?

73 Agradecimientos Al Dr. Huáscar Frías por su invitaciónA mis compañeros: David García, Nacho García, Eduardo Fernández, Marian Moraga y Mario Piattini por su ayuda

74 Almacenamiento en la Nube¿Preguntas? Almacenamiento en la Nube Coral Calero

75 Bibliografía Joyanes, L. (2012) Computación en la nube (2ª ed.) ISBN MARCOMBO Technology Trends You Can’t Afford to Ignore. Ray Paquet, Gartner, 2016 M.ª C. Soares Guimarães, C. H. da Silva y I. Horsth Noronha (2019) Los repositorios temáticos en la estrategia de la iniciativa Open Access. Nutr Hosp 2012;27(Supl. 2): DOI: /nh sup2.6271 Flores Cuesta, G. Sánchez Tarragó, N. (2007) Los repositorios institucionales: análisis de la situación internacional y principios generales para Cuba. ACIMED. ISSN  Galmés, A. (2016) Sobre la seguridad de almacenamiento en la nube. Trabajo Fin de Máster. Máster interuniversitario de Seguridad de las tecnologías de la información y de las comunicaciones. Universitat Oberta de Catalunya. Assessing the Security Risks of Cloud Computing. Gartner

76 Webgrafía https://docudigitalmaster.wordpress.com/modulo-4-bibliotecas-digitales/asignaturas-cursadas/repositorios-institucionales/#open https://www.certsi.es/sites/default/files/contenidos/estudios/doc/incibe_seguridad_almacenamiento_dropbox_mega.pdf