1 Comunicación y uso de la literatura científica en biomedicina II Seminario EC3 sobre evaluación y comunicación de la ciencia Alberto Labarga [email protected] http://ec3.ugr.es/seminario2009/
2 La generación de información es un aspecto clave de la investigación biomédica
3
4 No sólo es importante la cantidad sino la complejidad de las interacciones
5 Applied Biosystems ABI 3730XL Illumina / Solexa Genetic Analyzer Applied Biosystems SOLiD Roche / 454 Genome Sequencer 1 Mb/day 100 Mb/run 3000 Mb/run La tecnología ha aumentado recientemente esta capacidad de generación de datos
6 PubMed statistics http://www.ncbi.nlm.nih.gov/entrez >17 million citations >400,000 added/year ~70 million searches/month PubMed statistics http://www.ncbi.nlm.nih.gov/entrez >17 million citations >400,000 added/year ~70 million searches/month PubMedCentral statistics http://www.pubmedcentral.nih.gov > 500 journals >2 million full text papers ~20 million retrievals/month PubMedCentral statistics http://www.pubmedcentral.nih.gov > 500 journals >2 million full text papers ~20 million retrievals/month Lo que se traduce en un incremento en la producción científica
7 Scientific information available in 2010 will double every 72 hours
8 Tradicionalmente, las bases de datos (Uniprot, EMBLbank) son el nodo central del conocimiento científico
9 y las referencias son material de soporte
10 pero eso está cambiando
11 A contest created to improve the way scientific information is communicated and used. The contest invites members of the scientific community to describe and prototype a tool to improve the interpretation and identification of meaning in (online) journals and text databases relating to the life sciences.
12 hay tres formas básicas de explicitar el conocimiento almacenado en las publicaciones científicas
13 1. capturar el conocimiento explicitamente
14 Structured Digital Abstracts Experiment –To develop and fine tune simple tools to facilitate data entries and the authors selection of terms from controlled vocabularies. –To propose a text layout for a structured abstract to be appended to the traditional abstract. –To investigate and estimate the authors' degree of interest (and competence) in a project implicating them as active players in this "editorial revolution".
15
16
17 2. extraer el conocimiento usando minería de textos
18 http://www.ihop-net.org
19
20 http://www.knewco.com/
21
22 generar conocimiento colectivamente
23 web 1.0: Acceder el conocimiento web 2.0: Recoger conocimiento
24 redes sociales
25
26 wikis científicas
27 http://www.wikigenes.org
28 http://www.wikiproteins.org
29 blogs
30 I was lost but now I live here http://shirleywho.wordpress.com/ Shirley Wu
31 What You’re Doing Is Rather Desperate http://nsaunders.wordpress.com Neil Saunders
32 Public Rambling http://pbeltrao.blogspot.com Pedro Beltrao
33 HubLog Alf Eaton http://hublog.hubmed.org/
34 Open Reading Frame http://www.sennoma.net/ Bill Hooker
35 Nodalpoint http://www.nodalpoint.org/
36 microblogging
37
38 web 1.0: Acceder conocimiento web 2.0: Recoger conocimiento web 3.0: Aplicar conocimiento web 4.0: Generar conocimiento
39 living document
40 El Living Document no es uno que se (re)escribe continuamente como en le enfoque wiki, sino un que actúa como node de interconexión entre otros documentos y bases de datos, mediante el uso de etiquetado colaborativo y ontologías
41 arquitectura
42 user management (FOAF) retrieval SPIannotation SPI ElsevierPubmedBMCCustom whatizit reflectknewcoihop XSLT+DHTML +CSS tag management (MOAT) document management (POAP) web application
43
44
45 interfaces
46 Antileukoproteinase, Secretory leukocyte protease inhibitor, P03973 uniprot: http://www.uniprot.org/uniprot/P03973 genecards: http://www.genecards.org/cgi-bin/carddisp.pl?id=P03973 dasty: http://www.ebi.ac.uk/dasty/client/ebi.php?q=P03973 >sp|P03973|SLPI_HUMAN Antileukoproteinase OS=Homo sapiens GN=SLPI MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGK KRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMG MCGKSCVSPVKA
47 Links uniprot: http://www.uniprot.org/uniprot/$ID$ genecards: http://www.genecards.org/cgi-bin/carddisp.pl?id=$ID$ Add new Retrieve uniprot: http://www.uniprot.org/uniprot/$ID$.txt uniprotXML : http://www.uniprot.org/uniprot/$ID$.xml fasta: http://www.uniprot.org/uniprot/$ID$.fasta Add new For a given annotation you can define links and ways to retrieve information. Links will be shown in the tag popup so you can visit the site Retrieval links will be used to download information in a given format, for example, all protein sequences mentioned in the text. fasta Download ALP Antileukoproteinase Secretory leukocyte protease inhibitor WAP4 HUSI-1 BLPI
48 http://www.wired-marker.org
49 http://www.shiftspace.org/
50
51
52
53
54
55
56
57 web services high thoughput text visualization integration mining data analysis ontologies
58 muchas gracias! Para saber más: http://www.scientifik.infohttp://www.scientifik.info