Producto de la interdisciplina y multidisciplina característica de la era digital, en la que las herramientas informáticas y computacionales se han integrado a la teoría y métodos científicos, han conformado nuevos campos del conocimiento para el estudio de la biodiversidad en sus distintos niveles y enfoques como la informática biológica (biological informatics), la bioinformática, la Informática de la biodiversidad, la e-taxonomía o cibertaxonomía y la informática ecológica.
Utilizaré como ejemplo para desarrollar el tema de la innovación en la información e informática en los estudios sobre biodiversidad a la taxonomía, actualmente existe la posibilidad de tener colecciones de datos digitales (megabases de datos) taxonómicas, curatoriales, bibliográficas y de distribución que se pueden consultar en línea. Existen programas informáticos para sistematizar información taxonómica, realizar claves de indentificación, analizar grandes cantidades de caracteres (moleculares y morfológicos), manejar grandes volúmenes de imágenes y realizar análisis evolutivos complejos por mencionar algunos. Esta “modernización” ha repercutido en la creación de grandes colecciones, el uso de estándares internacionales, el aumento la eficiencia de los procesos y la capacidad de almacenar información, la optimización del meta-análisis e integración información que se encuentra dispersa en tiempo y espacio, el fomento de iniciativas de acceso abierto a la información, la colaboración y el diseño y mantenimiento de macroproyectos nacionales, regionales y mundiales y la publicación de revistas de vanguardia.
1. Informática y biodiversidad:
el caso de la e-taxonomía
Layla Michán
Departamento de Biología Evolutiva, Facultad de Ciencias, UNAM.
laylamichan@ciencias.unam.mx
4. Laboratorio de Ciencimetría, Información e Informática en Ciencias Biológicas
Facultad de Ciencias, UNAM
PROBLEMAS
1. (R)evolución digital en las ciencias biológicas
2. Características de la E-biología
3. Dinámica, estructura y relaciones de la biología reciente
4. Publicación científica en la Web
5. Recursos web y ciberinfraestructura para biología
6. Colecciones de datos
7. Meta-análisis de literatura: bibliometría, análisis de redes, minería de textos,
semántica
TIPOS
1.Biológica ENFOQUE MULTIDISCIPLINARIO
2.Bibliográfica 1.Biología
3.Institucional INFORMACIÓN 2. Ciencias de la información y
BIOLÓGICA documentación
3. Tecnologías de la Información y
ÁREAS comunicación
1.Biodiversidad 4.Ciencias de la computación e informática
2.Biomedicina 5.Historia, sociología y filosofía de la ciencia.
APLICACIONES
1.Análisis de la ciencias biológicas actuales: desarrollo, estructura, relaciones y tendencias
2.Información e informática en ciencias biológicas, relacionadas y afines
3.Obtención de nuevo conocimiento biológico
4.Planeación, evaluación, gestión y política científica
5. La sistemática y/o taxonomía
• Es la subdisciplina de la biología
encargada de la descripción, la
nomenclatura, la clasificación, la teoría y
la historia de la clasificación de los seres
vivos (Wiley, 1981), incluyendo sus bases,
principios, procedimientos y reglas
(Simpson, 1961).
• Constituye el sistema de referencia de la
biología, porque entre sus tareas
principales están: descubrir, identificar,
nombrar y clasificar a los seres vivos.
6. Informática Biológica
•Ciencias de la Información biológica: La recopilación,
clasificación, almacenamiento, recuperación y difusión de la
información biológica, en especial la literatura.
•Bioinformática: Investigación, desarrollo o aplicación de
herramientas computacionales y enfoques para ampliar el uso
de datos biológicos, médicos, de comportamiento o de salud,
incluidos los de adquirir, almacenar, organizar, archivar, analizar
o visualizar estos datos.
•Biología computacional: El desarrollo y aplicación de
métodos de datos analíticos y teóricos, modelos matemáticos
y técnicas computacionales de simulación para el estudio
de sistemas biológicos, conductuales y sociales.
•Informática biológica: estudio de los problemas sobre la
información biológica para su sistematización, recuperación,
manejo, análisis, publicación, difusión e intercambio.
7. e-science/ cyberinfraestructure
• cyberinfraestructure (USA) • e-science (europe)
• United States National Science • United Kingdom's Office
Foundation (NSF) blue-ribbon of Science and
committee in 2003 . Technology in 1999.
• Describe el nuevo ambiente de
investigación apoyado por la
• Se refieren a la
adquisición de datos avanzados, el ciencia a gran escala,
almacenamiento, gestión, que se lleva a cabo a
integración, minería, visualización, través de colaboración
computación y servicios de global habilitada por
procesamiento de información a
través del Internet.
el Internet.
8. Ciberinfraestructura
•Entorno tecnológico-social que permite crear, difundir y
preservar los datos, información y conocimientos
mediante la adquisición, almacenamiento, gestión,
integración, informática, minería, visualización y otros
servicios a través de Internet (NSF 2003, 2007).
•Incluye un conjunto interoperable de diversos
elementos:
–1) Infraestructura, los sistemas computacionales (hardware,
software y redes), servicios, instrumentos y herramientas.
–2) Colecciones de datos.
–3) Grupos virtuales de investigación (colaboratorios y
observatorios).
9. E-ciencia (ciberciencia)
• Resulta del uso y aplicación de la
Ciberinfraestructura en la práctica cientifica,
• Se caracteriza por la inter y multidisciplinariedad.
• Colaboración, la participación de un gran número
de investigadores (en algunos casos cientos)
localizados en diversas regiones y con diferentes
especialidades que se forman grupos trabajo (Hey
y Trefethen, 2005; Barbera et al.,2009).
10. E-ciencia
• Transformación en 30 años:
– Tecnológica
• Computadoras
• Web
• Documentos digitales
– Teórica
• Nuevos campos del conocimiento
– Metodológica
• In sílico
– Social
• Colaboración
• Democratización
• Masiva
– Cultural:
• Acceso abierto
11. Explorar I II
Generales
Colecciones
Metabuscadore Buscadores Editores FUNCIONES
Buscar Buscadores
especializados Proveedores
de datos
s Web 2.0 y 3.0
bibliográficas
• Etiquetar (Tagging)
• Compartir (share)
I. Aplicaciones Web y • Calificar (ranking)
programas • Suscribirse (feeds)
• Comentar
Marcar (marck) II. Colecciones
Sistematizar / Organizar bibliográficas
CARACTERÍSTICAS
Difundir •Personalización
•Inmediatez
•Automatización
•Eficiencia
• Infometría
III. Meta-análisis de
• Análisis de Redes
• Descubrimiento
III
Meta-análisis
literatura
basado en literatura
Layla Michán, 2010
13. Web 2 y 3 para taxonomía
Actualizar
Buscar
Analizar
Marcar
Manejar
Explorar
14. La Web 2.0 (Social)
• Se centra en la capacidad de las personas para colaborar y compartir
información en línea.
• Transición de la Web estática a una dinámica, que es más
organizada.
• Comunicación abierta con un énfasis en comunidades de usuarios e
intercambio de información.
• Ya no sólo se trata de ofrecer la posibilidad de encontrar información,
sino de lograr objetivos específicos, pues es factible, crear, etiquetar
jerarquizar y compartir datos.
• Lenguaje HTLM.
Web 3.0 (Semántica)
• Basada en la idea de añadir metadatos semánticos e información (a
través de mapas cognitivos).
• Desarrollar nuevos sistemas de interoperabilidad que permitan
interpretar metadatos para adaptarse a las acciones de los usuarios .
• Minería de textos y ontologías.
• Lenguajes: XML (etiquetas) y RDF (metadatos).
15. Navegadores COLECCIONES DE
Google, Bing DATOS
Alertas
Bases de datos
Correos electrónicos
Sistemas de
1 Navegar Listas de discusión
información
Agregadores
Proveedores
Recomendación
Buscar
Meta-análisis
Bibliometría
Selección Recuperación Análisis de redes
Descubrimiento Basado en Literatura
2 3
PUBLICACIÓN
PDF
HTLM Lectura Guardar
Marcadores
TXT Google marcadores y
5 4 block
Facebook
Obtener Folkosomias
Referencias metadatos Delicious
Citar
Citeulike
Comentar Gestores de
Gestores de 7 bibliografía
bibliografía Citar mientras
Endnote 6 escribo
Refworks 1/100
Comentar Ciberinfraestructura
Mendeley*
Zotero PDFs
Citeulike* Acrobat
PDF Exchange* Modificado de Hull, 2009
18. Torres-Salinas, D. and E. Delgado-López-Cózar (2009, September). Estrategia para mejorar la difusión de los resultados de
investigación con la web 2.0. El Profesional de la Informacion 18 (5), 534-539.
26. Aplicación
para
publicación
de datos
taxonómicos
http://www.gbif.org/informatics/primary-data/publishing/
27.
28.
29. La Web semántica
• (del inglés semantic web) es la "Web de los datos".1
• Se basa en la idea de
añadir metadatos semánticos y ontológicos a la World
Wide Web.
• Esta información adicional —que describen el
contenido, el significado y la relación de los datos— se
deben proporcionar de manera formal, para que así sea
posible evaluarlas automáticamente por máquinas de
procesamiento.
• El objetivo es mejorar Internet ampliando
la interoperabilidad entre los sistemas informáticos
usando "agentes inteligentes". Agentes inteligentes son
programas en las computadoras que buscan
información sin operadores humanos.
30. Tim Berners-Lee, el creador de la
idea, la expresó de la siguiente
manera:
"Mi sueño es una Web en la que las
máquinas sean capaces de analizar
todos los datos –contenido, enlaces
y transacciones entre la gente y los
ordenadores–. La 'Web Semántica',
que haría esto posible, está todavía
por llegar, pero cuando llegue, la
rutina de nuestras compras,
burocracia y vida diaria será
gestionada por máquinas hablando
con máquinas. Los 'Agentes
Inteligentes' que han sido
anunciados durante décadas se
harán por fin realidad".
31. Interoperatibilidad
La interoperabilidad es la propiedad de un producto o
sistema, cuyas interfaces se conocen por
completo, para trabajar con otros productos o sistemas,
presentes o futuros, sin ningún tipo de acceso
restringido o de ejecución.
33. XML
XML, siglas en inglés
de eXtensible Markup Language ('lenguaje
de marcas extensible'), es
un metalenguaje extensible de etiquetas
desarrollado por el World Wide Web
Consortium (W3C).
34. Ontologías taxonomía
• Una ontología es una manera formal de
representar el conocimiento en el que los
conceptos son descritos por su significado y
su relación con los demás.
• Se asignan identificadores únicos que se
asocian con cada concepto
en ontologías biológicas (bio-
ontologías) puede ser utilizada para enlazar
información de diversas bases de datos.
41. Leong, L. K. W., Coddington, P., & Wendelborn, A. (2005). Data grid services for biodiversity
informatics.
URL http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.86.9774
43. Guralnick, R., & Hill, A. (2009). Biodiversity informatics: automated approaches for documenting global biodiversity patterns and
processes. Bioinformatics , 25 (4), 421-428.
URL http://dx.doi.org/10.1093/bioinformatics/btn659
44. Cómputo en grid
• No hay otro gran avance tecnológico que
haya demostrado el poder de
los individuos que el grid computing.
• Donar su tiempo en la computadora sin usar.
•
45.
46.
47. Cloud computing (cómputo en nube)
Es un enfoque transformador de la computación que involucra
muchos aspectos, entre los que se incluyen:
algoritmos a gran escala que se ejecutan en diversos conjuntos de
datos (estructurados, semi-estructurados y no estructurados),
almacenados en grandes equipos con enormes cantidades de datos
de enorme,
utilidades basadas en la rápida provisión de recursos informáticos
personalizados, y la web ubicua con aplicaciones accesibles
desde cualquier lugar.
Sin embargo, es mucho más que lo que la tecnología promete:
transformar radicalmente nuestra manera de interactuar con
la información.
48. Ecosistemas digitales
• En el mundo de Internet, el rápido crecimiento y el uso exponencial de
los medios digitales ha dado lugar a la aparición de
entornos virtuales denominados ecosistemas digitales.
• Están integrados por varias entidades independientes, como: individuos,
organizaciones, servicios, software y aplicaciones para
compartir una o varias misiones y centrarse sobre las interacciones e
interrelaciones entre ellos.
• Permiten la auto-organización de los ambientes, gracias a la
recombinación y la evolución de sus "componentes digitales", en
los que los recursos proporcionados
por cada entidad están bien conservadas y son factibles de gestionar y
utilizar en conjunto.
• Debido a la naturaleza multidisciplinar de los ecosistemas digitales
y sus características, son muy complejos para el estudio y diseño.
http://130.102.71.54/medes
49. Programas informáticos
Software para :
• Sistematizar información taxonómica,
• Realizar claves de indentificación,
• Analizar grandes cantidades de caracteres
(moleculares y morfológicos),
• Manejar grandes volúmenes de imágenes,
• Hacer análisis fenéticos y filogenéticos
complejos.
50.
51. Ventajas/Desventajas
• Estos avances tecnológicos han tenido sus
ventajas y desventajas (Godfray et al. 2007).
• Entre las primeras están que permiten el uso
de estándares internacionales,
• Aumentan la eficiencia de los procesos y la
capacidad de almacenar información,
• Optimizan el meta-análisis
• Integran información que se encuentra
dispersa en tiempo y espacio.
53. Colecciones
• Colecciones de datos digitales (megabases de datos)
taxonómicas, curatoriales, bibliográficas y de distribución
(Shanmughavel 2007) que se pueden consultar en línea;
• resaltan iniciativas mundiales como encyclopedia of life
(http://www.eol.org/),
• tree of life (http://tolweb.org/tree/),
• genBank (http://www.ncbi.nlm.nih.gov/Genbank/),
• barcode of life (http://www.barcoding.si.edu/),
• Biodiversity Heritage Library
(www.biodiversitylibrary.org/) y
• Global Biodiversity Information Facility
(http://data.gbif.org/welcome.htm).
• Biosis, Zoological Record y Epic
69. Algunas cifras
•Ulrichs´s 300, 000 revistas.
•DOAJ: 6, 715
•La revista científica PLoS ONE publicó su artículo número
10.000 (1 dic 2006- 2 abril 2010, 41 meses)
•PubMed Central 2.2 millones de artículos.
•PubMed 20 millones de registros.
•Scopus más de 40 millones de registros.
•ISI Web of Knowledge (WOK) 40 millones de registros.
•Google Scholar
•Arif Jinha en la Universidad de Ottawa ha estimado
recientemente que el número de artículos publicados desde
siempre es alrededor de 50 millones.
–Desde 1665, cuando inició la Philosophical Transactions of
the Royal Society,
•http://duncan.hull.name/2010/07/15/fifty-million/
73. Mundiales
BIOLÓGICA DOCUMENTAL
INSTITUCIONAL
Investigación sobre biodiversidad
Genetic databases
Organismos y sus partes
Páginas
Memorias
electrónicas
Diarios y Artículos
Etiquetas Catálogos
Checklist
índices y Libros
Colecciones abstracts
Revisiones
Bibliotecas y
Catálogos hemerotecas
Libros de texto
Bases de datos Enciclopedias
Bases de datos bibliográficas Manuales
biológicas
Bases de datos
institucionales
Science Citation Index®
The Tree of Life
Zoological Record
BIOSIS Previews
Biological Abstracts
75. Boquím y biol mol
Periódica
Agricultura
Biosis
CAB
SCI
ZR
Forestal
Enfer infecc
Fisiología
Taxonomía América Latina
Biol reprod
Parasitología
Taxonomía AL
Genética y herencia
Biodiv y conserv
Biol mar y acuát
Paleontología
Botànica
Anat y morf
Cienc biolog
Ecol y cienc amb
Zooloogía
Biol Evolut
0
100
90
80
70
60
50
40
30
20
10
%
76. Acceso abierto
• Costo de la literatura científica.
• La ciencia se subvenciona con fondos
gubernamental (públicos).
• Mandatos
– Welcome trust
– NIH
• No hay mandatos para biodiversidad.
77. • All research would be more useful if it were
OA. But I’m an incrementalist. I’ll take what
we can get when we can get it. I don’t expect
OA to classified military research, and I don’t
even argue for it. I don’t expect OA to
patentable discoveries until after the
discoverers voluntarily decide to publish. I
don’t expect OA to copyrighted books except
when OA would increase net sales or bring
benefits that exceed royalties.
78. Gratuito: se refiere a que la consulta del
documento completo en línea es sin costo
Repositorio Acceso
abierto
Libre: ofrece algunos derechos de uso adicionales
como el de modificar y distribuir la obra siempre y
cuando se cite a el o los autores
Acceso abierto vía
oro (Gold Route)
Licencia que especifica los derechos de uso:
Acceso abierto vía Creative Commons
verde (Green Route) (http://creativecommons.org.mx/ )
79. e-print (e-impreso)
Es la versión digital de un documento de investigación (generalmente un
artículo de revista, pero también podría ser una tesis, ponencias, capítulos de
libros, o un libro) que está accesible en línea porque ha sido depositado en un
repositorio digital
Interactividad
Diseño
e-print Integración
Agregación
Movilidad
Pre-prints (artículos Post-prints (la versión
antes de que sean resultado de la revisión por
evaluados por pares) pares)
80. Revistas electrónicas de vanguardia
• Formato electrónico
– Datos complementarios
– Barato
– Múltiples formatos
– Identificadores digitales
– Interactividad
– Sin límites de extensión
• Eficiencia e inmediatez
• Acceso abierto
• Uso libre
• Evaluación por pares identificados (no anónimos)
• Indización y archivo en bases de datos
• Indicadores bibliométricos
– Las medidas de impacto
– Información sobre la Cita
– artículos relacionados
• Web 2.0 social
– Marcadores sociales
– Comentarios y notas
– Blog de cobertura
• Código de ética de publicación científica explícito
• Políticas explícitas de Autoarchivo
81. (Hull, D. et al., 2008)
Figure 1. A mind map [207] summarizing the contents of this article in a convenient manner.
doi:10.1371/journal.pcbi.1000204.g001
82.
83. The Advantages
• Unmatched speed of publication
• In this era of elevated extinction rates of World's living animal species, rapid publications of taxonomic papers are not only desirable to
authors, but also important to our science. Zootaxa aims to publish most manuscripts within a month or two after the final revisions are
accepted by editors.
•
• Great flexibility
• Unlike many other journals, Zootaxa does not restrict the length of manuscripts. A paper of a few pages describing a new species is not too
short and a monograph of a few hundred pages is not too long. The only requirement is that peers/editors consider it a quality paper that is
well-presented and makes a good contribution to animal diversity research. As an option for monographs, ISBNs are assigned to papers of
60 pages or more.
Subscription is also flexible. You can have a standing order to the online or print edition, or both. You can also have a standing order to a
subset of papers (e.g. papers on insects, papers on fishes). You can also purchase individual papers and both PDF or paper copies can be
ordered this way.
•
• Maximal online exposure
Accessed daily by more systematic zoologists daily than any other zoology journal, your papers are more likely to be read and cited if you
publish them in Zootaxa.
• Minimized cost to authors and readers
No page charge is required for publication of papers or monographs. Free e-reprint (a printable, high-resolution PDF) is also provided for
authors' personal use (including exchange with other individual scientists, but not for deposition in libraries/websites/ftp-sites for public
access). Authors with funding for publication can opt to pay a fee of US$20 per printed page to make his/her paper free online at this site.
Colour images can be published in the online edition without any fees to authors.
Unlike many other journals, which require subscribers to buy a full issue or volume containing many papers not needed by a particular
reader, Zootaxa allows subscribers to purchase each individual paper based on his/her needs and budget. An issue cost as little as
US$4.00.
• Optimized use of technology
Internet will be used to maximize the benefits of online journals: reduced cost in production and delivery, enhanced access, and interactive
links in online files. The print edition is also produced concurrently for permanent records, using state-of-the-art printing technology.
•
• Environmental soundness
The use of paper is minimized to save our forests and environment: free e-reprint is provided to authors instead of paper ones so that
authors can print out only enough paper copies that are needed; paper reprints can be ordered as few as 25 copies to avoid waste;
correspondence /invoices to subscribers are sent electrically without paper whenever possible; submissions and reviews of manuscripts are
handled electronically whenever possible.
87. Browse I Aplicaciones Web II Colecciones bibliográficas
Web Metabrowser web browsers Libraries
Browsers s specialized
Editors
Suppliers
Search
Information systems
Bookmark Indexes and catalogs
Manage
Share
III Meta-analisis
• Scientometrics
• Network Analysis
• Text mining
Repositories
• Semantics
88. Meta-análisis
• Simultáneo al desarrollo de ciencias de la información
(CI) y las tecnologías la información y la comunicación
(TICS), en especial con el desarrollo de las bases de
datos y la Internet, se han producido formas sistémicas
de análisis de cantidades colosales de información
(terabites).
• Técnica cuantitativa que usa mediciones específicas
para indicar la fuerza (tendencias) de relaciones
variables en los estudios incluidos en el análisis.
• La técnica enfatiza los resultados entre múltiples
estudios en oposición a los resultados obtenidos de
una sola investigación.
90. Meta-análisis
1. Análisis evolutivos
2. Bibliometría (cienciometría, infometría, cienciometría,
cibermetría, alt-metría): Volumen de publicaciones,
productividad y temática de la investigación
3. Análisis de Redes: Conexiones entre nodos que muestran
información y sus relaciones.
4. Minería de Textos (Descubrimiento Basado en Literatura,
descubrimiento basado en bases de datos) : Vinculación de
conceptos para la obtención de nuevo conocimiento
5. Semántica: Es un conjunto de estándares y tecnologías
que proporciona herramientas para una caracterización
explícita de la semántica de la información para encontrar
información distribuida heterogéneamente y relacionada.
91. Propósitos
1. Recuperación de información.
2. Obtención de nuevo conocimiento.
3. Evaluación.
4. Análisis, desarrollo, estructura y relaciones
de la dinámica científica.
106. • Esta investigación se lleva a cabo
gracias al financiamiento de:
• DGAPA, UNAM. Proyecto PAPIME PE
201509
• CONACYT, Ciencia Básica. Proyecto
13276 2011-2014.
107. Licencia Creative
Commons
Forma de citar este trabajo
Michán, L. 2011. Presentación
http://creativecommons.org/licenses/by/3.0/deed.es_GT