SlideShare una empresa de Scribd logo
1 de 35
Búsqueda empresarial conAutonomyIDOL 7 Gustavo  Muñoz
Objetivo Presentar un panorama de la tecnología de la solución de Búsqueda Empresarial y presentar la opción de IDOL Autonomy.
Agenda Introducción IDOL Arquitectura Bases matemáticas Funcionalidades Clave ¿Desarrolladores? Beneficios Posicionamiento en el mercado Desempeño
Introducción No es Google o MS Live, ¿qué puede haber?
InTRODUCCIÓN Meaning-basedsearch
INTRODUCCIÓN + 80% es no estructurada o semi estructurada. Keywords no son suficientes – CONTEXTO Operadores booleanos no siempre logra dar en el clavo en texto libre –CONTEXTO Page Ranking –  Intranets (ligas artificiales) Lo más general primero: keywordsexpert (saber la info desde antes).
Introducción (2) Se hace necesaria una plataforma de infraestructura de la información que gestione todos los tipos de información. Esta plataforma permitiría a los ordenadores no sólo procesar datos estructurados sino también ingentes cantidades de datos semi y no estructurados a partir de un índice relacional global
Intelligent Data OperatingLayer(IDOL) Server La tecnología de Autonomy automatiza la gestión, el procesamiento y el suministro de información estructurada y desestructurada a partir de fuentes internas y externas dispares.  Se integra con todos los sistemas heredados conocidos, eliminando la necesidad por parte de las organizaciones de reunir múltiples sistemas y soportar sus distintos componentes.
SOLUCIÓN DE BÚSQUEDA HERRAMIENTAS COLABORATIVAs IDOL INTELLIGENT DATA OPERATING LAYER CORREO ELECTRÓNICO INTEGRACIÓN DOCUMENTOS VIRAGE ETALK CONECTORES  INTERNET INFORMACIÓN  ESTRUCTURADA INFORMACIÓN  NO  ESTRUCTURADA   LLAMADAS TELEFÓNICAS BASES DE DATOS APLICACIONES XML AUDIO + VIDEO MÁS DE 1000 FORMATOS DIFERENTES
INTEGRACIÓN DE LA INFORMACIÓN ÍNDICES METADATOS HERRAMIENTAS COLABORATIVAS LOTUS, MS EXCH, . Proceso de Indexación Proceso de Sincronización CORREO ELECTRÓNICO CONECTORES DE ACCESO DOCUMENTOS PDF, TEXTO… HTTP VOZ + AUDIO + VIDEO ODBC + ORACLE FILE SYSTEM INTERNET LLAMADAS TELEFÓNICAS FUENTES DE INFORMACIÓN BASES DE DATOS APLICACIONES SAP, SIEBEL,,.. AUDIO + VIDEO
BÚSQUEDA INTELIGENTE DE LA INFORMACIÓN BÚSQUEDA  INTELIGENTE BÚSQUEDA CONCEPTUAL CORRELACIÓN AUTOMÁTICA HIPER-LIGAS AUTOMÁTICAS CORRECCIÓN ORTOGRÁFICA FILTROS DE BÚSQUEDA PARAMETRIZABLES IDENTIFICACIÓN DE TESAUROS SOPORTE PARA MÚLTIPLES LENGUAJES HERRAMIENTAS COLABORATIVAS LOTUS, MS EXCH, . IDOL  Algoritmos aplicados sobre el lenguaje Bayes  y  Shannon CORREO ELECTRÓNICO DOCUMENTOS PDF, TEXTO… INTEGRACIÓN DE LA INFORMACIÓN INTERNET LLAMADAS TELEFÓNICAS FUENTES DE INFORMACIÓN BASES DE DATOS APLICACIONES SAP, SIEBEL,,.. AUDIO + VIDEO
ORGANIZACIÓN DE LA INFORMACIÓN ORGANIZACIÓN DE LA INFORMACIÓN DEFINICIÓN / REUTILIZACIÓN DE MÚLTIPLES TAXONOMÍAS COLABORACIÓN  AGRUPACIÓN CONCEPTUAL CATEGORIZACIÓN  AUTOMÁTICA PERSONALIZACIÓN HERRAMIENTAS COLABORATIVAS LOTUS, MS EXCH, . IDOL  Algoritmos aplicados sobre el lenguaje Bayes  y  Shannon CORREO ELECTRÓNICO DOCUMENTOS PDF, TEXTO… INTEGRACIÓN DE LA INFORMACIÓN INTERNET LLAMADAS TELEFÓNICAS FUENTES DE INFORMACIÓN BASES DE DATOS APLICACIONES SAP, SIEBEL,,.. AUDIO + VIDEO
MONITOREO DE LA INFORMACIÓN MONITOREO DE LA INFORMACIÓN AUDIO   VIDEO OTROS FORMATOS AGENTES PERSONALIZADOS ALERTAS MAIL, SMS LLAMADAS TELEFÓNICAS       ETALK     VIRAGE                                            IDOL CORREO ELECTRÓNICO DOCUMENTOS PDF, TEXTO, CALC, … AUDIO & VIDEO INTEGRACIÓN DE LA INFORMACIÓN INTERNET FUENTES DE INFORMACIÓN APLICACIONES SAP, SIEBEL,.. BASES DE DATOS XML LLAMADAS TELEFÓNICAS
SOLUCIÓN INTEGRAL INTERFACES PORTAL IN A BOX RETINA PORTLETS ACI API   INTEGRATION J2EE   / .NET IDOLme AWE IDOL SERVER IDOL BÚSQUEDA CONCEPTUAL•HIPERLINK AUTOMÁTICO•CATEGORIZACIÓN AUTOMÁTICA•TAXONOMÍAS•AGENTESPERSONALIZADOS•NOTIFICACIÓN• RELEVANCIA CONCEPTUAL•CLUSTERING•SOPORTE MULTI LENGUAJE IAS SEGURIDAD ACL•SSL•LDAP DASHBOARD ADMINISTRACIÓN LOGS•ESTADISTICAS HERRAMIENTAS COLABORATIVAs CORREO ELECTRÓNICO DOCUMENTOS CONECTORES Y ANÁLISIS HTTP•FTP•FILESYSTEM•POP3•OPENTEXT•NOTES•EXCHAGE•DOCUMENTUM•ODBC•SQL•DB2•ORACLE•SYBASE•INFORMIX•SAP•SIEBEL•SHAREPOINT•+ DE 1000 FORMATOS DIFERENTES VIRAGE ANALISIS Y MONIOREO AUDIO Y VIDEO ETALK ANALISIS Y MONITOREO  CALL CENTER INTERNET FUENTES DE INFORMACIÓN  BASES DE DATOS APLICACIONES XML AUDIO + VIDEO
Arquitectura
Bases Matemáticas Redes y estadística bayesianas Entre más información tengas más precisa será tu visión del mundo Información previa debe ser integrada para mejorar nuevos datos. Esto nos da varios beneficios: AdaptiveProbabilistic Concept Modeling–correlación entre agentes e información. Agentes pueden ser entrenados.
Bases matemáticas Teoría de Información (Shannon) Entropía o medida de incertidumbre en la información puede es medida. Si la probabilidad de las palabras son las mismas en un texto, el texto es aleatorio. Es decir, redundante. Sin valor. Detectar secciones relevantes, dada que su entropía es baja. Extraer conceptos en medio de la redundancia. Entre menos aparezca una unidad de comunicación más información dará. Así se encuentran los conceptos más importantes en un documento.
Funcionalidades clave Hipervinculación automática Elaboración automática de resúmenes Agrupación automática Eduction Interlinking Visualización de agrupaciones Categorización automática Generación automática de taxonomías Agentes personalizados y alertas
Funcionalidades clave Hipervinculaciónautomática IDOL permite vincular de forma manual y completamente automática fragmentos de información relacionados independientemente de su formato.  Estos datos se vinculan a contenidos contextualmente similares y pueden utilizarse para recomendar artículos relacionados, documentos, productos o servicios a fines o conceptos de correo de voz y vídeo.
Funcionalidades clave Elaboración automática de resúmenes Para cada contenido, IDOL elabora un resumen de la información incluyendo los conceptos más destacados.  Además, pueden elaborarse resúmenes vinculados al contenido de la consulta original, lo que permite proporcionar el resumen dinámico más adecuado en los resultados de una consulta dada.
Funcionalidades clave Agrupación automática IDOL puede tomar un gran repositorio de datos y partirlo automáticamente de forma que se agrupe la información similar, incluso procedente de formatos distintos.  Cada agrupación representa un área conceptual de la base de conocimientos, lo que hace que les resulte más sencillo a las empresas identificar los temas inherentes.
Funcionalidades clave Visualización de agrupaciones IDOL proporciona tres interfaces de usuario intuitivas basadas en Java (espectrógrafo, mapa 2D y mapa 3D) para hacer visibles las agrupaciones e identificar fácilmente las tendencias clave de un intervalo de tiempo especificado.
Funcionalidades clave Categorización automática Se extraen categorías precisas a partir de los conceptos encontrados en el contenido no estructurado, lo que garantiza que todos los datos se clasifiquen en el contexto correcto con la mayor precisión.  Las taxonomías heredadas existentes pueden conservarse o mejorarse con la comprensión contextual.
Funcionalidades clave Eduction Identificar relaciones entre documentos en servidores en diferentes lugares geográficamente, en diferentes unidades de negocio. Se crea estructura de contenido no estructurado propagando contenido clave en una base de datos.
Funcionalidades Clave Interlinking Se identifican subáreas de documentos para las cuales hay ligas relevantes y se insertan hipervínculos en el documento.
Funcionalidades clave Generación automática de taxonomías Comprensión conceptual de la información  Generación automática de taxonomías Agnosticismo  taxonomías a partir de cualquier tipo de datos, ya sean estructurados o no estructurados.  Taxonomía actualizada automáticamente con nuevos datos. Aproximación Manual (problemas) No aprende –estática Escalabilidad (error de clasificación cuando crecen las etiquetas). Interoperabilidad de la clasificación.
Funcionalidades clave Generación automática de taxonomías (cont.) Mejor de ambos mundos: se pueden editar y refinar las taxonomías manualmente. Operadores y modificadores. Seleccionar documentos y textos para entrenar al motor. Excluír documentos. Peso para diferentes lugares donde una palabra está.
Funcionalidades clave Agentes personalizados y alertas IDOL le permite a los usuarios definir Agentes para supervisar en todo momento la información sobre temas específicos a partir de distintas fuentes de datos.  Definirse o formarse expresamente. Entrenando al motor mostrándole un documento, vídeo u otro contenido que coincida con los intereses del usuario.
Funcionalidades clave Redes de colaboración y especialización Dado que IDOL puede comprender los intereses de la persona a partir de la navegación, el consumo de contenidos y/o la contribución de contenidos, también puede relacionar automáticamente a usuarios con agentes de intereses explícitos comunes o perfiles implícitos.
¿Desarrolladores? API en Java y .NET en la capa de servicios que ofrece toda la funcionalidad básica con la ventaja de parametrizar finamente toda la funcionalidad. Capa de servicios de negocio (de alto nivel) que atienden requerimientos puntuales de diferentes verticales (Seguridad, Administración del Conocimiento, Sector Financiero)
Beneficios Despliegue de información relevante y correlacionada de manera automática. Asegurar el desempeño, tiempo de respuesta y disponibilidad (alta disponibilidad) de la herramienta de búsquedas. Generación de reportes de estadísticas de uso del Sistema. Posibilidad de integrar la solución de búsquedas en cualquier Portal que requiera capacidades de búsqueda o localización de información.
Beneficios (2) Posibilidad de escalamiento en el tiempo ante iniciativas exitosas con número creciente de usuarios. Disminución de los esfuerzos en desarrollos manuales para obtener los resultados requeridos por los usuarios para la herramienta de búsquedas. Agnóstico al idioma. Aunque también se ofrece traducciones.
Posicionamiento
Desempeño Un solo motor IDOL puede: Soportar más de 470 millones de documentos en plataformas de 64-bit.  Ejecutar más de 2.600 consultas por segundo, con tiempos de respuesta menores a un segundo en una sola máquina con dos procesadores cuando se utiliza contra 70 millones de piezas de contenido. Apoyo a cientos de miles de usuarios de la empresa, o millones de web. Los usuarios tienen acceso a cientos de terabytes de datos  Guardar espacio de almacenamiento con una huella global de menos del 15% del tamaño del archivo original
Muchas gracias

Más contenido relacionado

Destacado

Organigrama
OrganigramaOrganigrama
Organigrama
jpinyol2
 
Tecnología de objetos de aprendizaje.
Tecnología de objetos de aprendizaje.Tecnología de objetos de aprendizaje.
Tecnología de objetos de aprendizaje.
Gris300984
 
Organigrama de zer pedagògic
Organigrama de zer pedagògic Organigrama de zer pedagògic
Organigrama de zer pedagògic
jpinyol2
 
Problemilla
ProblemillaProblemilla
Problemilla
maribel
 
Kit de supervivència pla d'acollida mestres
Kit de supervivència pla d'acollida mestresKit de supervivència pla d'acollida mestres
Kit de supervivència pla d'acollida mestres
jpinyol2
 
Presentacion Game Engines
Presentacion Game EnginesPresentacion Game Engines
Presentacion Game Engines
Futura Networks
 
Practico 10 Parte 2
Practico 10 Parte 2Practico 10 Parte 2
Practico 10 Parte 2
msrobter
 

Destacado (20)

Capital Virtual
Capital VirtualCapital Virtual
Capital Virtual
 
Organigrama
OrganigramaOrganigrama
Organigrama
 
Tecnología de objetos de aprendizaje.
Tecnología de objetos de aprendizaje.Tecnología de objetos de aprendizaje.
Tecnología de objetos de aprendizaje.
 
M Ovistar Developers Platform Jose Valles
M Ovistar Developers Platform Jose VallesM Ovistar Developers Platform Jose Valles
M Ovistar Developers Platform Jose Valles
 
Semblanza ps20 campus
Semblanza ps20 campusSemblanza ps20 campus
Semblanza ps20 campus
 
Como Hacer Dinero Con Software Libre
Como Hacer Dinero Con Software LibreComo Hacer Dinero Con Software Libre
Como Hacer Dinero Con Software Libre
 
El Barrio
El BarrioEl Barrio
El Barrio
 
Organigrama de zer pedagògic
Organigrama de zer pedagògic Organigrama de zer pedagògic
Organigrama de zer pedagògic
 
Problemilla
ProblemillaProblemilla
Problemilla
 
Kit de supervivència pla d'acollida mestres
Kit de supervivència pla d'acollida mestresKit de supervivència pla d'acollida mestres
Kit de supervivència pla d'acollida mestres
 
Encuentros cercanos
Encuentros cercanosEncuentros cercanos
Encuentros cercanos
 
Robot Markovito6
Robot Markovito6Robot Markovito6
Robot Markovito6
 
Presentacion Game Engines
Presentacion Game EnginesPresentacion Game Engines
Presentacion Game Engines
 
La nueva pragmática fotográfica derivada de los usos de la Web
La nueva pragmática fotográfica derivada de los usos de la WebLa nueva pragmática fotográfica derivada de los usos de la Web
La nueva pragmática fotográfica derivada de los usos de la Web
 
Practico 10 Parte 2
Practico 10 Parte 2Practico 10 Parte 2
Practico 10 Parte 2
 
Redacción para Blogs
Redacción para BlogsRedacción para Blogs
Redacción para Blogs
 
Word pressttnl
Word pressttnlWord pressttnl
Word pressttnl
 
128184587 mecanica-de-materiales
128184587 mecanica-de-materiales128184587 mecanica-de-materiales
128184587 mecanica-de-materiales
 
Robot Markovito5
Robot Markovito5Robot Markovito5
Robot Markovito5
 
Socialmediarattinger
SocialmediarattingerSocialmediarattinger
Socialmediarattinger
 

Similar a Google Enterprise Search

Introducción Taller de Atlas.ti. Magíster Psicología Social. 2013
Introducción Taller de Atlas.ti. Magíster Psicología Social. 2013Introducción Taller de Atlas.ti. Magíster Psicología Social. 2013
Introducción Taller de Atlas.ti. Magíster Psicología Social. 2013
AleEnergici
 
Capitulo 8. Metadatos
Capitulo 8. MetadatosCapitulo 8. Metadatos
Capitulo 8. Metadatos
Coatzozon20
 

Similar a Google Enterprise Search (20)

Base de datos.1
Base de datos.1Base de datos.1
Base de datos.1
 
La integración de información en las herramientas de Business Intelligence
La integración de información en las herramientas de Business IntelligenceLa integración de información en las herramientas de Business Intelligence
La integración de información en las herramientas de Business Intelligence
 
Reputation management con IDOL
Reputation management con IDOLReputation management con IDOL
Reputation management con IDOL
 
Introducción Taller de Atlas.ti. Magíster Psicología Social. 2013
Introducción Taller de Atlas.ti. Magíster Psicología Social. 2013Introducción Taller de Atlas.ti. Magíster Psicología Social. 2013
Introducción Taller de Atlas.ti. Magíster Psicología Social. 2013
 
Soluciones de búsqueda corporativa
Soluciones de búsqueda corporativaSoluciones de búsqueda corporativa
Soluciones de búsqueda corporativa
 
Bdoo
BdooBdoo
Bdoo
 
Diapositivas Base de Datos I
Diapositivas Base de Datos IDiapositivas Base de Datos I
Diapositivas Base de Datos I
 
Buscador semántico INVENIO
Buscador semántico INVENIOBuscador semántico INVENIO
Buscador semántico INVENIO
 
Buscador semántico INVENIO
Buscador semántico INVENIOBuscador semántico INVENIO
Buscador semántico INVENIO
 
Buscador semántico INVENIO
Buscador semántico INVENIOBuscador semántico INVENIO
Buscador semántico INVENIO
 
Buscador semántico INVENIO
Buscador semántico INVENIOBuscador semántico INVENIO
Buscador semántico INVENIO
 
Buscador semántico INVENIO
Buscador semántico INVENIOBuscador semántico INVENIO
Buscador semántico INVENIO
 
Buscador semántico INVENIO
Buscador semántico INVENIOBuscador semántico INVENIO
Buscador semántico INVENIO
 
Buscador semántico INVENIO
Buscador semántico INVENIOBuscador semántico INVENIO
Buscador semántico INVENIO
 
Capitulo 8. Metadatos
Capitulo 8. MetadatosCapitulo 8. Metadatos
Capitulo 8. Metadatos
 
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...
 
Base de Datos
Base de DatosBase de Datos
Base de Datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
TEMA 1: LENGUAJE DE PROGRAMACIÓN.
TEMA 1: LENGUAJE DE PROGRAMACIÓN. TEMA 1: LENGUAJE DE PROGRAMACIÓN.
TEMA 1: LENGUAJE DE PROGRAMACIÓN.
 
Introduccion SRI
Introduccion SRIIntroduccion SRI
Introduccion SRI
 

Más de Futura Networks

Dot dotpwn v3.0beta campus party méxico 2011
Dot dotpwn v3.0beta   campus party méxico 2011Dot dotpwn v3.0beta   campus party méxico 2011
Dot dotpwn v3.0beta campus party méxico 2011
Futura Networks
 
Dot dotpwn v3.0beta campus party méxico 2011
Dot dotpwn v3.0beta   campus party méxico 2011Dot dotpwn v3.0beta   campus party méxico 2011
Dot dotpwn v3.0beta campus party méxico 2011
Futura Networks
 
Pen test: El arte de la guerra
Pen test: El arte de la guerraPen test: El arte de la guerra
Pen test: El arte de la guerra
Futura Networks
 
Zonas habitables en las galaxias
Zonas habitables en las galaxiasZonas habitables en las galaxias
Zonas habitables en las galaxias
Futura Networks
 
La música en el siglo XXI
La música en el siglo XXILa música en el siglo XXI
La música en el siglo XXI
Futura Networks
 
Cpmx3 computo forense reloaded
Cpmx3   computo forense reloadedCpmx3   computo forense reloaded
Cpmx3 computo forense reloaded
Futura Networks
 
Eduardo ruiz seguridad y redes
Eduardo ruiz seguridad y redesEduardo ruiz seguridad y redes
Eduardo ruiz seguridad y redes
Futura Networks
 
Perdida de datos campus party
Perdida de datos   campus partyPerdida de datos   campus party
Perdida de datos campus party
Futura Networks
 
Introduccion a la acustica forense
Introduccion a la acustica forenseIntroduccion a la acustica forense
Introduccion a la acustica forense
Futura Networks
 
éTica, responsabilidad, transparencia en la comunicación digital cp mexico ...
éTica, responsabilidad, transparencia en la comunicación digital   cp mexico ...éTica, responsabilidad, transparencia en la comunicación digital   cp mexico ...
éTica, responsabilidad, transparencia en la comunicación digital cp mexico ...
Futura Networks
 

Más de Futura Networks (20)

Ibm
Ibm Ibm
Ibm
 
Dot dotpwn v3.0beta campus party méxico 2011
Dot dotpwn v3.0beta   campus party méxico 2011Dot dotpwn v3.0beta   campus party méxico 2011
Dot dotpwn v3.0beta campus party méxico 2011
 
Dot dotpwn v3.0beta campus party méxico 2011
Dot dotpwn v3.0beta   campus party méxico 2011Dot dotpwn v3.0beta   campus party méxico 2011
Dot dotpwn v3.0beta campus party méxico 2011
 
Pen test: El arte de la guerra
Pen test: El arte de la guerraPen test: El arte de la guerra
Pen test: El arte de la guerra
 
Marte
MarteMarte
Marte
 
Zonas habitables en las galaxias
Zonas habitables en las galaxiasZonas habitables en las galaxias
Zonas habitables en las galaxias
 
Legalidad Digital
Legalidad DigitalLegalidad Digital
Legalidad Digital
 
Ipv6
Ipv6Ipv6
Ipv6
 
La música en el siglo XXI
La música en el siglo XXILa música en el siglo XXI
La música en el siglo XXI
 
Wordpress Ninja
Wordpress NinjaWordpress Ninja
Wordpress Ninja
 
Cpmx3 computo forense reloaded
Cpmx3   computo forense reloadedCpmx3   computo forense reloaded
Cpmx3 computo forense reloaded
 
Campus Party Mexico 2010
Campus Party Mexico 2010Campus Party Mexico 2010
Campus Party Mexico 2010
 
Eduardo ruiz seguridad y redes
Eduardo ruiz seguridad y redesEduardo ruiz seguridad y redes
Eduardo ruiz seguridad y redes
 
Gelattina usabilidad
Gelattina usabilidadGelattina usabilidad
Gelattina usabilidad
 
CP Green Apps Challenge
CP Green Apps ChallengeCP Green Apps Challenge
CP Green Apps Challenge
 
Socialocation
SocialocationSocialocation
Socialocation
 
Perdida de datos campus party
Perdida de datos   campus partyPerdida de datos   campus party
Perdida de datos campus party
 
Introduccion a la acustica forense
Introduccion a la acustica forenseIntroduccion a la acustica forense
Introduccion a la acustica forense
 
éTica, responsabilidad, transparencia en la comunicación digital cp mexico ...
éTica, responsabilidad, transparencia en la comunicación digital   cp mexico ...éTica, responsabilidad, transparencia en la comunicación digital   cp mexico ...
éTica, responsabilidad, transparencia en la comunicación digital cp mexico ...
 
Green computing
Green computingGreen computing
Green computing
 

Último

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 
QUINTA SEXTA GENERACION de COMPUTADORAS
QUINTA  SEXTA GENERACION de COMPUTADORASQUINTA  SEXTA GENERACION de COMPUTADORAS
QUINTA SEXTA GENERACION de COMPUTADORAS
Marc Liust
 
Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
Yanitza28
 

Último (18)

Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...
 
10°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-810°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-8
 
Función del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacionFunción del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacion
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
2023 07 Casos prácticos para Realidad aumentada, metaverso y realidad extendida
2023 07 Casos prácticos para Realidad aumentada, metaverso y realidad extendida2023 07 Casos prácticos para Realidad aumentada, metaverso y realidad extendida
2023 07 Casos prácticos para Realidad aumentada, metaverso y realidad extendida
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptxinfor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
QUINTA SEXTA GENERACION de COMPUTADORAS
QUINTA  SEXTA GENERACION de COMPUTADORASQUINTA  SEXTA GENERACION de COMPUTADORAS
QUINTA SEXTA GENERACION de COMPUTADORAS
 
Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
 
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdfpresentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
 
Editorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdfEditorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdf
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptxAVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
 

Google Enterprise Search

  • 2. Objetivo Presentar un panorama de la tecnología de la solución de Búsqueda Empresarial y presentar la opción de IDOL Autonomy.
  • 3. Agenda Introducción IDOL Arquitectura Bases matemáticas Funcionalidades Clave ¿Desarrolladores? Beneficios Posicionamiento en el mercado Desempeño
  • 4. Introducción No es Google o MS Live, ¿qué puede haber?
  • 6. INTRODUCCIÓN + 80% es no estructurada o semi estructurada. Keywords no son suficientes – CONTEXTO Operadores booleanos no siempre logra dar en el clavo en texto libre –CONTEXTO Page Ranking – Intranets (ligas artificiales) Lo más general primero: keywordsexpert (saber la info desde antes).
  • 7. Introducción (2) Se hace necesaria una plataforma de infraestructura de la información que gestione todos los tipos de información. Esta plataforma permitiría a los ordenadores no sólo procesar datos estructurados sino también ingentes cantidades de datos semi y no estructurados a partir de un índice relacional global
  • 8. Intelligent Data OperatingLayer(IDOL) Server La tecnología de Autonomy automatiza la gestión, el procesamiento y el suministro de información estructurada y desestructurada a partir de fuentes internas y externas dispares. Se integra con todos los sistemas heredados conocidos, eliminando la necesidad por parte de las organizaciones de reunir múltiples sistemas y soportar sus distintos componentes.
  • 9. SOLUCIÓN DE BÚSQUEDA HERRAMIENTAS COLABORATIVAs IDOL INTELLIGENT DATA OPERATING LAYER CORREO ELECTRÓNICO INTEGRACIÓN DOCUMENTOS VIRAGE ETALK CONECTORES INTERNET INFORMACIÓN ESTRUCTURADA INFORMACIÓN NO ESTRUCTURADA LLAMADAS TELEFÓNICAS BASES DE DATOS APLICACIONES XML AUDIO + VIDEO MÁS DE 1000 FORMATOS DIFERENTES
  • 10. INTEGRACIÓN DE LA INFORMACIÓN ÍNDICES METADATOS HERRAMIENTAS COLABORATIVAS LOTUS, MS EXCH, . Proceso de Indexación Proceso de Sincronización CORREO ELECTRÓNICO CONECTORES DE ACCESO DOCUMENTOS PDF, TEXTO… HTTP VOZ + AUDIO + VIDEO ODBC + ORACLE FILE SYSTEM INTERNET LLAMADAS TELEFÓNICAS FUENTES DE INFORMACIÓN BASES DE DATOS APLICACIONES SAP, SIEBEL,,.. AUDIO + VIDEO
  • 11. BÚSQUEDA INTELIGENTE DE LA INFORMACIÓN BÚSQUEDA INTELIGENTE BÚSQUEDA CONCEPTUAL CORRELACIÓN AUTOMÁTICA HIPER-LIGAS AUTOMÁTICAS CORRECCIÓN ORTOGRÁFICA FILTROS DE BÚSQUEDA PARAMETRIZABLES IDENTIFICACIÓN DE TESAUROS SOPORTE PARA MÚLTIPLES LENGUAJES HERRAMIENTAS COLABORATIVAS LOTUS, MS EXCH, . IDOL Algoritmos aplicados sobre el lenguaje Bayes y Shannon CORREO ELECTRÓNICO DOCUMENTOS PDF, TEXTO… INTEGRACIÓN DE LA INFORMACIÓN INTERNET LLAMADAS TELEFÓNICAS FUENTES DE INFORMACIÓN BASES DE DATOS APLICACIONES SAP, SIEBEL,,.. AUDIO + VIDEO
  • 12. ORGANIZACIÓN DE LA INFORMACIÓN ORGANIZACIÓN DE LA INFORMACIÓN DEFINICIÓN / REUTILIZACIÓN DE MÚLTIPLES TAXONOMÍAS COLABORACIÓN AGRUPACIÓN CONCEPTUAL CATEGORIZACIÓN AUTOMÁTICA PERSONALIZACIÓN HERRAMIENTAS COLABORATIVAS LOTUS, MS EXCH, . IDOL Algoritmos aplicados sobre el lenguaje Bayes y Shannon CORREO ELECTRÓNICO DOCUMENTOS PDF, TEXTO… INTEGRACIÓN DE LA INFORMACIÓN INTERNET LLAMADAS TELEFÓNICAS FUENTES DE INFORMACIÓN BASES DE DATOS APLICACIONES SAP, SIEBEL,,.. AUDIO + VIDEO
  • 13. MONITOREO DE LA INFORMACIÓN MONITOREO DE LA INFORMACIÓN AUDIO VIDEO OTROS FORMATOS AGENTES PERSONALIZADOS ALERTAS MAIL, SMS LLAMADAS TELEFÓNICAS ETALK VIRAGE IDOL CORREO ELECTRÓNICO DOCUMENTOS PDF, TEXTO, CALC, … AUDIO & VIDEO INTEGRACIÓN DE LA INFORMACIÓN INTERNET FUENTES DE INFORMACIÓN APLICACIONES SAP, SIEBEL,.. BASES DE DATOS XML LLAMADAS TELEFÓNICAS
  • 14. SOLUCIÓN INTEGRAL INTERFACES PORTAL IN A BOX RETINA PORTLETS ACI API INTEGRATION J2EE / .NET IDOLme AWE IDOL SERVER IDOL BÚSQUEDA CONCEPTUAL•HIPERLINK AUTOMÁTICO•CATEGORIZACIÓN AUTOMÁTICA•TAXONOMÍAS•AGENTESPERSONALIZADOS•NOTIFICACIÓN• RELEVANCIA CONCEPTUAL•CLUSTERING•SOPORTE MULTI LENGUAJE IAS SEGURIDAD ACL•SSL•LDAP DASHBOARD ADMINISTRACIÓN LOGS•ESTADISTICAS HERRAMIENTAS COLABORATIVAs CORREO ELECTRÓNICO DOCUMENTOS CONECTORES Y ANÁLISIS HTTP•FTP•FILESYSTEM•POP3•OPENTEXT•NOTES•EXCHAGE•DOCUMENTUM•ODBC•SQL•DB2•ORACLE•SYBASE•INFORMIX•SAP•SIEBEL•SHAREPOINT•+ DE 1000 FORMATOS DIFERENTES VIRAGE ANALISIS Y MONIOREO AUDIO Y VIDEO ETALK ANALISIS Y MONITOREO CALL CENTER INTERNET FUENTES DE INFORMACIÓN BASES DE DATOS APLICACIONES XML AUDIO + VIDEO
  • 16. Bases Matemáticas Redes y estadística bayesianas Entre más información tengas más precisa será tu visión del mundo Información previa debe ser integrada para mejorar nuevos datos. Esto nos da varios beneficios: AdaptiveProbabilistic Concept Modeling–correlación entre agentes e información. Agentes pueden ser entrenados.
  • 17. Bases matemáticas Teoría de Información (Shannon) Entropía o medida de incertidumbre en la información puede es medida. Si la probabilidad de las palabras son las mismas en un texto, el texto es aleatorio. Es decir, redundante. Sin valor. Detectar secciones relevantes, dada que su entropía es baja. Extraer conceptos en medio de la redundancia. Entre menos aparezca una unidad de comunicación más información dará. Así se encuentran los conceptos más importantes en un documento.
  • 18. Funcionalidades clave Hipervinculación automática Elaboración automática de resúmenes Agrupación automática Eduction Interlinking Visualización de agrupaciones Categorización automática Generación automática de taxonomías Agentes personalizados y alertas
  • 19. Funcionalidades clave Hipervinculaciónautomática IDOL permite vincular de forma manual y completamente automática fragmentos de información relacionados independientemente de su formato. Estos datos se vinculan a contenidos contextualmente similares y pueden utilizarse para recomendar artículos relacionados, documentos, productos o servicios a fines o conceptos de correo de voz y vídeo.
  • 20. Funcionalidades clave Elaboración automática de resúmenes Para cada contenido, IDOL elabora un resumen de la información incluyendo los conceptos más destacados. Además, pueden elaborarse resúmenes vinculados al contenido de la consulta original, lo que permite proporcionar el resumen dinámico más adecuado en los resultados de una consulta dada.
  • 21. Funcionalidades clave Agrupación automática IDOL puede tomar un gran repositorio de datos y partirlo automáticamente de forma que se agrupe la información similar, incluso procedente de formatos distintos. Cada agrupación representa un área conceptual de la base de conocimientos, lo que hace que les resulte más sencillo a las empresas identificar los temas inherentes.
  • 22. Funcionalidades clave Visualización de agrupaciones IDOL proporciona tres interfaces de usuario intuitivas basadas en Java (espectrógrafo, mapa 2D y mapa 3D) para hacer visibles las agrupaciones e identificar fácilmente las tendencias clave de un intervalo de tiempo especificado.
  • 23. Funcionalidades clave Categorización automática Se extraen categorías precisas a partir de los conceptos encontrados en el contenido no estructurado, lo que garantiza que todos los datos se clasifiquen en el contexto correcto con la mayor precisión. Las taxonomías heredadas existentes pueden conservarse o mejorarse con la comprensión contextual.
  • 24. Funcionalidades clave Eduction Identificar relaciones entre documentos en servidores en diferentes lugares geográficamente, en diferentes unidades de negocio. Se crea estructura de contenido no estructurado propagando contenido clave en una base de datos.
  • 25. Funcionalidades Clave Interlinking Se identifican subáreas de documentos para las cuales hay ligas relevantes y se insertan hipervínculos en el documento.
  • 26. Funcionalidades clave Generación automática de taxonomías Comprensión conceptual de la información  Generación automática de taxonomías Agnosticismo  taxonomías a partir de cualquier tipo de datos, ya sean estructurados o no estructurados. Taxonomía actualizada automáticamente con nuevos datos. Aproximación Manual (problemas) No aprende –estática Escalabilidad (error de clasificación cuando crecen las etiquetas). Interoperabilidad de la clasificación.
  • 27. Funcionalidades clave Generación automática de taxonomías (cont.) Mejor de ambos mundos: se pueden editar y refinar las taxonomías manualmente. Operadores y modificadores. Seleccionar documentos y textos para entrenar al motor. Excluír documentos. Peso para diferentes lugares donde una palabra está.
  • 28. Funcionalidades clave Agentes personalizados y alertas IDOL le permite a los usuarios definir Agentes para supervisar en todo momento la información sobre temas específicos a partir de distintas fuentes de datos. Definirse o formarse expresamente. Entrenando al motor mostrándole un documento, vídeo u otro contenido que coincida con los intereses del usuario.
  • 29. Funcionalidades clave Redes de colaboración y especialización Dado que IDOL puede comprender los intereses de la persona a partir de la navegación, el consumo de contenidos y/o la contribución de contenidos, también puede relacionar automáticamente a usuarios con agentes de intereses explícitos comunes o perfiles implícitos.
  • 30. ¿Desarrolladores? API en Java y .NET en la capa de servicios que ofrece toda la funcionalidad básica con la ventaja de parametrizar finamente toda la funcionalidad. Capa de servicios de negocio (de alto nivel) que atienden requerimientos puntuales de diferentes verticales (Seguridad, Administración del Conocimiento, Sector Financiero)
  • 31. Beneficios Despliegue de información relevante y correlacionada de manera automática. Asegurar el desempeño, tiempo de respuesta y disponibilidad (alta disponibilidad) de la herramienta de búsquedas. Generación de reportes de estadísticas de uso del Sistema. Posibilidad de integrar la solución de búsquedas en cualquier Portal que requiera capacidades de búsqueda o localización de información.
  • 32. Beneficios (2) Posibilidad de escalamiento en el tiempo ante iniciativas exitosas con número creciente de usuarios. Disminución de los esfuerzos en desarrollos manuales para obtener los resultados requeridos por los usuarios para la herramienta de búsquedas. Agnóstico al idioma. Aunque también se ofrece traducciones.
  • 34. Desempeño Un solo motor IDOL puede: Soportar más de 470 millones de documentos en plataformas de 64-bit. Ejecutar más de 2.600 consultas por segundo, con tiempos de respuesta menores a un segundo en una sola máquina con dos procesadores cuando se utiliza contra 70 millones de piezas de contenido. Apoyo a cientos de miles de usuarios de la empresa, o millones de web. Los usuarios tienen acceso a cientos de terabytes de datos Guardar espacio de almacenamiento con una huella global de menos del 15% del tamaño del archivo original