SlideShare una empresa de Scribd logo
Caso de éxito:
Buscador de normas de
AENOR
ORGANIZATION
Thank you!
dmateos@aenor.com
Soy Licenciado en Informática en la Universidad Politécnica de Madrid.
Formo parte del equipo del departamento de IT de AENOR como
Gerente de Desarrollo y Arquitectura. Actualmente inmersos en un Plan
de Sistemas, y en la mejora continua de metodologías de trabajo en los
distintos equipos para ofrecer el mejor servicio.
Mi trayectoria profesional ha evolucionado desde un inicio puramente
técnico hacía funciones de “management”, muy enfocado a entender,
asesorar y acompañar las necesidades de los clientes.
David Mateos Fernández
Gerente Desarrollo y Arquitectura en AENOR
Rodrigo Cabello Malagón
@mrcabellom
mrcabello@plainconcepts.com
MVP on Artificial Intelligence
Software Development Engineer
Necesidades
Carencias identificadas
• Complejidad al buscar información técnica fiable y precisa. Un mismo producto o servicio puede estar
referenciado en varios estándares.
• Riesgo de uso de estándares obsoletos o partes de estándares que no se correspondan con las exigencias
aplicables a los productos o servicios puestos en el mercado.
• Hay usuarios que no conocen la terminología técnica que se utiliza en los estándares, lo que les supone
obstáculo para acceder a ella.
• Cada país de LATAM utiliza una terminología propia para la búsqueda de información.
Objetivo de la solución
• Cualquier usuario podrá encontrar información en los estándares comercializados por AENOR de una forma
rápida e intuitiva.
• Distribuir el conocimiento entre todos los usuarios, profesionales y sectores de mercado.
• Ayudar en la transferencia tecnológica hacia los países de LATAM facilitando la adopción de estándares.
• Ofrecer la información en cualquier formatos digital.
• Modernizar los servicios asociados a la Marca AENOR.
• Nuevo modelo basado en servicio adaptado a las necesidades del cliente actual.
Beneficios esperados
• Disminuir los tiempos y costes a los usuarios, facilitándoles herramientas de búsqueda precisas en los
estándares, ofreciendo la respuesta esperada.
• Acelerar el “Time to Market”.
• Apertura del mercado a otros segmentos de clientes.
• Mejorar posicionamiento en países LATAM.
• Incremento en la satisfacción de cliente.
• Aumenta los beneficios y marca de AENOR.
Modelo basado en
Prototipos
Objetivo del prototipo
• Evaluar la solución a implementar.
• Validar las necesidades reales.
• Identificar nuevas necesidades o posibles modelos de negocio.
• Identificar riesgos, puntos de atención, y/o carencias en los equipos de trabajo y las etapas del prototipo
Alcance del prototipo
• Obtener un sistema basado en IA que, a partir de una entrada de texto, realice una búsqueda por
coincidencia exacta de términos y/o relación semántica.
• Búsquedas sobre el Sector de Sanidad.
• Colaboración del equipo del Sector de Sanidad de AENOR
• Colaboración de un equipo técnico altamente cualificado en proyectos similares
• Base tecnológica basada en las tendencias del mercado
• Diseño de una arquitectura con capacidades de rendimiento, seguridad y adaptación a los distintos
escenarios y necesidades.
Solución Tecnológica
Arquitectura de la solución
Pre-procesado documentos
1200 Documentos del
sector sanidad.
Formato .docx
Parseo y limpieza
secciones
Conversión texto
plano
• Portada e Índice.
• Introducción.
• Anexos.
• Notas.
python-docx
NLP
NLTK
• Eliminar stop words
• Tokenización de palabras.
Metadatos normas
SDK
Aenor
Metadatos
normas
...
CosmosDB
{
"ds_icss": "Servicios para consumidores#Equipo para deportes de
interior#Equipo para deportes al aire libre y acuáticos",
"cd_ctn_plenario": "CTN 309",
"sector": "Servicios",
"nombre_plenario": "SERVICIOS",
"codigo": "EA 0054:2015",
"index": 4,
"estado": "En vigor",
"cd_ctn_norma": "CTN 309/GT 1",
"storedindex": 4,
"descriptores": "DEPORTE, INSTALACION PARA DEPORTES,
MANTENIMIENTO, SEGURIDAD, SERVICIO",
"documento": "EA_0054=2015.docx",
"nombre_ctn_norma": "PRESTACIÓN DE SERVICIOS PARA LA PRÁCTICA DE
ACTIVIDADES DEPORTIVAS",
"titulo_norma": "Servicios para la práctica de actividades
deportivas.",
"cd_identificador": "N0054659",
"id": "6e9ed6fb-49e1-4727-8a7b-21e4c8ce9e95",
"_rid": "uLtYAPON33oBAAAAAAAAAA==",
"_self":
"dbs/uLtYAA==/colls/uLtYAPON33o=/docs/uLtYAPON33oBAAAAAAAAAA==/",
"_etag": ""00002f07-0000-0000-0000-5b97b7a50000"",
"_attachments": "attachments/",
"_ts": 1536669605
}
Transformación y tokenización
Expansión consulta
Recuperación de información
consulta
Word Embedding
Word2Vec Glove Doc2Vec FastText
Disjunctive Matching Doc.Index
Matching
Modelo de Recuperación
Word Mover’s distance Word Centroid Similarity Doc2Vec Inference
Evaluación
Gold
standard
resultado
Tf-IDF
Análisis de la consulta
• Transformación y tokenización de la consulta.
• Eliminación de stop words y signos de puntuación.
• Dependiendo del tamaño de la consulta:
• Expansión de la query para obtener mejores resultados.
• Expansión centroide.
Word2Vec
coche grande Modelo de Recuperación
Tf-idf
Expansión centroide
Coche Vehículo, automóvil, grande, amplio
Disjunctive Matching
Count Vectorizer (Binary)
love dogs
Doc1 Doc2
Exclusive OR Matching
Modelo Recuperación TF-IDF
• Elevada frecuencia en el
documento pero no en el
resto de documentos.
Tf-idfTf-idf
contenido título
+ *2=
Modelo Recuperación IWCD
Word2Vec Vocabulario -> ~70.000 palabras
Word embedding
Word2Vec
• Fichero .vec Wikipedia.
• Actualización vocabulario.
Vocabulario -> ~1.100.200
Modelo Recuperación IWCS
Word2Vec
Similitud del coseno
Word2Vec
Tf-idf Matrix * WordEmbedding_Weights
Tf-Matrix * WordEmbedding_Weights
Inverse Word
Centroid
Similarity
Word Centroid
Similarity
Centroides C
Produccionalización
• Azure Machine Learning Services.
• Versionado y registro de modelos.
• Api de scoring:
• Método Tf-Idf
• Método semántico
azureml-sdk
consulta
Tf-Idf ó semántico
metadatos
Conclusiones
Resultado del Prototipo
• Se cumplen las expectativas funcionales, y se lanza como proyecto.
• Tecnológicamente ofrece grandes capacidades de adaptarse y crecer en distintos escenarios.
• Se confirma la posibilidad de expansión internacional para favorecer el crecimiento.
• Identificadas nuevas funcionalidades a implementar:
o Comparar estándares entre diferentes años.
o Identificar nuevos requerimientos asociados a un producto o servicio.
o Identificar las obligaciones dentro de un estándar.
o Identificar secciones específicas: fórmulas, medidas…
Puntos de atención
• No todos los estándares del sector de Sanidad tienen una estructura definida, lo que imposibilita la
clasificación total. Se lanza una nueva iniciativa para analizar como estructurar o clasificar todos los
estándares comercializados por AENOR.
• Para realizar un entrenamiento óptimo en un Sector, es necesario disponer del 100% de los estándares
cargados.
• Las tareas de entrenamiento son clave para obtener un resultado de calidad.
Questions & Answers
Thanks and …
See you soon!
Thanks also to the organization
Without whom this would not have been posible.

Más contenido relacionado

Similar a Caso de éxito: Recomendación de normas de Aenor usando técnicas de Recuperación de Información

Plantilla trabajo final
Plantilla trabajo finalPlantilla trabajo final
Plantilla trabajo final
Susi Perez Gallegos
 
Ide sap
Ide sapIde sap
Ide sap
adeirala
 
Presentación software libre v2
Presentación software libre v2Presentación software libre v2
Presentación software libre v2
Kudos S.A.S
 
Comunicación Regionales
Comunicación RegionalesComunicación Regionales
Comunicación Regionales
Antonio Casallas
 
Investigación sobre técnicas que se implementan en las tareas de la Ingenierí...
Investigación sobre técnicas que se implementan en las tareas de la Ingenierí...Investigación sobre técnicas que se implementan en las tareas de la Ingenierí...
Investigación sobre técnicas que se implementan en las tareas de la Ingenierí...
Karim Krystalgami
 
Plantilla trabajo final
Plantilla trabajo finalPlantilla trabajo final
Plantilla trabajo final
Daniiel Toorres
 
Presentación Sesión 1 Ingeniería del Software.pptx
Presentación Sesión 1 Ingeniería del Software.pptxPresentación Sesión 1 Ingeniería del Software.pptx
Presentación Sesión 1 Ingeniería del Software.pptx
AderMogollonLuna
 
T-ESPE-047339-P.ppt
T-ESPE-047339-P.pptT-ESPE-047339-P.ppt
T-ESPE-047339-P.ppt
diego490296
 
3 Atos Solo Pruebas 2009
3 Atos Solo Pruebas 20093 Atos Solo Pruebas 2009
3 Atos Solo Pruebas 2009
Pepe
 
Relación Entre SPL Y MDSE
Relación Entre SPL Y MDSERelación Entre SPL Y MDSE
Relación Entre SPL Y MDSE
Edicson Edicson
 
CURR05_ABRIL-2016_ESP_SKILLS
CURR05_ABRIL-2016_ESP_SKILLSCURR05_ABRIL-2016_ESP_SKILLS
CURR05_ABRIL-2016_ESP_SKILLS
Enrique Herrera
 
Trabajo gestión del conocimiento (final)
Trabajo gestión del conocimiento (final)Trabajo gestión del conocimiento (final)
Trabajo gestión del conocimiento (final)
Fernando Llanos
 
Catedra 2 -_estrategia_operaciones
Catedra 2 -_estrategia_operacionesCatedra 2 -_estrategia_operaciones
Catedra 2 -_estrategia_operaciones
yasnakatherinna
 
Contribucion a una sistematica de pensamiento para ingenieros en proyectos de...
Contribucion a una sistematica de pensamiento para ingenieros en proyectos de...Contribucion a una sistematica de pensamiento para ingenieros en proyectos de...
Contribucion a una sistematica de pensamiento para ingenieros en proyectos de...
Dr. Jose M. Vicente Gomila
 
Presentación ITILmobile
Presentación ITILmobilePresentación ITILmobile
Presentación ITILmobile
Universidad CEU Cardenal Herrera
 
Stratesys - Solución Opentext PNT - SOP – FDA
Stratesys - Solución Opentext PNT - SOP – FDAStratesys - Solución Opentext PNT - SOP – FDA
Stratesys - Solución Opentext PNT - SOP – FDA
Stratesys
 
Presentacion Expo Work International 2022 - Big Data and Business Intelligenc...
Presentacion Expo Work International 2022 - Big Data and Business Intelligenc...Presentacion Expo Work International 2022 - Big Data and Business Intelligenc...
Presentacion Expo Work International 2022 - Big Data and Business Intelligenc...
GIANFRANCOMONTENEGRO2
 
Brochure de Codebay para desarrollo de software
Brochure de Codebay para desarrollo de softwareBrochure de Codebay para desarrollo de software
Brochure de Codebay para desarrollo de software
Alberto Garibay
 
S8-DAW-2022S1.pptx
S8-DAW-2022S1.pptxS8-DAW-2022S1.pptx
S8-DAW-2022S1.pptx
Luis Fernando Aguas Bucheli
 
Estandares de calidad
Estandares de calidadEstandares de calidad
Estandares de calidad
David Abisai Gomez
 

Similar a Caso de éxito: Recomendación de normas de Aenor usando técnicas de Recuperación de Información (20)

Plantilla trabajo final
Plantilla trabajo finalPlantilla trabajo final
Plantilla trabajo final
 
Ide sap
Ide sapIde sap
Ide sap
 
Presentación software libre v2
Presentación software libre v2Presentación software libre v2
Presentación software libre v2
 
Comunicación Regionales
Comunicación RegionalesComunicación Regionales
Comunicación Regionales
 
Investigación sobre técnicas que se implementan en las tareas de la Ingenierí...
Investigación sobre técnicas que se implementan en las tareas de la Ingenierí...Investigación sobre técnicas que se implementan en las tareas de la Ingenierí...
Investigación sobre técnicas que se implementan en las tareas de la Ingenierí...
 
Plantilla trabajo final
Plantilla trabajo finalPlantilla trabajo final
Plantilla trabajo final
 
Presentación Sesión 1 Ingeniería del Software.pptx
Presentación Sesión 1 Ingeniería del Software.pptxPresentación Sesión 1 Ingeniería del Software.pptx
Presentación Sesión 1 Ingeniería del Software.pptx
 
T-ESPE-047339-P.ppt
T-ESPE-047339-P.pptT-ESPE-047339-P.ppt
T-ESPE-047339-P.ppt
 
3 Atos Solo Pruebas 2009
3 Atos Solo Pruebas 20093 Atos Solo Pruebas 2009
3 Atos Solo Pruebas 2009
 
Relación Entre SPL Y MDSE
Relación Entre SPL Y MDSERelación Entre SPL Y MDSE
Relación Entre SPL Y MDSE
 
CURR05_ABRIL-2016_ESP_SKILLS
CURR05_ABRIL-2016_ESP_SKILLSCURR05_ABRIL-2016_ESP_SKILLS
CURR05_ABRIL-2016_ESP_SKILLS
 
Trabajo gestión del conocimiento (final)
Trabajo gestión del conocimiento (final)Trabajo gestión del conocimiento (final)
Trabajo gestión del conocimiento (final)
 
Catedra 2 -_estrategia_operaciones
Catedra 2 -_estrategia_operacionesCatedra 2 -_estrategia_operaciones
Catedra 2 -_estrategia_operaciones
 
Contribucion a una sistematica de pensamiento para ingenieros en proyectos de...
Contribucion a una sistematica de pensamiento para ingenieros en proyectos de...Contribucion a una sistematica de pensamiento para ingenieros en proyectos de...
Contribucion a una sistematica de pensamiento para ingenieros en proyectos de...
 
Presentación ITILmobile
Presentación ITILmobilePresentación ITILmobile
Presentación ITILmobile
 
Stratesys - Solución Opentext PNT - SOP – FDA
Stratesys - Solución Opentext PNT - SOP – FDAStratesys - Solución Opentext PNT - SOP – FDA
Stratesys - Solución Opentext PNT - SOP – FDA
 
Presentacion Expo Work International 2022 - Big Data and Business Intelligenc...
Presentacion Expo Work International 2022 - Big Data and Business Intelligenc...Presentacion Expo Work International 2022 - Big Data and Business Intelligenc...
Presentacion Expo Work International 2022 - Big Data and Business Intelligenc...
 
Brochure de Codebay para desarrollo de software
Brochure de Codebay para desarrollo de softwareBrochure de Codebay para desarrollo de software
Brochure de Codebay para desarrollo de software
 
S8-DAW-2022S1.pptx
S8-DAW-2022S1.pptxS8-DAW-2022S1.pptx
S8-DAW-2022S1.pptx
 
Estandares de calidad
Estandares de calidadEstandares de calidad
Estandares de calidad
 

Más de Plain Concepts

R y Python con Power BI, la ciencia y el análisis de datos, juntos
R y Python con Power BI, la ciencia y el análisis de datos, juntosR y Python con Power BI, la ciencia y el análisis de datos, juntos
R y Python con Power BI, la ciencia y el análisis de datos, juntos
Plain Concepts
 
Video kills the radio star: e-mail is crap and needed disruption
 Video kills the radio star: e-mail is crap and needed disruption Video kills the radio star: e-mail is crap and needed disruption
Video kills the radio star: e-mail is crap and needed disruption
Plain Concepts
 
Cómo redefinir tu organización con IA
Cómo redefinir tu organización con IACómo redefinir tu organización con IA
Cómo redefinir tu organización con IA
Plain Concepts
 
Dx29: assisting genetic disease diagnosis with physician-focused AI pipelines
Dx29: assisting genetic disease diagnosis with physician-focused AI pipelinesDx29: assisting genetic disease diagnosis with physician-focused AI pipelines
Dx29: assisting genetic disease diagnosis with physician-focused AI pipelines
Plain Concepts
 
¿Qué es real? Cuando la IA intenta engañar al ojo humano
¿Qué es real? Cuando la IA intenta engañar al ojo humano¿Qué es real? Cuando la IA intenta engañar al ojo humano
¿Qué es real? Cuando la IA intenta engañar al ojo humano
Plain Concepts
 
Inteligencia artificial para detectar el cáncer de mama
Inteligencia artificial para  detectar el cáncer de mamaInteligencia artificial para  detectar el cáncer de mama
Inteligencia artificial para detectar el cáncer de mama
Plain Concepts
 
¿Está tu compañía preparada para el reto de la Inteligencia Artificial?
¿Está tu compañía preparada para el reto de la Inteligencia Artificial?¿Está tu compañía preparada para el reto de la Inteligencia Artificial?
¿Está tu compañía preparada para el reto de la Inteligencia Artificial?
Plain Concepts
 
Cognitive Services en acción
Cognitive Services en acciónCognitive Services en acción
Cognitive Services en acción
Plain Concepts
 
El Hogar Inteligente. De los datos de IoT a los hábitos de una familia a trav...
El Hogar Inteligente. De los datos de IoT a los hábitos de una familia a trav...El Hogar Inteligente. De los datos de IoT a los hábitos de una familia a trav...
El Hogar Inteligente. De los datos de IoT a los hábitos de una familia a trav...
Plain Concepts
 
What if AI was your daughter?
What if AI was your daughter?What if AI was your daughter?
What if AI was your daughter?
Plain Concepts
 
Recomendación Basada en Contenidos con Deep Learning: Qué queríamos hacer, Qu...
Recomendación Basada en Contenidos con Deep Learning: Qué queríamos hacer, Qu...Recomendación Basada en Contenidos con Deep Learning: Qué queríamos hacer, Qu...
Recomendación Basada en Contenidos con Deep Learning: Qué queríamos hacer, Qu...
Plain Concepts
 
Revolucionando la experiencia de cliente con Big Data e IA
Revolucionando la experiencia de cliente con Big Data e IARevolucionando la experiencia de cliente con Big Data e IA
Revolucionando la experiencia de cliente con Big Data e IA
Plain Concepts
 
IA Score en InfoJobs
IA Score en InfoJobsIA Score en InfoJobs
IA Score en InfoJobs
Plain Concepts
 
Recuperación de información para solicitantes de empleo
Recuperación de información para solicitantes de empleoRecuperación de información para solicitantes de empleo
Recuperación de información para solicitantes de empleo
Plain Concepts
 
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT EdgeLa nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
Plain Concepts
 
DotNet 2019 | Sherry List - Azure Cognitive Services with Native Script
DotNet 2019 | Sherry List - Azure Cognitive Services with Native ScriptDotNet 2019 | Sherry List - Azure Cognitive Services with Native Script
DotNet 2019 | Sherry List - Azure Cognitive Services with Native Script
Plain Concepts
 
DotNet 2019 | Quique Fernández - Potenciando VUE con TypeScript, Inversify, V...
DotNet 2019 | Quique Fernández - Potenciando VUE con TypeScript, Inversify, V...DotNet 2019 | Quique Fernández - Potenciando VUE con TypeScript, Inversify, V...
DotNet 2019 | Quique Fernández - Potenciando VUE con TypeScript, Inversify, V...
Plain Concepts
 
DotNet 2019 | Daniela Solís y Manuel Rodrigo Cabello - IoT, una Raspberry Pi ...
DotNet 2019 | Daniela Solís y Manuel Rodrigo Cabello - IoT, una Raspberry Pi ...DotNet 2019 | Daniela Solís y Manuel Rodrigo Cabello - IoT, una Raspberry Pi ...
DotNet 2019 | Daniela Solís y Manuel Rodrigo Cabello - IoT, una Raspberry Pi ...
Plain Concepts
 
El camino a las Cloud Native Apps - Introduction
El camino a las Cloud Native Apps - IntroductionEl camino a las Cloud Native Apps - Introduction
El camino a las Cloud Native Apps - Introduction
Plain Concepts
 
El camino a las Cloud Native Apps - Azure AI
El camino a las Cloud Native Apps - Azure AIEl camino a las Cloud Native Apps - Azure AI
El camino a las Cloud Native Apps - Azure AI
Plain Concepts
 

Más de Plain Concepts (20)

R y Python con Power BI, la ciencia y el análisis de datos, juntos
R y Python con Power BI, la ciencia y el análisis de datos, juntosR y Python con Power BI, la ciencia y el análisis de datos, juntos
R y Python con Power BI, la ciencia y el análisis de datos, juntos
 
Video kills the radio star: e-mail is crap and needed disruption
 Video kills the radio star: e-mail is crap and needed disruption Video kills the radio star: e-mail is crap and needed disruption
Video kills the radio star: e-mail is crap and needed disruption
 
Cómo redefinir tu organización con IA
Cómo redefinir tu organización con IACómo redefinir tu organización con IA
Cómo redefinir tu organización con IA
 
Dx29: assisting genetic disease diagnosis with physician-focused AI pipelines
Dx29: assisting genetic disease diagnosis with physician-focused AI pipelinesDx29: assisting genetic disease diagnosis with physician-focused AI pipelines
Dx29: assisting genetic disease diagnosis with physician-focused AI pipelines
 
¿Qué es real? Cuando la IA intenta engañar al ojo humano
¿Qué es real? Cuando la IA intenta engañar al ojo humano¿Qué es real? Cuando la IA intenta engañar al ojo humano
¿Qué es real? Cuando la IA intenta engañar al ojo humano
 
Inteligencia artificial para detectar el cáncer de mama
Inteligencia artificial para  detectar el cáncer de mamaInteligencia artificial para  detectar el cáncer de mama
Inteligencia artificial para detectar el cáncer de mama
 
¿Está tu compañía preparada para el reto de la Inteligencia Artificial?
¿Está tu compañía preparada para el reto de la Inteligencia Artificial?¿Está tu compañía preparada para el reto de la Inteligencia Artificial?
¿Está tu compañía preparada para el reto de la Inteligencia Artificial?
 
Cognitive Services en acción
Cognitive Services en acciónCognitive Services en acción
Cognitive Services en acción
 
El Hogar Inteligente. De los datos de IoT a los hábitos de una familia a trav...
El Hogar Inteligente. De los datos de IoT a los hábitos de una familia a trav...El Hogar Inteligente. De los datos de IoT a los hábitos de una familia a trav...
El Hogar Inteligente. De los datos de IoT a los hábitos de una familia a trav...
 
What if AI was your daughter?
What if AI was your daughter?What if AI was your daughter?
What if AI was your daughter?
 
Recomendación Basada en Contenidos con Deep Learning: Qué queríamos hacer, Qu...
Recomendación Basada en Contenidos con Deep Learning: Qué queríamos hacer, Qu...Recomendación Basada en Contenidos con Deep Learning: Qué queríamos hacer, Qu...
Recomendación Basada en Contenidos con Deep Learning: Qué queríamos hacer, Qu...
 
Revolucionando la experiencia de cliente con Big Data e IA
Revolucionando la experiencia de cliente con Big Data e IARevolucionando la experiencia de cliente con Big Data e IA
Revolucionando la experiencia de cliente con Big Data e IA
 
IA Score en InfoJobs
IA Score en InfoJobsIA Score en InfoJobs
IA Score en InfoJobs
 
Recuperación de información para solicitantes de empleo
Recuperación de información para solicitantes de empleoRecuperación de información para solicitantes de empleo
Recuperación de información para solicitantes de empleo
 
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT EdgeLa nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
 
DotNet 2019 | Sherry List - Azure Cognitive Services with Native Script
DotNet 2019 | Sherry List - Azure Cognitive Services with Native ScriptDotNet 2019 | Sherry List - Azure Cognitive Services with Native Script
DotNet 2019 | Sherry List - Azure Cognitive Services with Native Script
 
DotNet 2019 | Quique Fernández - Potenciando VUE con TypeScript, Inversify, V...
DotNet 2019 | Quique Fernández - Potenciando VUE con TypeScript, Inversify, V...DotNet 2019 | Quique Fernández - Potenciando VUE con TypeScript, Inversify, V...
DotNet 2019 | Quique Fernández - Potenciando VUE con TypeScript, Inversify, V...
 
DotNet 2019 | Daniela Solís y Manuel Rodrigo Cabello - IoT, una Raspberry Pi ...
DotNet 2019 | Daniela Solís y Manuel Rodrigo Cabello - IoT, una Raspberry Pi ...DotNet 2019 | Daniela Solís y Manuel Rodrigo Cabello - IoT, una Raspberry Pi ...
DotNet 2019 | Daniela Solís y Manuel Rodrigo Cabello - IoT, una Raspberry Pi ...
 
El camino a las Cloud Native Apps - Introduction
El camino a las Cloud Native Apps - IntroductionEl camino a las Cloud Native Apps - Introduction
El camino a las Cloud Native Apps - Introduction
 
El camino a las Cloud Native Apps - Azure AI
El camino a las Cloud Native Apps - Azure AIEl camino a las Cloud Native Apps - Azure AI
El camino a las Cloud Native Apps - Azure AI
 

Último

Flows: Mejores Prácticas y Nuevos Features
Flows: Mejores Prácticas y Nuevos FeaturesFlows: Mejores Prácticas y Nuevos Features
Flows: Mejores Prácticas y Nuevos Features
Paola De la Torre
 
Refrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y ForzadoRefrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y Forzado
NicandroMartinez2
 
Second Life, informe de actividad del maestro Tapia
Second Life, informe de actividad del maestro TapiaSecond Life, informe de actividad del maestro Tapia
Second Life, informe de actividad del maestro Tapia
al050121024
 
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdfPLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
70244530
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Festibity
 
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANOREVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
gisellearanguren1
 
Manual de Soporte y mantenimiento de equipo de cómputos
Manual de Soporte y mantenimiento de equipo de cómputosManual de Soporte y mantenimiento de equipo de cómputos
Manual de Soporte y mantenimiento de equipo de cómputos
cbtechchihuahua
 
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
codesiret
 
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdfProjecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Festibity
 
edublogs info.docx asdasfasfsawqrdqwfqwfqwfq
edublogs info.docx asdasfasfsawqrdqwfqwfqwfqedublogs info.docx asdasfasfsawqrdqwfqwfqwfq
edublogs info.docx asdasfasfsawqrdqwfqwfqwfq
larapalaciosmonzon28
 
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
AbrahamCastillo42
 
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdfInformació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Festibity
 
El uso de las TIC por Cecilia Pozos S..pptx
El uso de las TIC  por Cecilia Pozos S..pptxEl uso de las TIC  por Cecilia Pozos S..pptx
El uso de las TIC por Cecilia Pozos S..pptx
cecypozos703
 
Informació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdfInformació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdf
Festibity
 
Nuevos tiempos, nuevos espacios.docxdsdsad
Nuevos tiempos, nuevos espacios.docxdsdsadNuevos tiempos, nuevos espacios.docxdsdsad
Nuevos tiempos, nuevos espacios.docxdsdsad
larapalaciosmonzon28
 
Modo test refrigeradores y codigos de errores 2018 V2.pdf
Modo test refrigeradores y codigos de errores 2018 V2.pdfModo test refrigeradores y codigos de errores 2018 V2.pdf
Modo test refrigeradores y codigos de errores 2018 V2.pdf
ranierglez
 
mantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptxmantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptx
MiguelAtencio10
 
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
AMADO SALVADOR
 
Presentación de Tic en educación y sobre blogger
Presentación de Tic en educación y sobre bloggerPresentación de Tic en educación y sobre blogger
Presentación de Tic en educación y sobre blogger
larapalaciosmonzon28
 
Programming & Artificial Intelligence ebook.pdf
Programming & Artificial Intelligence ebook.pdfProgramming & Artificial Intelligence ebook.pdf
Programming & Artificial Intelligence ebook.pdf
Manuel Diaz
 

Último (20)

Flows: Mejores Prácticas y Nuevos Features
Flows: Mejores Prácticas y Nuevos FeaturesFlows: Mejores Prácticas y Nuevos Features
Flows: Mejores Prácticas y Nuevos Features
 
Refrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y ForzadoRefrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y Forzado
 
Second Life, informe de actividad del maestro Tapia
Second Life, informe de actividad del maestro TapiaSecond Life, informe de actividad del maestro Tapia
Second Life, informe de actividad del maestro Tapia
 
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdfPLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
 
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANOREVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
 
Manual de Soporte y mantenimiento de equipo de cómputos
Manual de Soporte y mantenimiento de equipo de cómputosManual de Soporte y mantenimiento de equipo de cómputos
Manual de Soporte y mantenimiento de equipo de cómputos
 
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
 
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdfProjecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
 
edublogs info.docx asdasfasfsawqrdqwfqwfqwfq
edublogs info.docx asdasfasfsawqrdqwfqwfqwfqedublogs info.docx asdasfasfsawqrdqwfqwfqwfq
edublogs info.docx asdasfasfsawqrdqwfqwfqwfq
 
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
 
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdfInformació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
 
El uso de las TIC por Cecilia Pozos S..pptx
El uso de las TIC  por Cecilia Pozos S..pptxEl uso de las TIC  por Cecilia Pozos S..pptx
El uso de las TIC por Cecilia Pozos S..pptx
 
Informació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdfInformació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdf
 
Nuevos tiempos, nuevos espacios.docxdsdsad
Nuevos tiempos, nuevos espacios.docxdsdsadNuevos tiempos, nuevos espacios.docxdsdsad
Nuevos tiempos, nuevos espacios.docxdsdsad
 
Modo test refrigeradores y codigos de errores 2018 V2.pdf
Modo test refrigeradores y codigos de errores 2018 V2.pdfModo test refrigeradores y codigos de errores 2018 V2.pdf
Modo test refrigeradores y codigos de errores 2018 V2.pdf
 
mantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptxmantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptx
 
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
 
Presentación de Tic en educación y sobre blogger
Presentación de Tic en educación y sobre bloggerPresentación de Tic en educación y sobre blogger
Presentación de Tic en educación y sobre blogger
 
Programming & Artificial Intelligence ebook.pdf
Programming & Artificial Intelligence ebook.pdfProgramming & Artificial Intelligence ebook.pdf
Programming & Artificial Intelligence ebook.pdf
 

Caso de éxito: Recomendación de normas de Aenor usando técnicas de Recuperación de Información

  • 1. Caso de éxito: Buscador de normas de AENOR
  • 3. dmateos@aenor.com Soy Licenciado en Informática en la Universidad Politécnica de Madrid. Formo parte del equipo del departamento de IT de AENOR como Gerente de Desarrollo y Arquitectura. Actualmente inmersos en un Plan de Sistemas, y en la mejora continua de metodologías de trabajo en los distintos equipos para ofrecer el mejor servicio. Mi trayectoria profesional ha evolucionado desde un inicio puramente técnico hacía funciones de “management”, muy enfocado a entender, asesorar y acompañar las necesidades de los clientes. David Mateos Fernández Gerente Desarrollo y Arquitectura en AENOR
  • 4. Rodrigo Cabello Malagón @mrcabellom mrcabello@plainconcepts.com MVP on Artificial Intelligence Software Development Engineer
  • 6. Carencias identificadas • Complejidad al buscar información técnica fiable y precisa. Un mismo producto o servicio puede estar referenciado en varios estándares. • Riesgo de uso de estándares obsoletos o partes de estándares que no se correspondan con las exigencias aplicables a los productos o servicios puestos en el mercado. • Hay usuarios que no conocen la terminología técnica que se utiliza en los estándares, lo que les supone obstáculo para acceder a ella. • Cada país de LATAM utiliza una terminología propia para la búsqueda de información.
  • 7. Objetivo de la solución • Cualquier usuario podrá encontrar información en los estándares comercializados por AENOR de una forma rápida e intuitiva. • Distribuir el conocimiento entre todos los usuarios, profesionales y sectores de mercado. • Ayudar en la transferencia tecnológica hacia los países de LATAM facilitando la adopción de estándares. • Ofrecer la información en cualquier formatos digital. • Modernizar los servicios asociados a la Marca AENOR. • Nuevo modelo basado en servicio adaptado a las necesidades del cliente actual.
  • 8. Beneficios esperados • Disminuir los tiempos y costes a los usuarios, facilitándoles herramientas de búsqueda precisas en los estándares, ofreciendo la respuesta esperada. • Acelerar el “Time to Market”. • Apertura del mercado a otros segmentos de clientes. • Mejorar posicionamiento en países LATAM. • Incremento en la satisfacción de cliente. • Aumenta los beneficios y marca de AENOR.
  • 10. Objetivo del prototipo • Evaluar la solución a implementar. • Validar las necesidades reales. • Identificar nuevas necesidades o posibles modelos de negocio. • Identificar riesgos, puntos de atención, y/o carencias en los equipos de trabajo y las etapas del prototipo
  • 11. Alcance del prototipo • Obtener un sistema basado en IA que, a partir de una entrada de texto, realice una búsqueda por coincidencia exacta de términos y/o relación semántica. • Búsquedas sobre el Sector de Sanidad. • Colaboración del equipo del Sector de Sanidad de AENOR • Colaboración de un equipo técnico altamente cualificado en proyectos similares • Base tecnológica basada en las tendencias del mercado • Diseño de una arquitectura con capacidades de rendimiento, seguridad y adaptación a los distintos escenarios y necesidades.
  • 13. Arquitectura de la solución
  • 14. Pre-procesado documentos 1200 Documentos del sector sanidad. Formato .docx Parseo y limpieza secciones Conversión texto plano • Portada e Índice. • Introducción. • Anexos. • Notas. python-docx NLP NLTK • Eliminar stop words • Tokenización de palabras.
  • 15. Metadatos normas SDK Aenor Metadatos normas ... CosmosDB { "ds_icss": "Servicios para consumidores#Equipo para deportes de interior#Equipo para deportes al aire libre y acuáticos", "cd_ctn_plenario": "CTN 309", "sector": "Servicios", "nombre_plenario": "SERVICIOS", "codigo": "EA 0054:2015", "index": 4, "estado": "En vigor", "cd_ctn_norma": "CTN 309/GT 1", "storedindex": 4, "descriptores": "DEPORTE, INSTALACION PARA DEPORTES, MANTENIMIENTO, SEGURIDAD, SERVICIO", "documento": "EA_0054=2015.docx", "nombre_ctn_norma": "PRESTACIÓN DE SERVICIOS PARA LA PRÁCTICA DE ACTIVIDADES DEPORTIVAS", "titulo_norma": "Servicios para la práctica de actividades deportivas.", "cd_identificador": "N0054659", "id": "6e9ed6fb-49e1-4727-8a7b-21e4c8ce9e95", "_rid": "uLtYAPON33oBAAAAAAAAAA==", "_self": "dbs/uLtYAA==/colls/uLtYAPON33o=/docs/uLtYAPON33oBAAAAAAAAAA==/", "_etag": ""00002f07-0000-0000-0000-5b97b7a50000"", "_attachments": "attachments/", "_ts": 1536669605 }
  • 16. Transformación y tokenización Expansión consulta Recuperación de información consulta Word Embedding Word2Vec Glove Doc2Vec FastText Disjunctive Matching Doc.Index Matching Modelo de Recuperación Word Mover’s distance Word Centroid Similarity Doc2Vec Inference Evaluación Gold standard resultado Tf-IDF
  • 17. Análisis de la consulta • Transformación y tokenización de la consulta. • Eliminación de stop words y signos de puntuación. • Dependiendo del tamaño de la consulta: • Expansión de la query para obtener mejores resultados. • Expansión centroide. Word2Vec coche grande Modelo de Recuperación Tf-idf Expansión centroide Coche Vehículo, automóvil, grande, amplio
  • 18. Disjunctive Matching Count Vectorizer (Binary) love dogs Doc1 Doc2 Exclusive OR Matching
  • 19. Modelo Recuperación TF-IDF • Elevada frecuencia en el documento pero no en el resto de documentos. Tf-idfTf-idf contenido título + *2=
  • 20. Modelo Recuperación IWCD Word2Vec Vocabulario -> ~70.000 palabras Word embedding Word2Vec • Fichero .vec Wikipedia. • Actualización vocabulario. Vocabulario -> ~1.100.200
  • 21. Modelo Recuperación IWCS Word2Vec Similitud del coseno Word2Vec Tf-idf Matrix * WordEmbedding_Weights Tf-Matrix * WordEmbedding_Weights Inverse Word Centroid Similarity Word Centroid Similarity Centroides C
  • 22. Produccionalización • Azure Machine Learning Services. • Versionado y registro de modelos. • Api de scoring: • Método Tf-Idf • Método semántico azureml-sdk consulta Tf-Idf ó semántico metadatos
  • 24. Resultado del Prototipo • Se cumplen las expectativas funcionales, y se lanza como proyecto. • Tecnológicamente ofrece grandes capacidades de adaptarse y crecer en distintos escenarios. • Se confirma la posibilidad de expansión internacional para favorecer el crecimiento. • Identificadas nuevas funcionalidades a implementar: o Comparar estándares entre diferentes años. o Identificar nuevos requerimientos asociados a un producto o servicio. o Identificar las obligaciones dentro de un estándar. o Identificar secciones específicas: fórmulas, medidas…
  • 25. Puntos de atención • No todos los estándares del sector de Sanidad tienen una estructura definida, lo que imposibilita la clasificación total. Se lanza una nueva iniciativa para analizar como estructurar o clasificar todos los estándares comercializados por AENOR. • Para realizar un entrenamiento óptimo en un Sector, es necesario disponer del 100% de los estándares cargados. • Las tareas de entrenamiento son clave para obtener un resultado de calidad.
  • 27. Thanks and … See you soon! Thanks also to the organization Without whom this would not have been posible.