Tratar de encontrar ofertas de trabajo que se ajusten a las habilidades de un buscador de empleo se ha convertido en un dolor de cabeza. La recuperación de información ha sido el método utilizado últimamente para ayudar en esta tarea. Con la inclusión de los algoritmos de aprendizaje profundo, la recuperación de información es ahora más poderosa que nunca. Permite el análisis de grandes conjuntos de documentos, haciendo que la predicción sea más precisa, incluso superando las capacidades humanas. En la presente ponencia presentamos las técnicas más avanzadas para la recuperación de información con un aprendizaje profundo y las aplicamos a la tarea de emparejar los currículums de los demandantes de empleo o a búsquedas específicas con las ofertas de empleo existentes más adecuadas.
3. Intro
¿Qué problema queremos solucionar?
- Evitar pérdidas de tiempo buscando ofertas de trabajo
- Podemos descartar rápidamente toda información irrelevante
- Más tiempo para centrarnos en lo importante
¿Cómo se ha solucionado tradicionalmente?
- Búsquedas
- Filtros
- Inspección manual
¿Por qué lo solucionamos usando ML?
- Mejoramos la comunicación humano-máquina
- ¡El sistema va a mejorar con su uso!
- Sin tocar una línea de código
6. Word Embeedings
Las técnicas más utilizadas de Procesamiento de
Lenguaje Natural hacen uso de Word Embeddings.
- Un Word Embedding es la representación
vectorial de palabras o frases.
- Captura propiedades semánticas y sintácticas.
- Word2Vec: red neuronal de palabras
representadas como vectores de números reales.
- Este modelo permite enriquecer el vocabulario
con el modelo preentrenado de Google News.
Woman
Girl
Boy
Man
King
Queen
Water
7. Information Retrieval
- TF-iDF: Term frequency – Inverse document frequency):
- Palabras más relevantes para cada documento
haciéndolos más singulares.
- Word Centroid Distance:
- Representación de cada oferta por el centroide de los
vectores que lo componen.
- Los centroides de las ofertas representan su
significado.
- Information Retrieval:
- Modelo de recuperación de información entrenado
con los centroides para matchear documentos.
10. VOCABULARIO
Inteligencia
artificial
Recapitulemos …
- Generamos un diccionario (vocabulario) basado en
las palabras que encontramos en las ofertas.
- Estas palabras se representan con vectores
numéricos que contienen información semántica y
sintáctica.
- Se calculan los centroides de las ofertas en función
de las palabras que contengan.
- Se entrena un modelo de recuperación de
información que permitirá encontrar las ofertas que
mejor se relacionen con la consulta del usuario.
12. Azure Cognitive Services
Computer Vision
Face
Video Indexer
Content Moderator
Custom Vistion
Bing Web Search
B. Web S.
B. Visual S.
B. Custom S.
B. Entity S.
B. Video S.
B. Image S.
B. Autosuggest
B. Local Business S.
B. News S.
QnA Maker
Speech-to-Text
Speaker Recognition
Text to Speech
Speech Translation
Text Analytics
Translator Text
Bing Speel Check
Content Moderator
Language Understanding
13. Text Analytics: Key Phrases
- Principales problemas a la hora de
extraer información relevante de un CV:
- Heterogeneidad en la estructura
- Desorden
- Falta de información
- La extracción de frases clave de Cognitive
Services, evalúa el texto no estructurado
y devuelve un documento JSON con una
lista de frases clave.
15. LUIS: Language Understanding
LUIS aplica inteligencia de aprendizaje automático
personalizado a una conversación o un texto de lenguaje
natural de un usuario para predecir el significado global y
extraer información pertinente y detallada.
- LUIS:
- Definición de intenciones.
- Entrenamiento de cada intención con una amplia
variedad de frases que puedan relacionarse con la
intención.
- BOT:
- Desarrollado en NODE JS.
- Es la aplicación cliente para LUIS.
- Se define el dialogo principal: el Bot le pasa la frase a
LUIS para que le devuelva la intención del usuario.
- Para cada intención se define una acción.
IR
LUIS
BOT
17. Volvamos a recapitular …
- El usuario inserta una frase o sube un CV al bot.
Luis aprende de las frases o preguntas que hace
el usuario.
- La información del usuario
- CV: Pasa por el Text Analytics para obtener
las frases claves del CV
- Frases que contengan el tipo de trabajo que
busca
- Con el texto obtenido se interroga al modelo de
Recuperación de información, que devolverá a
través del chat bot las ofertas que más se
adecuan al perfil del usuario
Inteligencia
artificialCV
LUIS
IR
19. Thanks and …
See you soon!
Thanks also to the sponsors.
Without whom this would not have been posible.
O R G A N I Z A T I O N
P L A T I N U M S P O N S O R S
C O L L A B O R A T O R S