Aprende a desarrollar clasificadores de texto a medida
Combina aprendizaje automático y reglas para desarrollar tus modelos con la máxima velocidad y exactitud
Webinar MeaningCloud, 4 de octubre de 2016
Más información: https://www.meaningcloud.com/es/blog/aprende-a-desarrollar-clasificadores-de-texto-a-medida-grabacion-del-webinar
2. Clasificadores de texto a la medida con MeaningCloud
Antes de empezar
Ponente
Cómo vamos a funcionar
• Enviar preguntas de texto a través del chat
• “Levanta la mano” para hablar y abriremos tu micro
• Publicaremos enlace a webinar grabado
y contenidos como tutoriales en blog
Antonio Matarranz
CMO
3. Clasificadores de texto a la medida con MeaningCloud
El propósito de este webinar…
Aprender a implementar
los clasificadores de
texto de mayor calidad
para tu aplicación
4. Clasificadores de texto a la medida con MeaningCloud
Agenda
Introducción a la clasificación de textos
Clasificación de texto en MeaningCloud: API, modelos
predefinidos
Por qué desarrollar clasificadores a medida
Tecnologías de clasificación de texto: aprendizaje
automático, basada en reglas, híbridas
Desarrollo de modelos de clasificación en
MeaningCloud: herramientas, proceso
Caso práctico
Conclusiones y preguntas
5. Clasificadores de texto a la medida con MeaningCloud
Clasificación de textos
Parte de una taxonomía predefinida = {categorías}
Asociar cada texto a una o varias categorías
Economía
Tecnología
Sociedad
Deportes
Taxonomía
Modelo
de
Clasifi-
cación
6. Clasificadores de texto a la medida con MeaningCloud
Clasificar ¿qué? ¿para qué?
La clasificación de texto es la tarea de Analítica de Texto más extendida
Texto
Noticias
Contenido web
Contact center
Encuestas
Posts sociales
Expedientes médicos
Aplicación
Etiquetar y enriquecer
Publicidad enfocada
Analizar interacción
Interpretar feedback
Comprender conversación
Estadísticas
7. Clasificadores de texto a la medida con MeaningCloud
MeaningCloud: “Meaning as a Service”
Regístrate y úsalo GRATIS en
http://www.meaningcloud.com
8. Clasificadores de texto a la medida con MeaningCloud
OpinionesTemas
Hechos
Conceptos
Organizaciones
Personas
Análisis
Semántico
Relaciones
Analítica de texto, en la nube (y on-premises)
Extrae significado e insights actuables del contenido no estructurado
Automatización de costosas actividades manuales
MeaningCloud lo proporciona mediante una oferta sencilla, basada en servicios web
9. Clasificadores de texto a la medida con MeaningCloud
APIs MeaningCloud
Identifica apariciones de
nombres de personas,
organizaciones…, conceptos
abstractos, cantidades, etc.
Clasifica por temas
según taxonomías
predefinidas
Identifica polaridad
general y por atributos
Identifica el lenguaje de
entre un conjunto de 60
Análisis morfosintáctico detallado Evalúa el impacto de opinión
sobre varios ejes
reputacionales
Descubre temas significativos y
similitudes entre textos, sin
partir de taxonomías
predefinidas
10. Clasificadores de texto a la medida con MeaningCloud
MeaningCloud: modelos de clasificación estándar
Incluye soporte a modelos de
clasificación predefinidos
estándar
IPTC: noticias
IAB: publicidad enfocada
EuroVoc: administración
pública
Business Reputation:
reputación corporativa
Social media: conversaciones
sociales
… y más en preparaciónhttps://www.meaningcloud.com/developer/documentation/supported-models
11. Clasificadores de texto a la medida con MeaningCloud
Add-in para Excel
Totalmente integrado en experiencia Excel
Fácil de usar - ¡sin programar!
La manera más sencilla de evaluar, prototipar y usar MeaningCloud
11
12. Clasificadores de texto a la medida con MeaningCloud
Centrémonos en un ejemplo práctico
Críticas de restaurantes en Londres extraídas de Yelp
13. Clasificadores de texto a la medida con MeaningCloud
NECESITAMOS UNA MANERA
FÁCIL Y POTENTE DE
DESARROLLAR
CLASIFICADORES A MEDIDA
Los modelos estándar no bastan
14. Clasificadores de texto a la medida con MeaningCloud
14
Ejemplo: clasificación a medida para
servicios financieros
Los insights
que deseamos
obtener definen
el modelo de
clasificación
15. Clasificadores de texto a la medida con MeaningCloud
Herramientas de personalización de MeaningCloud
16. Clasificadores de texto a la medida con MeaningCloud
Tecnologías de clasificación
Los clasificadores trabajan sobre patrones/vectores que representan
a cada categoría
Tecnologías para generar estas representaciones
• Estadística
• Basada en reglas
Documentos
ejemplo para
categoría
Aprendizaje
automático
Reglas para
categoría
Codificador
de reglas
Regla 1
Regla 2
Regla 3
Regla 4
Representación
de la categoría
Representación
de la categoría
17. Clasificadores de texto a la medida con MeaningCloud
Comparación de tecnologías de clasificación
Estadístico Basado en reglas
Ventajas Muy rápido si ya tienes
textos etiquetados
Buenos resultados para
textos largos
No hay falsos positivos
Muy buenos resultados para
escenarios no muy extensos
Desventajas “Caja negra”
Falsos positivos difíciles de
corregir
Sesgo en resultados según
entrenamiento
Costoso partiendo desde cero
Falsos negativos según la
calidad de las reglas
Escala con dificultad
Requiere conocimiento
exhaustivo de dominio
Tecnología híbrida: lo mejor de ambos mundos
18. Clasificadores de texto a la medida con MeaningCloud
Definiendo una categoría:
enfoque híbrido
Basado en Reglas
Basado en Entrenamiento
Se puede optar por uno de
los enfoques o
combinarlos, según la
aplicación
19. Clasificadores de texto a la medida con MeaningCloud
Definiendo una categoría: entrenamiento
Se alimenta con textos de entrenamiento precodificados
Basado en tecnología machine learning
Texto de entrenamiento
20. Clasificadores de texto a la medida con MeaningCloud
Definiendo una categoría: reglas
Términos imprescindibles Términos prohibidos
Términos que aumentan la
relevancia
Términos que reducen la
relevancia
21. Clasificadores de texto a la medida con MeaningCloud
Un método iterativo para desarrollar clasificadores a medida
Entender problema
Definir taxonomía
Configurar categorías
Validar clasificación
Validar insights
Sí
Fin
Sí
No
No
Ejemplos
Reglas
+ Ejemplos
+ Reglas
Modificar
taxonomía
22. Clasificadores de texto a la medida con MeaningCloud
Nuestro objetivo: taxonomía cocinas del mundo
23. Clasificadores de texto a la medida con MeaningCloud
Ejemplo de reglas: categoría American Food
24. Clasificadores de texto a la medida con MeaningCloud
De dónde sacar ideas para reglas
Conocimiento del dominio,
definición manual
Usar extractor de n-gramas sobre
textos etiquetados manualmente
Extraer información sobre textos
etiquetados manualmente usando
otras herramientas, p.ej.,
• Extracción de topics
• Clustering de textos
Listas de términos incluidos en documentación específica sobre la
categoría, p.ej., artículos Wikipedia
25. Clasificadores de texto a la medida con MeaningCloud
Conclusiones
La clasificación de texto de la mejor
calidad, a tu alcance
Tecnología híbrida combina velocidad de
desarrollo y exactitud
Herramientas de personalización permiten
desarrollar modelos sin programar
Facilita desarrollo ágil, p.ej., ciclos
Configuración – validación Excel
Aprendizaje
automático
Reglas
26. Clasificadores de texto a la medida con MeaningCloud
Democratizando la extracción de significado
Análisis semántico de
alta calidad
Mix optimizado de tecnologías
Recursos semánticos
actualizados continuamente
APIS de alto nivel, p.ej., User
Profiling
Personalizable al dominio del
usuario: modelos, diccionarios,
sentimiento
Asequible y sin riesgos
Tecnología madura y probada
Pruébala y úsala GRATIS
(40.000 peticiones/mes)
Pago por uso
Sin compromisos ni
permanencias
Planes comerciales para todas
las necesidades
Para desarrolladores y
usuarios no técnicos
Add-in para Excel
APIs con servicios web
estándar
Plug-ins y SDKs para
diversos entornos y
lenguajes
Enfoque plug-and-play
OpinionesTemas
Hechos
Conceptos
Organizaciones
Personas
Relaciones
28. Clasificadores de texto a la medida con MeaningCloud
Permaneced atentos a nuestros emails y blog
Pronto publicaremos la grabación del webinar y los
contenidos (datos, modelos) en forma de tutoriales
29. Clasificadores de texto a la medida con MeaningCloud
¡Gracias por vuestra atención!
Preguntas, sugerencias...
Antonio Matarranz
CMO
amatarranz@meaningcloud.com
http://www.meaningcloud.com