SlideShare una empresa de Scribd logo
1 de 25
Descargar para leer sin conexión
Sistema de generación de titulares
de noticias con sentimiento
basada en patrones.
Eduardo Cibrián Sánchez
ecibrians@gmail.com
Tutor: Jose María Álvarez Rodríguez
Universidad Carlos III de Madrid, Marzo 2018.
2
Periodismo
Digital
1 European Commission. Ares (2017).
Internet Cambio en el consumo de noticias
68% del acceso a las noticias se realiza a través de redes sociales 1
Presencia de Prensa en redes sociales
-Canal de información
-Personalización de contenidos
Introducción
Publicaciones en redes sociales
64%
25%
11%
Fútbol
Baloncesto
Otros deportes
1Datos obtenidos de los diarios deportivos Marca, As y Mundo Deportivo en el periodo 23/02/2018-26-02-2018
Poca diversidad de contenido. Mayor parte de los titulares sobre Barcelona y Real Madrid.
Publicaciones del día 23/02/2018 Publicaciones sobre deportes1
4
“El Madrid molesto con los horarios”
“El Barcelona marcó un gol muy esperado”
“El Unicaja se ve seguro para ganar el próximo partido”
¿Podrían Automatizarse?
Generación automática de titulares
con sentimiento
Titulares deportivos en Internet
5
Generación y análisis de texto
Algorítmos probabilísticos – Modelo Oculto de Markov1
Técnicas de Procesamiento del
Lenguaje Natural
2 Análisis del sentimiento
+
-
3 Bases de datos léxicas
Estado del Arte - Tecnología
6
Generación de requisitos.1
Casos de prueba.2
3 Texto.
Estado del Arte – Tecnología II
Generación basada en patrones
Generación de noticias
-Los Angeles Times. Bot para crear titulares sobre terremotos.
Extrae datos del Servicio Geológico de EE. UU.
7
Análisis – Enfoque
Estudiar domino Extraer vocabulario
Categorizar y relacionarCrear patrones
8
Usuario de la Interfaz Gestor de Conocimiento
• Configurar el titular
• Generar el titular
• Publicar el titular
• Gestionar la ontología
Análisis – Casos de Uso
9
Generar titulares deportivos en base a patrones.
Permitir la configuración del titular a generar.
Ejecutar reglas sintácticas.
Mostar titulares en la interfaz.
Usar vocabulario de una ontología.
Permitir publicar titulares en Twitter.
Análisis – Funcionalidad
10
Agrupación del vocabulario del dominio en categorías
Fútbol / Baloncesto /
Gimnasia Rítmica
Deportista Equipo Torneo Acción Objeto
- Sandra Aguilar
- Carolina Rodríguez
- Laura Zeng
- …
1
Diseño – Base de Conocimiento
…
- Flexión dorsal
- Equilibrio
- Lanzamiento
- …
- China
- España
- Brasil
- …
- Copa Europa
- JJOO
- Competición
- …
- Aro
- Cinta
- Mazas
- ...
- …
Ejemplo
Gimnasia
Rítmica
11
Diseño – Base de Conocimiento II
Agrupación del vocabulario de los sentimientos2
Alegría
- Diversión
- Felicidad
- Satisfacción
- …
Agrado
- Gusto
- Delicia
- Cautivador
- …
Duda
- Incertidumbre
- Desconfianza
- Quizá
- …
12
Diseño de patrones
<Deportista> <Verbo> <Número> <Acción> <Entusiasmo>
Sandra Aguilar hizo dos saltos emocionantes.
Juanito metió tres goles impresionantes.
Daniel Díez encestó cuatro triples alucinantes.
3
Diseño – Base de Conocimiento III
Ver más patrones en la documentación.
13
Modelo MVC
Diseño – Arquitectura
https://www.reusecompany.com/system-knowledge-manager-skm
14
Diseño – Proceso de generación
El usuario selecciona las características
que desea que cumpla el titular.
Configuración del Titular en la interfaz.
01
Enviar al sistema con un servicio REST
la configuración que desea el usuario.
Atender solicitud de usuario.
02
En base a la configuración del
usuario, se buscará en la ontología el
patrón del titular y los términos para
completarlo.
Selección de términos y patrón.
03
Concordar los términos del
patrón en genero, número y
tiempo verbal.
Ejecutar reglas gramaticales.
04
Enseñar al usuario por medio de la
interfaz el titular generado.
Mostrar el Titular.
05
15
Inserción de términos, patrones y categorías de forma manual con SKM.1
Volcado a la ontología de datos de ficheros.2
Implementación – Ontología
16
Generador de titulares.1
Servicio REST.2
Atender a las peticiones del usuario
Mostrar titulares en la interfaz.
HTTP - GET.
Estrategia de selección del patrón.
Estrategia de selección de los términos.
Reglas gramaticales.
Requiere los datos de la ontología.
Implementación – Sistema
17
Implementación – Interfaz
18
Comprobar el correcto funcionamiento del sistema.
Resultado esperado.
Comprobar el cumplimiento de los requisitos.
Resultado obtenido.
Pruebas
-Aceptación
19
Pruebas II
-Experimentación
3 de cada 5 titulares puntuación entre [5, 6].
Sentimientos como ira, aversión y odio no adecuados.
A un 25% de conseguir la puntuación total.
1. Configurar ontología.
2. Generar 100 titulares.
3. Establecer una escala de evaluación. Intervalo [1, 6]
4. Evaluar titulares.
5. Analizar resultados.
20
Ficheros de datos con licencia Creative Commons
Ley de Propiedad IntelectualAPI de terceros
Leyes de control en la difusión de contenidos falsos en redes sociales
Marco Legislativo
21
Agenda Digital - Plan de Impulso de las Tecnologías del Lenguaje
-Apoyo al desarrollo industrial basado en PLN.
Comisión Europea - Digitalización Industrial
-Aprovechamiento de tecnologías avanzadas.
Consumo de noticias en redes sociales
-Impacto de las noticias falsas.
Entorno Socioeconómico
Google – Inversión de 170 Millones $
-Automatizar redacción de noticias.
22
Duración del proyecto: 2ª Semana septiembre – 2ª semana febrero
Horas: 370h
Planificación y Presupuesto
23
Objetivos cumplidos
Ampliable a otros deportes
Apuesta por la igualdad de recursos
Bot en redes sociales
Cambio de estrategias
Conclusiones y Líneas Futuras
Personalización de contenido
24
“El Madrid molesto con los horarios”
“El Barcelona marcó un gol muy esperado”
“El Unicaja se ve seguro para ganar el próximo
partido”
Conclusiones y Líneas Futuras II
25
¿Preguntas?

Más contenido relacionado

Similar a News headline generation with sentiment and patterns: A case study of sports in Spanish

Silabo inteligencia artificia2012_1
Silabo inteligencia artificia2012_1Silabo inteligencia artificia2012_1
Silabo inteligencia artificia2012_1Hiper S.A.
 
Tecnologias y Sistemas de Informacion - Clase 6
Tecnologias y Sistemas de Informacion - Clase 6Tecnologias y Sistemas de Informacion - Clase 6
Tecnologias y Sistemas de Informacion - Clase 6Hugo Aquino
 
Presentación1
Presentación1Presentación1
Presentación1maryevamm
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equiposkarlaga2017
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equiposkarlaga2017
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equiposkarlaga2017
 
Gestión por resultados en el entorno digital
Gestión por resultados en el entorno digitalGestión por resultados en el entorno digital
Gestión por resultados en el entorno digitalRoca Salvatella
 
Informe Campus Party 2013
Informe Campus Party 2013Informe Campus Party 2013
Informe Campus Party 2013JannethGS
 
Sistemas de información 2013
Sistemas de información 2013Sistemas de información 2013
Sistemas de información 2013Maestros Online
 
Talleres 1 y 2 1151229-1151454-1150792
Talleres 1 y 2  1151229-1151454-1150792Talleres 1 y 2  1151229-1151454-1150792
Talleres 1 y 2 1151229-1151454-1150792Javier Calderon
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equiposkarlaga2017
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equiposkarlaga2017
 
Tec huehue 2016 grupo
Tec huehue 2016 grupoTec huehue 2016 grupo
Tec huehue 2016 grupoJuana Melecio
 

Similar a News headline generation with sentiment and patterns: A case study of sports in Spanish (20)

Silabo inteligencia artificia2012_1
Silabo inteligencia artificia2012_1Silabo inteligencia artificia2012_1
Silabo inteligencia artificia2012_1
 
Sistema Experto
Sistema ExpertoSistema Experto
Sistema Experto
 
Tecnologias y Sistemas de Informacion - Clase 6
Tecnologias y Sistemas de Informacion - Clase 6Tecnologias y Sistemas de Informacion - Clase 6
Tecnologias y Sistemas de Informacion - Clase 6
 
Informe Campus Party 2013
Informe Campus Party 2013Informe Campus Party 2013
Informe Campus Party 2013
 
Gestion de Ideas
Gestion  de IdeasGestion  de Ideas
Gestion de Ideas
 
Presentación1
Presentación1Presentación1
Presentación1
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equipos
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equipos
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equipos
 
Gestión por resultados en el entorno digital
Gestión por resultados en el entorno digitalGestión por resultados en el entorno digital
Gestión por resultados en el entorno digital
 
Informe Campus Party 2013
Informe Campus Party 2013Informe Campus Party 2013
Informe Campus Party 2013
 
Sistemas de información 2013
Sistemas de información 2013Sistemas de información 2013
Sistemas de información 2013
 
Exposiciones lulu
Exposiciones luluExposiciones lulu
Exposiciones lulu
 
Talleres 1 y 2 1151229-1151454-1150792
Talleres 1 y 2  1151229-1151454-1150792Talleres 1 y 2  1151229-1151454-1150792
Talleres 1 y 2 1151229-1151454-1150792
 
Trabajo 4
Trabajo 4Trabajo 4
Trabajo 4
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equipos
 
Resumen de los equipos
Resumen de los equiposResumen de los equipos
Resumen de los equipos
 
Tec huehue 2016 grupo
Tec huehue 2016 grupoTec huehue 2016 grupo
Tec huehue 2016 grupo
 
Tec huehue 2016 grupo
Tec huehue 2016 grupoTec huehue 2016 grupo
Tec huehue 2016 grupo
 
Tec huehue 2016 grupo
Tec huehue 2016 grupoTec huehue 2016 grupo
Tec huehue 2016 grupo
 

Más de CARLOS III UNIVERSITY OF MADRID

Engineering 4.0: Digitization through task automation and reuse
Engineering 4.0:  Digitization through task automation and reuseEngineering 4.0:  Digitization through task automation and reuse
Engineering 4.0: Digitization through task automation and reuseCARLOS III UNIVERSITY OF MADRID
 
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...CARLOS III UNIVERSITY OF MADRID
 
Sailing the V: Engineering digitalization through task automation and reuse i...
Sailing the V: Engineering digitalization through task automation and reuse i...Sailing the V: Engineering digitalization through task automation and reuse i...
Sailing the V: Engineering digitalization through task automation and reuse i...CARLOS III UNIVERSITY OF MADRID
 
AI4SE: Challenges and opportunities in the integration of Systems Engineering...
AI4SE: Challenges and opportunities in the integration of Systems Engineering...AI4SE: Challenges and opportunities in the integration of Systems Engineering...
AI4SE: Challenges and opportunities in the integration of Systems Engineering...CARLOS III UNIVERSITY OF MADRID
 
Challenges in the integration of Systems Engineering and the AI/ML model life...
Challenges in the integration of Systems Engineering and the AI/ML model life...Challenges in the integration of Systems Engineering and the AI/ML model life...
Challenges in the integration of Systems Engineering and the AI/ML model life...CARLOS III UNIVERSITY OF MADRID
 
OSLC KM: Elevating the meaning of data and operations within the toolchain
OSLC KM: Elevating the meaning of data and operations within the toolchainOSLC KM: Elevating the meaning of data and operations within the toolchain
OSLC KM: Elevating the meaning of data and operations within the toolchainCARLOS III UNIVERSITY OF MADRID
 
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...CARLOS III UNIVERSITY OF MADRID
 
Systems and Software Architecture: an introduction to architectural modelling
Systems and Software Architecture: an introduction to architectural modellingSystems and Software Architecture: an introduction to architectural modelling
Systems and Software Architecture: an introduction to architectural modellingCARLOS III UNIVERSITY OF MADRID
 
Detection of fraud in financial blockchain-based transactions through big dat...
Detection of fraud in financial blockchain-based transactions through big dat...Detection of fraud in financial blockchain-based transactions through big dat...
Detection of fraud in financial blockchain-based transactions through big dat...CARLOS III UNIVERSITY OF MADRID
 

Más de CARLOS III UNIVERSITY OF MADRID (20)

Proyecto IVERES-UC3M
Proyecto IVERES-UC3MProyecto IVERES-UC3M
Proyecto IVERES-UC3M
 
RTVE: Sustainable Development Goal Radar
RTVE: Sustainable Development Goal  RadarRTVE: Sustainable Development Goal  Radar
RTVE: Sustainable Development Goal Radar
 
Engineering 4.0: Digitization through task automation and reuse
Engineering 4.0:  Digitization through task automation and reuseEngineering 4.0:  Digitization through task automation and reuse
Engineering 4.0: Digitization through task automation and reuse
 
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
 
SESE 2021: Where Systems Engineering meets AI/ML
SESE 2021: Where Systems Engineering meets AI/MLSESE 2021: Where Systems Engineering meets AI/ML
SESE 2021: Where Systems Engineering meets AI/ML
 
Sailing the V: Engineering digitalization through task automation and reuse i...
Sailing the V: Engineering digitalization through task automation and reuse i...Sailing the V: Engineering digitalization through task automation and reuse i...
Sailing the V: Engineering digitalization through task automation and reuse i...
 
Deep Learning Notes
Deep Learning NotesDeep Learning Notes
Deep Learning Notes
 
H2020-AHTOOLS Use Case 3 Functional Design
H2020-AHTOOLS Use Case 3 Functional DesignH2020-AHTOOLS Use Case 3 Functional Design
H2020-AHTOOLS Use Case 3 Functional Design
 
AI4SE: Challenges and opportunities in the integration of Systems Engineering...
AI4SE: Challenges and opportunities in the integration of Systems Engineering...AI4SE: Challenges and opportunities in the integration of Systems Engineering...
AI4SE: Challenges and opportunities in the integration of Systems Engineering...
 
INCOSE IS 2019: AI and Systems Engineering
INCOSE IS 2019: AI and Systems EngineeringINCOSE IS 2019: AI and Systems Engineering
INCOSE IS 2019: AI and Systems Engineering
 
Challenges in the integration of Systems Engineering and the AI/ML model life...
Challenges in the integration of Systems Engineering and the AI/ML model life...Challenges in the integration of Systems Engineering and the AI/ML model life...
Challenges in the integration of Systems Engineering and the AI/ML model life...
 
Blockchain en la Industria Musical
Blockchain en la Industria MusicalBlockchain en la Industria Musical
Blockchain en la Industria Musical
 
OSLC KM: Elevating the meaning of data and operations within the toolchain
OSLC KM: Elevating the meaning of data and operations within the toolchainOSLC KM: Elevating the meaning of data and operations within the toolchain
OSLC KM: Elevating the meaning of data and operations within the toolchain
 
Blockchain y sector asegurador
Blockchain y sector aseguradorBlockchain y sector asegurador
Blockchain y sector asegurador
 
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
 
Systems and Software Architecture: an introduction to architectural modelling
Systems and Software Architecture: an introduction to architectural modellingSystems and Software Architecture: an introduction to architectural modelling
Systems and Software Architecture: an introduction to architectural modelling
 
Detection of fraud in financial blockchain-based transactions through big dat...
Detection of fraud in financial blockchain-based transactions through big dat...Detection of fraud in financial blockchain-based transactions through big dat...
Detection of fraud in financial blockchain-based transactions through big dat...
 
Blockchain y la industria musical
Blockchain y la industria musicalBlockchain y la industria musical
Blockchain y la industria musical
 
Preparing your Big Data start-up pitch
Preparing your Big Data start-up pitchPreparing your Big Data start-up pitch
Preparing your Big Data start-up pitch
 
Internet of Things (IoT) in a nutshell
Internet of Things (IoT) in a nutshellInternet of Things (IoT) in a nutshell
Internet of Things (IoT) in a nutshell
 

Último

I LINEAMIENTOS Y CRITERIOS DE INFRAESTRUCTURA DE RIEGO.pptx
I LINEAMIENTOS Y CRITERIOS DE INFRAESTRUCTURA DE RIEGO.pptxI LINEAMIENTOS Y CRITERIOS DE INFRAESTRUCTURA DE RIEGO.pptx
I LINEAMIENTOS Y CRITERIOS DE INFRAESTRUCTURA DE RIEGO.pptxPATRICIAKARIMESTELAL
 
Trabajo en altura de acuerdo a la normativa peruana
Trabajo en altura de acuerdo a la normativa peruanaTrabajo en altura de acuerdo a la normativa peruana
Trabajo en altura de acuerdo a la normativa peruana5extraviado
 
Electricidad y electronica industrial unidad 1
Electricidad y electronica industrial unidad 1Electricidad y electronica industrial unidad 1
Electricidad y electronica industrial unidad 1victorrodrigues972054
 
Tarea de UTP matematices y soluciones ingenieria
Tarea de UTP matematices y soluciones ingenieriaTarea de UTP matematices y soluciones ingenieria
Tarea de UTP matematices y soluciones ingenieriaSebastianQP1
 
NOM-002-STPS-2010, combate contra incendio.pptx
NOM-002-STPS-2010, combate contra incendio.pptxNOM-002-STPS-2010, combate contra incendio.pptx
NOM-002-STPS-2010, combate contra incendio.pptxJairReyna1
 
LIQUIDACION OBRAS PUBLICAS POR CONTRATA.pdf
LIQUIDACION OBRAS PUBLICAS  POR CONTRATA.pdfLIQUIDACION OBRAS PUBLICAS  POR CONTRATA.pdf
LIQUIDACION OBRAS PUBLICAS POR CONTRATA.pdfManuelVillarreal44
 
Edificio residencial Tarsia de AEDAS Homes Granada
Edificio residencial Tarsia de AEDAS Homes GranadaEdificio residencial Tarsia de AEDAS Homes Granada
Edificio residencial Tarsia de AEDAS Homes GranadaANDECE
 
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptxNayeliZarzosa1
 
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptxluiscisnerosayala23
 
1. Cap. 4 Carga Axial (1).pdf237374335347
1. Cap. 4 Carga Axial (1).pdf2373743353471. Cap. 4 Carga Axial (1).pdf237374335347
1. Cap. 4 Carga Axial (1).pdf237374335347vd110501
 
produccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxproduccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxEtse9
 
CFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCarlos Delgado
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)ssuser6958b11
 
Espontaneidad de las reacciones y procesos espontáneos
Espontaneidad de las reacciones y procesos espontáneosEspontaneidad de las reacciones y procesos espontáneos
Espontaneidad de las reacciones y procesos espontáneosOscarGonzalez231938
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfIsbelRodrguez
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Francisco Javier Mora Serrano
 
Fijaciones de balcones prefabricados de hormigón - RECENSE
Fijaciones de balcones prefabricados de hormigón - RECENSEFijaciones de balcones prefabricados de hormigón - RECENSE
Fijaciones de balcones prefabricados de hormigón - RECENSEANDECE
 
Edificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCEdificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCANDECE
 
Revista estudiantil, trabajo final Materia ingeniería de Proyectos
Revista estudiantil, trabajo final Materia ingeniería de ProyectosRevista estudiantil, trabajo final Materia ingeniería de Proyectos
Revista estudiantil, trabajo final Materia ingeniería de ProyectosJeanCarlosLorenzo1
 

Último (20)

I LINEAMIENTOS Y CRITERIOS DE INFRAESTRUCTURA DE RIEGO.pptx
I LINEAMIENTOS Y CRITERIOS DE INFRAESTRUCTURA DE RIEGO.pptxI LINEAMIENTOS Y CRITERIOS DE INFRAESTRUCTURA DE RIEGO.pptx
I LINEAMIENTOS Y CRITERIOS DE INFRAESTRUCTURA DE RIEGO.pptx
 
Trabajo en altura de acuerdo a la normativa peruana
Trabajo en altura de acuerdo a la normativa peruanaTrabajo en altura de acuerdo a la normativa peruana
Trabajo en altura de acuerdo a la normativa peruana
 
Electricidad y electronica industrial unidad 1
Electricidad y electronica industrial unidad 1Electricidad y electronica industrial unidad 1
Electricidad y electronica industrial unidad 1
 
Tarea de UTP matematices y soluciones ingenieria
Tarea de UTP matematices y soluciones ingenieriaTarea de UTP matematices y soluciones ingenieria
Tarea de UTP matematices y soluciones ingenieria
 
NOM-002-STPS-2010, combate contra incendio.pptx
NOM-002-STPS-2010, combate contra incendio.pptxNOM-002-STPS-2010, combate contra incendio.pptx
NOM-002-STPS-2010, combate contra incendio.pptx
 
LIQUIDACION OBRAS PUBLICAS POR CONTRATA.pdf
LIQUIDACION OBRAS PUBLICAS  POR CONTRATA.pdfLIQUIDACION OBRAS PUBLICAS  POR CONTRATA.pdf
LIQUIDACION OBRAS PUBLICAS POR CONTRATA.pdf
 
Edificio residencial Tarsia de AEDAS Homes Granada
Edificio residencial Tarsia de AEDAS Homes GranadaEdificio residencial Tarsia de AEDAS Homes Granada
Edificio residencial Tarsia de AEDAS Homes Granada
 
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
 
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
 
Linea del tiempo de la inteligencia artificial.pptx
Linea del tiempo de la inteligencia artificial.pptxLinea del tiempo de la inteligencia artificial.pptx
Linea del tiempo de la inteligencia artificial.pptx
 
1. Cap. 4 Carga Axial (1).pdf237374335347
1. Cap. 4 Carga Axial (1).pdf2373743353471. Cap. 4 Carga Axial (1).pdf237374335347
1. Cap. 4 Carga Axial (1).pdf237374335347
 
produccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxproduccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptx
 
CFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric Project
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
 
Espontaneidad de las reacciones y procesos espontáneos
Espontaneidad de las reacciones y procesos espontáneosEspontaneidad de las reacciones y procesos espontáneos
Espontaneidad de las reacciones y procesos espontáneos
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdf
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
 
Fijaciones de balcones prefabricados de hormigón - RECENSE
Fijaciones de balcones prefabricados de hormigón - RECENSEFijaciones de balcones prefabricados de hormigón - RECENSE
Fijaciones de balcones prefabricados de hormigón - RECENSE
 
Edificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCEdificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRC
 
Revista estudiantil, trabajo final Materia ingeniería de Proyectos
Revista estudiantil, trabajo final Materia ingeniería de ProyectosRevista estudiantil, trabajo final Materia ingeniería de Proyectos
Revista estudiantil, trabajo final Materia ingeniería de Proyectos
 

News headline generation with sentiment and patterns: A case study of sports in Spanish

  • 1. Sistema de generación de titulares de noticias con sentimiento basada en patrones. Eduardo Cibrián Sánchez ecibrians@gmail.com Tutor: Jose María Álvarez Rodríguez Universidad Carlos III de Madrid, Marzo 2018.
  • 2. 2 Periodismo Digital 1 European Commission. Ares (2017). Internet Cambio en el consumo de noticias 68% del acceso a las noticias se realiza a través de redes sociales 1 Presencia de Prensa en redes sociales -Canal de información -Personalización de contenidos Introducción
  • 3. Publicaciones en redes sociales 64% 25% 11% Fútbol Baloncesto Otros deportes 1Datos obtenidos de los diarios deportivos Marca, As y Mundo Deportivo en el periodo 23/02/2018-26-02-2018 Poca diversidad de contenido. Mayor parte de los titulares sobre Barcelona y Real Madrid. Publicaciones del día 23/02/2018 Publicaciones sobre deportes1
  • 4. 4 “El Madrid molesto con los horarios” “El Barcelona marcó un gol muy esperado” “El Unicaja se ve seguro para ganar el próximo partido” ¿Podrían Automatizarse? Generación automática de titulares con sentimiento Titulares deportivos en Internet
  • 5. 5 Generación y análisis de texto Algorítmos probabilísticos – Modelo Oculto de Markov1 Técnicas de Procesamiento del Lenguaje Natural 2 Análisis del sentimiento + - 3 Bases de datos léxicas Estado del Arte - Tecnología
  • 6. 6 Generación de requisitos.1 Casos de prueba.2 3 Texto. Estado del Arte – Tecnología II Generación basada en patrones Generación de noticias -Los Angeles Times. Bot para crear titulares sobre terremotos. Extrae datos del Servicio Geológico de EE. UU.
  • 7. 7 Análisis – Enfoque Estudiar domino Extraer vocabulario Categorizar y relacionarCrear patrones
  • 8. 8 Usuario de la Interfaz Gestor de Conocimiento • Configurar el titular • Generar el titular • Publicar el titular • Gestionar la ontología Análisis – Casos de Uso
  • 9. 9 Generar titulares deportivos en base a patrones. Permitir la configuración del titular a generar. Ejecutar reglas sintácticas. Mostar titulares en la interfaz. Usar vocabulario de una ontología. Permitir publicar titulares en Twitter. Análisis – Funcionalidad
  • 10. 10 Agrupación del vocabulario del dominio en categorías Fútbol / Baloncesto / Gimnasia Rítmica Deportista Equipo Torneo Acción Objeto - Sandra Aguilar - Carolina Rodríguez - Laura Zeng - … 1 Diseño – Base de Conocimiento … - Flexión dorsal - Equilibrio - Lanzamiento - … - China - España - Brasil - … - Copa Europa - JJOO - Competición - … - Aro - Cinta - Mazas - ... - … Ejemplo Gimnasia Rítmica
  • 11. 11 Diseño – Base de Conocimiento II Agrupación del vocabulario de los sentimientos2 Alegría - Diversión - Felicidad - Satisfacción - … Agrado - Gusto - Delicia - Cautivador - … Duda - Incertidumbre - Desconfianza - Quizá - …
  • 12. 12 Diseño de patrones <Deportista> <Verbo> <Número> <Acción> <Entusiasmo> Sandra Aguilar hizo dos saltos emocionantes. Juanito metió tres goles impresionantes. Daniel Díez encestó cuatro triples alucinantes. 3 Diseño – Base de Conocimiento III Ver más patrones en la documentación.
  • 13. 13 Modelo MVC Diseño – Arquitectura https://www.reusecompany.com/system-knowledge-manager-skm
  • 14. 14 Diseño – Proceso de generación El usuario selecciona las características que desea que cumpla el titular. Configuración del Titular en la interfaz. 01 Enviar al sistema con un servicio REST la configuración que desea el usuario. Atender solicitud de usuario. 02 En base a la configuración del usuario, se buscará en la ontología el patrón del titular y los términos para completarlo. Selección de términos y patrón. 03 Concordar los términos del patrón en genero, número y tiempo verbal. Ejecutar reglas gramaticales. 04 Enseñar al usuario por medio de la interfaz el titular generado. Mostrar el Titular. 05
  • 15. 15 Inserción de términos, patrones y categorías de forma manual con SKM.1 Volcado a la ontología de datos de ficheros.2 Implementación – Ontología
  • 16. 16 Generador de titulares.1 Servicio REST.2 Atender a las peticiones del usuario Mostrar titulares en la interfaz. HTTP - GET. Estrategia de selección del patrón. Estrategia de selección de los términos. Reglas gramaticales. Requiere los datos de la ontología. Implementación – Sistema
  • 18. 18 Comprobar el correcto funcionamiento del sistema. Resultado esperado. Comprobar el cumplimiento de los requisitos. Resultado obtenido. Pruebas -Aceptación
  • 19. 19 Pruebas II -Experimentación 3 de cada 5 titulares puntuación entre [5, 6]. Sentimientos como ira, aversión y odio no adecuados. A un 25% de conseguir la puntuación total. 1. Configurar ontología. 2. Generar 100 titulares. 3. Establecer una escala de evaluación. Intervalo [1, 6] 4. Evaluar titulares. 5. Analizar resultados.
  • 20. 20 Ficheros de datos con licencia Creative Commons Ley de Propiedad IntelectualAPI de terceros Leyes de control en la difusión de contenidos falsos en redes sociales Marco Legislativo
  • 21. 21 Agenda Digital - Plan de Impulso de las Tecnologías del Lenguaje -Apoyo al desarrollo industrial basado en PLN. Comisión Europea - Digitalización Industrial -Aprovechamiento de tecnologías avanzadas. Consumo de noticias en redes sociales -Impacto de las noticias falsas. Entorno Socioeconómico Google – Inversión de 170 Millones $ -Automatizar redacción de noticias.
  • 22. 22 Duración del proyecto: 2ª Semana septiembre – 2ª semana febrero Horas: 370h Planificación y Presupuesto
  • 23. 23 Objetivos cumplidos Ampliable a otros deportes Apuesta por la igualdad de recursos Bot en redes sociales Cambio de estrategias Conclusiones y Líneas Futuras Personalización de contenido
  • 24. 24 “El Madrid molesto con los horarios” “El Barcelona marcó un gol muy esperado” “El Unicaja se ve seguro para ganar el próximo partido” Conclusiones y Líneas Futuras II