SlideShare una empresa de Scribd logo
1 de 11
TECNOLOGÍAS EMERGENTES
Y DATOS ABIERTOS:
Procesamiento del lenguaje natural
Abril 2020
Alejandro Alija. PhD
datos.gob.es 2
Introducción
¿Por qué este informe?
Aplicaciones como la traducción automática de textos, el análisis de sentimiento en redes sociales, las
búsquedas que realizamos en Internet, la generación de resúmenes meteorológicos o las sencillas peticiones
que hacemos a nuestro altavoz inteligente, se apoyan en la tecnología de procesamiento del lenguaje
natural para ofrecernos los resultados que esperamos. El Procesamiento del Lenguaje Natural es hacer que los
ordenadores entiendan el lenguaje humano tanto hablado o en forma de texto. A lo largo de este informe
explicaremos en detalle la tecnología que consigue que las máquinas entiendan nuestro lenguaje.
Profundizaremos en casos de uso cotidianos y realizaremos un ejemplo práctico sobre un conjunto de datos
abiertos.
Mayo 2020
datos.gob.es 3
Índice
Índice
Awarenes
Inspire
.
Action
Introducción
start
Mayo 2020
RED.ES Open Data Collections
Este informe se enmarca dentro de una colección más
amplia de recursos sobre tecnologías emergentes y
datos abiertos, cuyo objetivo es introducir en la
materia al lector mediante el empleo de casos de
uso prácticos, sencillos y reconocibles. Al mismo
tiempo, se pretende facilitar una guía de aprendizaje
práctica para aquellos lectores con conocimientos más
avanzados, que, mediante el desarrollo de un caso
práctico, puedan experimentar de forma autodidacta
con herramientas reales para el análisis y explotación
de datos abiertos.
datos.gob.es 4
Mayo 2020
datos.gob.es 5
Introducción
Mayo 2020
Las tecnologías digitales
del lenguaje son aquellas
capacidades, herramientas
informáticas y algoritmos
que hacen posible que las
máquinas puedan
entender y generar
expresiones en lenguaje
humano (escrito y hablado)
en múltiples idiomas.
Fuente: Plan de impulso a las Tecnologías del Lenguaje
El procesamiento del lenguaje natural es un campo híbrido entre la informática y la lingüística, que
utiliza diferentes técnicas, algunas de ellas basadas en Inteligencia Artificial, para interpretar el
lenguaje humano
datos.gob.es 6
Resumen
ejecutivo
El Procesamiento del Lenguaje Natural es hacer que las máquinas entiendan el lenguaje humano:
En este informe aprenderemos.
● A comprender los conceptos clave de las tecnologías que componen el Procesamiento del Lenguaje Natural (en
adelante NLP, por sus siglas en inglés)
● La estrecha relación entre los conjuntos de datos abiertos y el NLP.
● Cómo el Procesamiento del Lenguaje Natural está presente en nuestro día a día en tareas que consideramos
rutinarias y cotidianas. Veremos un ejemplo de total actualidad con aplicaciones del NLP en aplicaciones de
lucha contra la pandemia de la Covid-19.
● Entender la evolución histórica del NLP desde sus orígenes hasta nuestros días y su estrecha relación con la
Inteligencia Artificial.
● Analizaremos en detalle algunos casos de uso donde el NLP simplifica nuestras vidas. La predicción de texto
al escribir un nuevo email, la clasificación de textos en categorías o la generación de noticias falsas, son solo
algunos de los casos que se repasan en este informe.
● Mediante un caso práctico, demostramos la capacidad del NLP, para ayudarnos a entender los sentimientos y
reacciones de la gente durante las conversaciones mantenidas en debates (on-line) públicos ciudadanos.
Mayo 2020
datos.gob.es 7
Awareness
Conceptos
Clave
Un ordenador convencional basa su forma
de ”aprender” en codificar y decodificar
información digital binaria basada en ceros y
unos.Para que una máquina “entienda”
nuestro lenguaje, debemos de convertir el
texto en códigos binarios. Esto se conoce
como Text Encoding.
Métodos de convertir texto en códigos binarios:
1. Métodos sencillos – One Hot encodings
2. Métodos complejos y modernos basados en IA
– Word Embebddings
¿Cómo hacemos que las máquinas entiendan el lenguaje humano?
Mayo 2020
datos.gob.es 8
Awareness
Breve historia del
Procesamiento del
Lenguaje Natural
A finales de los años 80 comienzan a introducirse los
primeros algoritmos de machine learning. Los árboles de
decisión, por ejemplo, producían sistemas de reglas estrictas
similares a las diseñadas manualmente en la década anterior.
Mayo 2020
70 años de largo y arduo recorrido
Hasta 1980, la mayoría de los sistemas de procesamiento de
lenguaje natural se basan en conjuntos complejos de reglas
pre-definidas.
Con la progresiva democratización de los ordenadores
personales, se generaron más y más datos digitales de
entrada para entrenar a estos algoritmos, mejorando la
clasificación de textos, dando como resultado los filtros anti-
spam
A comienzos de la segunda década de los años 2000, se generaron más y más datos digitales de entrada para entrenar algoritmos. La
inteligencia artificial se impone como tecnología y conjunto de algoritmos para entender y generar lenguaje humano en texto y voz.
datos.gob.es 9
Inspire
Casos
cotidianos de
NLP
Mayo 2020
• La traducción de idiomas
• Clasificación de textos
• La conversión del lenguaje escrito al hablado
• La conversión del lenguaje hablado al escrito
• Detección de errores de escritura en textos
• Buscadores de información relacionada
• Predicción de texto
• Detectores de spam
Predicción de texto
Motores de búsqueda
en Internet que
anticipan la búsqueda
con tan solo unas
pocas leras
Clasificación de textos
Detección de spam (más del
95% de precisión)
Valoraciones de comentarios
de clientes en productos o
servicios on-line
1. Son rápidos y sencillos
2. Independientes Idioma
3. Muy precisos
Fake News
Noticias masivas falsas
Vídeos de personajes
públicos falsos o deep-
fakes
1. Open AI publica GPT-2
2. Capacidad de generar textos como un humano
completamente falsos e indetectables por no expertos
Awareness
Inspire
datos.gob.es 10
Action
Un caso
práctico:
análisis de
contenidos y
sentimiento en
debates
ciudadanos
El objetivo de este ejercicio práctico
es demostrar al lector la capacidad
que tiene un Sistema de
procesamiento del lenguaje natural
para “entender” el contenido de los
debates y analizar aquellos debates
que generan un sentimiento más
positivo y aquellos que generan
reacciones más negativas
En este caso de uso utilizaremos un
conjunto de datos disponible en el
catálogo de datos de datos.gob.es.
En particular utilizaremos la distribución de
Participación ciudadana. Debates y
propuestas accesibles desde el siguiente
enlace:
Mayo 2020
http://decide.madrid.es
100debates 3.170 comentarios
Tecnologías
emergentes y
datos abiertos:
Procesamiento del
Lenguaje Natural
Mayo 2020

Más contenido relacionado

Similar a NLP Emergentes Abiertos

2011-T1 Lenguaje procesamiento
2011-T1 Lenguaje procesamiento2011-T1 Lenguaje procesamiento
2011-T1 Lenguaje procesamientoRicardo Lopez-Ruiz
 
Lenguajes de programacion_1
Lenguajes de programacion_1Lenguajes de programacion_1
Lenguajes de programacion_1Ricardo Paniagua
 
Software de aplicacion
Software de aplicacionSoftware de aplicacion
Software de aplicacionvanecruzhdz
 
Logos, Framework de Inteligencia Artificial
Logos, Framework de Inteligencia ArtificialLogos, Framework de Inteligencia Artificial
Logos, Framework de Inteligencia ArtificialEQ SOFT EIRL
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.www.cathedratic.com
 
Deep learning aprendizaje profundo
Deep learning  aprendizaje profundoDeep learning  aprendizaje profundo
Deep learning aprendizaje profundoAlfredo Tello
 
Procesamiento lenguaje natural
Procesamiento lenguaje naturalProcesamiento lenguaje natural
Procesamiento lenguaje naturalVanesa Vera
 
Sower avansado para el prosesamiento de informacion escribir,descripsion
Sower avansado para el prosesamiento de informacion escribir,descripsionSower avansado para el prosesamiento de informacion escribir,descripsion
Sower avansado para el prosesamiento de informacion escribir,descripsionYadira_Perez
 
Wolfram language-presentacion
Wolfram language-presentacionWolfram language-presentacion
Wolfram language-presentacionAndrex Acosta
 
Presentacion trabajo intento practica mayo 10
Presentacion trabajo intento practica mayo 10Presentacion trabajo intento practica mayo 10
Presentacion trabajo intento practica mayo 10luzstellaluzstella
 
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...Nubiral
 
Machine Learning e inteligencia artificial en las organizaciones
Machine Learning e inteligencia artificial en las organizacionesMachine Learning e inteligencia artificial en las organizaciones
Machine Learning e inteligencia artificial en las organizacionesCRISEL BY AEFOL
 
Mi trabajo hecho
Mi trabajo hecho Mi trabajo hecho
Mi trabajo hecho fernand_ccf
 
Taller tema de investigacion estrategias de busqueda
Taller tema de investigacion estrategias de busquedaTaller tema de investigacion estrategias de busqueda
Taller tema de investigacion estrategias de busquedaalejaaristizabal
 
Introduccion a la informatica
Introduccion a la informaticaIntroduccion a la informatica
Introduccion a la informaticaqaaaaaaaaaaaaaa
 

Similar a NLP Emergentes Abiertos (20)

2011-T1 Lenguaje procesamiento
2011-T1 Lenguaje procesamiento2011-T1 Lenguaje procesamiento
2011-T1 Lenguaje procesamiento
 
Lenguajes de programacion_1
Lenguajes de programacion_1Lenguajes de programacion_1
Lenguajes de programacion_1
 
Software de aplicacion
Software de aplicacionSoftware de aplicacion
Software de aplicacion
 
Logos, Framework de Inteligencia Artificial
Logos, Framework de Inteligencia ArtificialLogos, Framework de Inteligencia Artificial
Logos, Framework de Inteligencia Artificial
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
 
Deep learning aprendizaje profundo
Deep learning  aprendizaje profundoDeep learning  aprendizaje profundo
Deep learning aprendizaje profundo
 
Procesamiento lenguaje natural
Procesamiento lenguaje naturalProcesamiento lenguaje natural
Procesamiento lenguaje natural
 
MONOGRAFIA LA IA.pdf
MONOGRAFIA LA IA.pdfMONOGRAFIA LA IA.pdf
MONOGRAFIA LA IA.pdf
 
Sower avansado para el prosesamiento de informacion escribir,descripsion
Sower avansado para el prosesamiento de informacion escribir,descripsionSower avansado para el prosesamiento de informacion escribir,descripsion
Sower avansado para el prosesamiento de informacion escribir,descripsion
 
Wolfram language-presentacion
Wolfram language-presentacionWolfram language-presentacion
Wolfram language-presentacion
 
Ada 30
Ada 30Ada 30
Ada 30
 
Presentacion trabajo intento practica mayo 10
Presentacion trabajo intento practica mayo 10Presentacion trabajo intento practica mayo 10
Presentacion trabajo intento practica mayo 10
 
Q
QQ
Q
 
Profesión: Programación
Profesión: ProgramaciónProfesión: Programación
Profesión: Programación
 
Word libro 1
Word libro 1Word libro 1
Word libro 1
 
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...
eBook Nubiral _ GenAI Services_ tierra de oportunidades para las organizacion...
 
Machine Learning e inteligencia artificial en las organizaciones
Machine Learning e inteligencia artificial en las organizacionesMachine Learning e inteligencia artificial en las organizaciones
Machine Learning e inteligencia artificial en las organizaciones
 
Mi trabajo hecho
Mi trabajo hecho Mi trabajo hecho
Mi trabajo hecho
 
Taller tema de investigacion estrategias de busqueda
Taller tema de investigacion estrategias de busquedaTaller tema de investigacion estrategias de busqueda
Taller tema de investigacion estrategias de busqueda
 
Introduccion a la informatica
Introduccion a la informaticaIntroduccion a la informatica
Introduccion a la informatica
 

Más de Datos.gob.es

Cómo crear un plan de medidas para impulsar la apertura y reutilización de da...
Cómo crear un plan de medidas para impulsar la apertura y reutilización de da...Cómo crear un plan de medidas para impulsar la apertura y reutilización de da...
Cómo crear un plan de medidas para impulsar la apertura y reutilización de da...Datos.gob.es
 
8 guías para mejorar la publicación y el tratamiento del dato
8 guías para mejorar la publicación y el tratamiento del dato8 guías para mejorar la publicación y el tratamiento del dato
8 guías para mejorar la publicación y el tratamiento del datoDatos.gob.es
 
Pautas para asegurar la calidad usando formatos específicos de datos
Pautas para asegurar la calidad usando formatos específicos de datosPautas para asegurar la calidad usando formatos específicos de datos
Pautas para asegurar la calidad usando formatos específicos de datosDatos.gob.es
 
Pautas generales para garantizar la calidad de los datos abiertos
Pautas generales para garantizar la calidad de los datos abiertos Pautas generales para garantizar la calidad de los datos abiertos
Pautas generales para garantizar la calidad de los datos abiertos Datos.gob.es
 
LegalTech: Potencial transformador de los servicios jurídicos
LegalTech: Potencial transformador de los servicios jurídicosLegalTech: Potencial transformador de los servicios jurídicos
LegalTech: Potencial transformador de los servicios jurídicosDatos.gob.es
 
Impacto de los datos abiertos en la economía
Impacto de los datos abiertos en la economíaImpacto de los datos abiertos en la economía
Impacto de los datos abiertos en la economíaDatos.gob.es
 
finalistas de la IV edición del Desafío Aporta
finalistas de la IV edición del Desafío Aportafinalistas de la IV edición del Desafío Aporta
finalistas de la IV edición del Desafío AportaDatos.gob.es
 
Normas técnicas para un correcto gobierno del dato
Normas técnicas para un correcto gobierno del dato Normas técnicas para un correcto gobierno del dato
Normas técnicas para un correcto gobierno del dato Datos.gob.es
 
Gaia-X y los espacios de datos europeos
Gaia-X y los espacios de datos europeos Gaia-X y los espacios de datos europeos
Gaia-X y los espacios de datos europeos Datos.gob.es
 
APIS para el acceso y descarga de datos de turismo
APIS para el acceso y descarga de datos de turismo APIS para el acceso y descarga de datos de turismo
APIS para el acceso y descarga de datos de turismo Datos.gob.es
 
APIs para el acceso a datos abiertos
APIs para el acceso a datos abiertos APIs para el acceso a datos abiertos
APIs para el acceso a datos abiertos Datos.gob.es
 
Balance de la Iniciativa Aporta 2021
Balance de la Iniciativa Aporta 2021 Balance de la Iniciativa Aporta 2021
Balance de la Iniciativa Aporta 2021 Datos.gob.es
 
Guía Práctica de Introducción al Análisis Exploratorio de Datos
Guía Práctica de Introducción al Análisis Exploratorio de Datos Guía Práctica de Introducción al Análisis Exploratorio de Datos
Guía Práctica de Introducción al Análisis Exploratorio de Datos Datos.gob.es
 
¿Cómo se utilizan los datos abiertos en el sector salud y bienestar?
¿Cómo se utilizan los datos abiertos en el sector salud y bienestar? ¿Cómo se utilizan los datos abiertos en el sector salud y bienestar?
¿Cómo se utilizan los datos abiertos en el sector salud y bienestar? Datos.gob.es
 
Los conjuntos de datos más demandados publicados por entidades locales
Los conjuntos de datos más demandados publicados por entidades locales Los conjuntos de datos más demandados publicados por entidades locales
Los conjuntos de datos más demandados publicados por entidades locales Datos.gob.es
 
Las Estrategias de Gobierno Abierto y Datos Públicos de las Comunidades Autón...
Las Estrategias de Gobierno Abierto y Datos Públicos de las Comunidades Autón...Las Estrategias de Gobierno Abierto y Datos Públicos de las Comunidades Autón...
Las Estrategias de Gobierno Abierto y Datos Públicos de las Comunidades Autón...Datos.gob.es
 
Los conjuntos de datos publicados por CC.AA. más valorados
Los conjuntos de datos publicados por CC.AA. más valoradosLos conjuntos de datos publicados por CC.AA. más valorados
Los conjuntos de datos publicados por CC.AA. más valoradosDatos.gob.es
 
Tecnologías emergentes y datos abiertos: analítica predictiva
Tecnologías emergentes y datos abiertos: analítica predictivaTecnologías emergentes y datos abiertos: analítica predictiva
Tecnologías emergentes y datos abiertos: analítica predictivaDatos.gob.es
 
Desvelamos los 10 finalistas de la III edición del Desafío Aporta
Desvelamos los 10 finalistas de la III edición del Desafío Aporta Desvelamos los 10 finalistas de la III edición del Desafío Aporta
Desvelamos los 10 finalistas de la III edición del Desafío Aporta Datos.gob.es
 
Las estrategias relacionadas con los datos que marcarán 2021
Las estrategias relacionadas con los datos que marcarán 2021 Las estrategias relacionadas con los datos que marcarán 2021
Las estrategias relacionadas con los datos que marcarán 2021 Datos.gob.es
 

Más de Datos.gob.es (20)

Cómo crear un plan de medidas para impulsar la apertura y reutilización de da...
Cómo crear un plan de medidas para impulsar la apertura y reutilización de da...Cómo crear un plan de medidas para impulsar la apertura y reutilización de da...
Cómo crear un plan de medidas para impulsar la apertura y reutilización de da...
 
8 guías para mejorar la publicación y el tratamiento del dato
8 guías para mejorar la publicación y el tratamiento del dato8 guías para mejorar la publicación y el tratamiento del dato
8 guías para mejorar la publicación y el tratamiento del dato
 
Pautas para asegurar la calidad usando formatos específicos de datos
Pautas para asegurar la calidad usando formatos específicos de datosPautas para asegurar la calidad usando formatos específicos de datos
Pautas para asegurar la calidad usando formatos específicos de datos
 
Pautas generales para garantizar la calidad de los datos abiertos
Pautas generales para garantizar la calidad de los datos abiertos Pautas generales para garantizar la calidad de los datos abiertos
Pautas generales para garantizar la calidad de los datos abiertos
 
LegalTech: Potencial transformador de los servicios jurídicos
LegalTech: Potencial transformador de los servicios jurídicosLegalTech: Potencial transformador de los servicios jurídicos
LegalTech: Potencial transformador de los servicios jurídicos
 
Impacto de los datos abiertos en la economía
Impacto de los datos abiertos en la economíaImpacto de los datos abiertos en la economía
Impacto de los datos abiertos en la economía
 
finalistas de la IV edición del Desafío Aporta
finalistas de la IV edición del Desafío Aportafinalistas de la IV edición del Desafío Aporta
finalistas de la IV edición del Desafío Aporta
 
Normas técnicas para un correcto gobierno del dato
Normas técnicas para un correcto gobierno del dato Normas técnicas para un correcto gobierno del dato
Normas técnicas para un correcto gobierno del dato
 
Gaia-X y los espacios de datos europeos
Gaia-X y los espacios de datos europeos Gaia-X y los espacios de datos europeos
Gaia-X y los espacios de datos europeos
 
APIS para el acceso y descarga de datos de turismo
APIS para el acceso y descarga de datos de turismo APIS para el acceso y descarga de datos de turismo
APIS para el acceso y descarga de datos de turismo
 
APIs para el acceso a datos abiertos
APIs para el acceso a datos abiertos APIs para el acceso a datos abiertos
APIs para el acceso a datos abiertos
 
Balance de la Iniciativa Aporta 2021
Balance de la Iniciativa Aporta 2021 Balance de la Iniciativa Aporta 2021
Balance de la Iniciativa Aporta 2021
 
Guía Práctica de Introducción al Análisis Exploratorio de Datos
Guía Práctica de Introducción al Análisis Exploratorio de Datos Guía Práctica de Introducción al Análisis Exploratorio de Datos
Guía Práctica de Introducción al Análisis Exploratorio de Datos
 
¿Cómo se utilizan los datos abiertos en el sector salud y bienestar?
¿Cómo se utilizan los datos abiertos en el sector salud y bienestar? ¿Cómo se utilizan los datos abiertos en el sector salud y bienestar?
¿Cómo se utilizan los datos abiertos en el sector salud y bienestar?
 
Los conjuntos de datos más demandados publicados por entidades locales
Los conjuntos de datos más demandados publicados por entidades locales Los conjuntos de datos más demandados publicados por entidades locales
Los conjuntos de datos más demandados publicados por entidades locales
 
Las Estrategias de Gobierno Abierto y Datos Públicos de las Comunidades Autón...
Las Estrategias de Gobierno Abierto y Datos Públicos de las Comunidades Autón...Las Estrategias de Gobierno Abierto y Datos Públicos de las Comunidades Autón...
Las Estrategias de Gobierno Abierto y Datos Públicos de las Comunidades Autón...
 
Los conjuntos de datos publicados por CC.AA. más valorados
Los conjuntos de datos publicados por CC.AA. más valoradosLos conjuntos de datos publicados por CC.AA. más valorados
Los conjuntos de datos publicados por CC.AA. más valorados
 
Tecnologías emergentes y datos abiertos: analítica predictiva
Tecnologías emergentes y datos abiertos: analítica predictivaTecnologías emergentes y datos abiertos: analítica predictiva
Tecnologías emergentes y datos abiertos: analítica predictiva
 
Desvelamos los 10 finalistas de la III edición del Desafío Aporta
Desvelamos los 10 finalistas de la III edición del Desafío Aporta Desvelamos los 10 finalistas de la III edición del Desafío Aporta
Desvelamos los 10 finalistas de la III edición del Desafío Aporta
 
Las estrategias relacionadas con los datos que marcarán 2021
Las estrategias relacionadas con los datos que marcarán 2021 Las estrategias relacionadas con los datos que marcarán 2021
Las estrategias relacionadas con los datos que marcarán 2021
 

Último

Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofJuancarlosHuertasNio1
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...JaquelineJuarez15
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 

Último (20)

Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sof
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 

NLP Emergentes Abiertos

  • 1. TECNOLOGÍAS EMERGENTES Y DATOS ABIERTOS: Procesamiento del lenguaje natural Abril 2020 Alejandro Alija. PhD
  • 2. datos.gob.es 2 Introducción ¿Por qué este informe? Aplicaciones como la traducción automática de textos, el análisis de sentimiento en redes sociales, las búsquedas que realizamos en Internet, la generación de resúmenes meteorológicos o las sencillas peticiones que hacemos a nuestro altavoz inteligente, se apoyan en la tecnología de procesamiento del lenguaje natural para ofrecernos los resultados que esperamos. El Procesamiento del Lenguaje Natural es hacer que los ordenadores entiendan el lenguaje humano tanto hablado o en forma de texto. A lo largo de este informe explicaremos en detalle la tecnología que consigue que las máquinas entiendan nuestro lenguaje. Profundizaremos en casos de uso cotidianos y realizaremos un ejemplo práctico sobre un conjunto de datos abiertos. Mayo 2020
  • 4. RED.ES Open Data Collections Este informe se enmarca dentro de una colección más amplia de recursos sobre tecnologías emergentes y datos abiertos, cuyo objetivo es introducir en la materia al lector mediante el empleo de casos de uso prácticos, sencillos y reconocibles. Al mismo tiempo, se pretende facilitar una guía de aprendizaje práctica para aquellos lectores con conocimientos más avanzados, que, mediante el desarrollo de un caso práctico, puedan experimentar de forma autodidacta con herramientas reales para el análisis y explotación de datos abiertos. datos.gob.es 4 Mayo 2020
  • 5. datos.gob.es 5 Introducción Mayo 2020 Las tecnologías digitales del lenguaje son aquellas capacidades, herramientas informáticas y algoritmos que hacen posible que las máquinas puedan entender y generar expresiones en lenguaje humano (escrito y hablado) en múltiples idiomas. Fuente: Plan de impulso a las Tecnologías del Lenguaje El procesamiento del lenguaje natural es un campo híbrido entre la informática y la lingüística, que utiliza diferentes técnicas, algunas de ellas basadas en Inteligencia Artificial, para interpretar el lenguaje humano
  • 6. datos.gob.es 6 Resumen ejecutivo El Procesamiento del Lenguaje Natural es hacer que las máquinas entiendan el lenguaje humano: En este informe aprenderemos. ● A comprender los conceptos clave de las tecnologías que componen el Procesamiento del Lenguaje Natural (en adelante NLP, por sus siglas en inglés) ● La estrecha relación entre los conjuntos de datos abiertos y el NLP. ● Cómo el Procesamiento del Lenguaje Natural está presente en nuestro día a día en tareas que consideramos rutinarias y cotidianas. Veremos un ejemplo de total actualidad con aplicaciones del NLP en aplicaciones de lucha contra la pandemia de la Covid-19. ● Entender la evolución histórica del NLP desde sus orígenes hasta nuestros días y su estrecha relación con la Inteligencia Artificial. ● Analizaremos en detalle algunos casos de uso donde el NLP simplifica nuestras vidas. La predicción de texto al escribir un nuevo email, la clasificación de textos en categorías o la generación de noticias falsas, son solo algunos de los casos que se repasan en este informe. ● Mediante un caso práctico, demostramos la capacidad del NLP, para ayudarnos a entender los sentimientos y reacciones de la gente durante las conversaciones mantenidas en debates (on-line) públicos ciudadanos. Mayo 2020
  • 7. datos.gob.es 7 Awareness Conceptos Clave Un ordenador convencional basa su forma de ”aprender” en codificar y decodificar información digital binaria basada en ceros y unos.Para que una máquina “entienda” nuestro lenguaje, debemos de convertir el texto en códigos binarios. Esto se conoce como Text Encoding. Métodos de convertir texto en códigos binarios: 1. Métodos sencillos – One Hot encodings 2. Métodos complejos y modernos basados en IA – Word Embebddings ¿Cómo hacemos que las máquinas entiendan el lenguaje humano? Mayo 2020
  • 8. datos.gob.es 8 Awareness Breve historia del Procesamiento del Lenguaje Natural A finales de los años 80 comienzan a introducirse los primeros algoritmos de machine learning. Los árboles de decisión, por ejemplo, producían sistemas de reglas estrictas similares a las diseñadas manualmente en la década anterior. Mayo 2020 70 años de largo y arduo recorrido Hasta 1980, la mayoría de los sistemas de procesamiento de lenguaje natural se basan en conjuntos complejos de reglas pre-definidas. Con la progresiva democratización de los ordenadores personales, se generaron más y más datos digitales de entrada para entrenar a estos algoritmos, mejorando la clasificación de textos, dando como resultado los filtros anti- spam A comienzos de la segunda década de los años 2000, se generaron más y más datos digitales de entrada para entrenar algoritmos. La inteligencia artificial se impone como tecnología y conjunto de algoritmos para entender y generar lenguaje humano en texto y voz.
  • 9. datos.gob.es 9 Inspire Casos cotidianos de NLP Mayo 2020 • La traducción de idiomas • Clasificación de textos • La conversión del lenguaje escrito al hablado • La conversión del lenguaje hablado al escrito • Detección de errores de escritura en textos • Buscadores de información relacionada • Predicción de texto • Detectores de spam Predicción de texto Motores de búsqueda en Internet que anticipan la búsqueda con tan solo unas pocas leras Clasificación de textos Detección de spam (más del 95% de precisión) Valoraciones de comentarios de clientes en productos o servicios on-line 1. Son rápidos y sencillos 2. Independientes Idioma 3. Muy precisos Fake News Noticias masivas falsas Vídeos de personajes públicos falsos o deep- fakes 1. Open AI publica GPT-2 2. Capacidad de generar textos como un humano completamente falsos e indetectables por no expertos Awareness Inspire
  • 10. datos.gob.es 10 Action Un caso práctico: análisis de contenidos y sentimiento en debates ciudadanos El objetivo de este ejercicio práctico es demostrar al lector la capacidad que tiene un Sistema de procesamiento del lenguaje natural para “entender” el contenido de los debates y analizar aquellos debates que generan un sentimiento más positivo y aquellos que generan reacciones más negativas En este caso de uso utilizaremos un conjunto de datos disponible en el catálogo de datos de datos.gob.es. En particular utilizaremos la distribución de Participación ciudadana. Debates y propuestas accesibles desde el siguiente enlace: Mayo 2020 http://decide.madrid.es 100debates 3.170 comentarios