Este documento resume los conceptos básicos del procesamiento del lenguaje natural (PLN), incluyendo las aplicaciones actuales como el reconocimiento y síntesis del habla, diálogos y tecnologías de texto. Explica que el PLN intenta simular el comportamiento lingüístico humano mediante el análisis de estructuras lingüísticas y conocimiento general.
3. Introducción
• El Procesamiento del Lenguaje Natural (PLN) es una parte esencial de la
Inteligencia Artificial que investiga y formula mecanismos
computacionalmente efectivos que faciliten la interrelación hombre/máquina y
permitan una comunicación mucho más fluida y menos rígida que los
lenguajes formales.
4. • Todo sistema de PLN intenta simular un comportamiento lingüístico humano;
para ello debe tomar conciencia tanto de las estructuras propias del lenguaje,
como del conocimiento general acerca del universo de discurso. De esta
forma, una persona que participa en un diálogo sabe cómo combinar las
palabras para formar una oración, conoce los significados de las mismas,
sabe cómo éstos afectan al significado global de la oración y posee un
conocimiento del mundo en general que le permite participar en la
conversación.
5. 5.5 Procesamiento del Lenguaje Natural (PLN)
• A grandes rasgos, se puede considerar que el Procesamiento del Lenguaje
Natural (PLN) es la disciplina que asume como objetivo básico el tratamiento
de la información lingüística. De hecho, a este campo de estudio también se
le denomina Lingüística Computacional.
• Una de las características de esta disciplina es su gran interdisciplinariedad.
No obstante, de entre el conjunto de materias que han conformado el cuerpo
teórico y metodológico, merecen destacarse dos: la Lingüística y la
Informática, o Ciencias de la Computación.
6. • Las características enumeradas para los lenguajes naturales hicieron que
desde su origen el PLN se vinculara metodológicamente a un sub-dominio de
la Inteligencia Artificial (IA). Esta vinculación se mantiene actualmente, y así
en la International Joint Conference on Artifical Intelligence de 1993, las áreas
que concentraron el mayor número de artículos fueron:
7. • El aprendizaje automático
• La representación del conocimiento
• El razonamiento automático
• El lenguaje natural
8. 5.5.1. Conceptos básicos.
• Lenguaje: Sistema de signos complejo, estructurado.
• (PLN o NLP, Natural Language Processing): Rama de la inteligencia
artificial que analiza, entiende y genera los lenguajes que los humanos usan
naturalmente para relacionarse con la computadora.
• Lingüística: Es la disciplina que se ocupa del estudio científico del lenguaje.
9. • Lenguaje formal: es un lenguaje atificial o sea creado por el hombre que está
formado por símbolos y formulas y que tiene como objetivo fundamental
formalizar la programación de computadoras o representar simbólicamente
un conocimiento.
10. 5.5.2. Desarrollos actuales y aplicaciones.
• Proceden de la fusión de dos disciplinas: la lingüística y la informática.
Surgen del procesamiento automático de la lengua natural: los elementos de la
lengua –fonemas, morfemas, palabras, oraciones, textos y las reglas que rigen
el funcionamiento comienzan a sistematizarse para ser informatizados,
consiguiéndose con ello realizar automáticamente tareas lingüísticas.
11. • Estas aplicaciones tienen en cuenta la disciplina o disciplinas lingüísticas
dentro de las cuales puedan encuadrarse. A pesar de que muchas de ellas
convergen en un mismo producto por ejemplo, en el caso de la traducción
automática se necesitan analizadores morfológicos, sintácticos y semánticos,
además de reconocimiento y síntesis de voz.
12. • La síntesis del habla (el ordenador proporciona información oral).
Este tipo de aplicaciones informáticas Permite la generación de mensajes
hablados a partir de un texto escrito almacenado en formato
electrónico. Suelen emplear los sistemas de conversión de texto en habla,
que constan por lo general de un módulo de procesamiento lingüístico, en el
que se llevan a cabo una trascripción fonética y un análisis lingüístico más o
menos detallado del texto de entrada y de otro que se ocupa de los aspectos
más ligados al tratamiento informático de la señal sonora.
13. El reconocimiento del habla (el ordenador procesa los enunciados emitidos por
un interlocutor).
Este tipo de aplicaciones procede realizando a una operación inversa a
la llevada a cabo en la síntesis: la onda sonora portadora de un mensaje se
convierte en una representación simbólica, que suele ser un texto escrito. El
ordenador recibe los sonidos del habla en forma de ondas analógicas que se
analizan para identificar las unidades que constituyen las palabras (fonemas).
14. • Los sistemas de diálogo (comunicación bidireccional).
Constan de un módulo de reconocimiento automático del habla, un sistema de
comprensión que se ocupa de la interpretación del enunciado, un módulo de
generación que crea un texto con los resultados de una consulta a una base de
datos o con la respuesta adecuada a la conversación entre usuario y sistema, y
de un conversor de texto en habla que transforma esta respuesta en su
equivalente sonoro.
15. • Estas operaciones están coordinadas por un módulo de gestión del diálogo,
responsable de los turnos de palabra, de la coherencia entre preguntas y
respuestas y de todos aquellos aspectos que hacen que la interacción entre
la persona y el ordenador sea lo más natural posible.
16. TECNOLOGÍAS DEL TEXTO
Aplicaciones informáticas basadas en el análisis morfológico, sintáctico y
semántico del texto:
• Analizadores morfológicos / Generadores
• Analizadores sintácticos
• Correctores
• Desambiguadores
• Traductores
• Textos predictivos
17. Conclusión
El procesamiento del lenguaje natural tiene como objetivo fundamental lograr
una comunicación máquina-humano similar a la comunicación humano-
humano.
El empleo del lenguaje le permite al hombre trasmitir sus conocimientos,
sentimientos, sensaciones, emociones y estados de ánimo. A lo largo de la
historia los lenguajes naturales han ido evolucionando, de forma paralela al
desarrollo y evolución de la especie humana, han sido varios los sistemas
informáticos inteligentes que se han desarrollado que emplean el
procesamiento del lenguaje natural.
18. Bibliografía
• Diseño e implementación de sistemas de traducción automática, José
Francisco Quesada Moreno (pág. 3)