2. • Disciplina de la Inteligencia Artificial que se ocupa de la
formulación e investigación de mecanismos
computacionales para la comunicación entre personas y
máquinas mediante el uso de Lenguajes Naturales
• Los Lenguajes Naturales son los utilizados en la
comunicación humana, ya sean escritos, hablados o
signados.
3. • Comprensión del lenguaje
• Recuperación de la
información
• Extracción de la información
• Búsqueda de respuestas
• Generación de discurso
• Traducción automática
• Reconstrucción de discurso
• Reconocimiento del habla
• Síntesis de voz
4. • Se analiza la estructura del lenguaje a cuatro niveles:
Lenguaj
e
Análisis
morfológico:
Análisis
sintáctico.
Análisis
semántico.
Análisis
pragmático.
El análisis de la estructura
sintáctica de la frase
mediante una gramática de la
lengua en cuestión .
El análisis de las palabras
para extraer raíces, rasgos
flexivos, unidades léxicas
compuestas y otros
fenómenos.
La extracción del significado
(o posibles significados) de
la frase.
El análisis de los significados
más allá de los limites de la
frase, por ejemplo, para
determinar los antecedentes
referenciales de los
pronombres
5. • Las distintas fases y problemáticas del análisis del
lenguaje se afrontan principalmente con las siguientes
técnicas
• Técnicas lingüísticas formales: Se basan en el
desarrollo de
• reglas estructurales que se aplican en las fases de
análisis del
• lenguaje
• Técnicas probabilísticas: Se basan en el estudio en
base a un conjunto de textos de referencia (corpus) de
características de tipo probabilístico asociadas a las
distintas fases de análisis del lenguaje.
6.
7.
8. • Dada una colección de documentos, encontrar aquellos
más relevantes con respecto a una necesidad de
información expresada por un usuario.
9. • Se caracteriza por:
• Una colección de documentos (hay que definir que se
entiende por “documento” en cada caso)
• Una pregunta del usuario realizada usando un lenguaj
especifico de consultas
• Un conjunto de resultados obtenidos (un subconjunto de
la colección de documentos)
• Una presentación de los resultados obtenidos
10. • El lenguaje de consulta es el lenguaje de las expresiones
booleanas construidas sobre las características
asociadas a las palabras.
• Un documento es relevante solo si la consulta se evalúa
a verdadero
• Este modelo tiene la ventaja de que es muy simple y fácil
de
• implementar.
11. • La relevancia de un documento es 1 o 0, no hay una
gradación
• de la misma
• Las expresiones booleanas no suelen ser familiares a los
usuarios que no son programadores o lógicos
• Es difícil realizar una consulta adecuada
12. En la actualidad disponemos de diversos
instrumentos a nuestro alcance para
resolver de la forma más eficiente la
recuperación de la información en los
archivos .
13. • Todo el trabajo que se realiza en la administración de los
archivos y en la gestión de los documentos converge en
una sola finalidad: poder consultar los documentos tras
una petición.
• Los documentos se clasifican, se ordenan, se
describen, se garantiza su óptima conservación, para
poder resolver la consulta en un momento dado.
14. • La base de datos y el sistema de gestión de bases de
datos han revolucionado la gestión de los documentos
• Mientras que las bases de datos son un conjunto o
colección de datos,
• Un sistema de gestión de bases de datos —SGBD—
es un software que permite la creación, mantenimiento y
explotación de la base de datos
• El término base de datos se aplica a los datos y
estructuras de datos, y no al SGBD que requiere de un
software para gestionarlos, dado que la estructura de
una base de datos suele ser demasiado compleja para
ser manejada sin su SGBD.
•
16. 1. ¿Qué es el Procesamiento del Lenguaje Natural?
2. ¿2 aplicaciones del Procesamiento del Lenguaje
Natural?
3. ¿Cuáles son los 4 niveles de Análisis de lenguaje?
4. Menciona 2 Técnicas para combatir problemas de
análisis de lenguaje
5. Características o elementos de la búsqueda de
información
6. ¿Qué es una BD?
7. ¿Qué es un SGBD?