SlideShare una empresa de Scribd logo
1 de 44
Historia Del Procesamiento
Del Lenguaje Natural
El Procesamiento del Lenguaje Natural (PLN) es la
disciplina encargada de producir sistemas informáticos que
posibiliten dicha comunicación, por medio de la voz o del
texto. Se trata de una disciplina tan antigua como el uso de
las computadoras (años 50), de gran profundidad, y con
aplicaciones tan importantes como la traducción
automática o la búsqueda de información en Internet
Nació a finales de la década de los
cuarenta, antes de que se acuñara
la propia expresión «Inteligencia
Artificial» (IA).
DESCRIPCION:
El Procesamiento del Lenguaje Natural (PLN) es
una parte esencial de la Inteligencia Artificial
que investiga y formula mecanismos
computacionalmente efectivos que faciliten la
interrelación hombre/máquina y permitan una
comunicación mucho más fluida y menos rígida
que los lenguajes formales
Entre las tareas principales del
procesamiento de lenguaje natural se
puede mencionar:
Traducción Automatizada
Acceso a una Base de Datos
Recuperación de información
Categorización de Textos
Obtención de Datos de un Texto
Traducción Automatizada
A principios de la década de lo0s 60’s
habían bastantes esperanzas en el
sentido de que las computadoras llegaran
a ser capaces de traducir de un lenguaje a
otro
Acceso a una Base de Datos
El primer logro obtenido por el PLN fue en el
area de acceso a las bases de datos. Por 1970
las computadoras principales contaban con
muchas bases de datos, pero su acceso se
lograba solo escribiendo complicados
programas en oscuros lenguajes de
programación.
La primera de estas interfaces fue el sistema LUNAR
Recuperación de Información
La recuperación de información, la tarea
consiste en escoger de entre un grupo de
documentos aquellos que tengan relevancia
en una consulta a veces el documento se
representa por un reemplazo como es el
titulo y una lista de palabras claves y/o un
resumen
Categorizacion de Textos
Las tecnicas PLN han tenido exito en una actividad
relacionada con lo anterior; la clasificacion de textos
de acuerdo con determinadas categorias. Son
diversos los servicios comerciales que de esta forma
ofrecen el servicio de permitir el acceso a noticias
transmitidas por cable.
La categorizacion de textos es compatibles con las
tecnicas del PLN en aquellos casos en donde no lo
es la RI puesto que en las catogorias son fijas, y ,
gracias a ello, los diseñadores del sistema pueden
dedicar su tiempo a afinar el programa para un
problema determinado.
Obtencion de Datos de un Texto
El cometido de la obtencion de datos
consiste en tomar un texto en linea y deducir
de el algunas aseveraciones que se puedan
incorporar a una base de datos estructurada.
Dificultad principal:
El lenguaje natural es localmente ambiguo, y
la resolución de ambigüedades es necesaria
para un procesamiento eficaz.
1. He hit the nail with the hammer.=> «golpear» o
«martillar» (Golpeó el clavo con el martillo).
2. The car swerved and hit the tree.=> «chocar» (El
coche se desvió bruscamente y chocó contra el
árbol).
3. The soldier fired and hit his target.=> «acertar»
(El soldado hizo fuego y dio en el blanco).
Aparte de la ambigüedad léxica, hay otros
tipos de ambigüedades lingüísticas que
resolver. Las más importantes son la
ambigüedad referencial y la ambigüedad
estructural.
Componentes de un sistema de procesamiento del
lenguaje natural
En los sistemas reales de comprension de texto, la entrada
esta constituida por una secuencia de caracteres a partir de
la cual se obtienen palabras. En la maayoria de los sistemas
se aplica un procedimiento que consta de los siguientes
pasos:
Caracterización
Analisis Morfológico
Consulta de Diccionario
Corrección de Errores
La Caracterización es un procedimiento mediante el
cual la entrada se fragmenta en diversos
elementos basicos: palabras y signos de
puntuación.
El Analisis Morfologico es el procedimiento que
consiste en describir una palabra en funcion de
los prefijos, sufijos y raices que estan presentes
en ella. Las palabras se generan de 3 maneras:
1-Morfologia por Inflexion
2-Morfologia por Derivacion
3-Composicion
La Consulta del diccionario se realiza por cada
elemento basico constitutivo.
La Corrección de Errores es realizada cuando no se
localiza una palabra en el diccionario.hay por lo
menos 3 tipos de corrección de errores:
Para el primero se recurre a las reglas morfológicas
mediante las que se conjetura la posible clase
sintactica a la que pertenece la palabra
En el Segundo , el uso de letras mayusculas
permite suponer que la palabra se trata de un
nombre propio
En el tercero, se utiliza el conocimiento de que
ciertos fomratos especializados indican fechas,
horas, numeros del seguro social , etc.
ANALISISANALISIS
GRAMATICALGRAMATICAL
EFICIENTEEFICIENTE
 Have the students in section 2 of computerHave the students in section 2 of computer
science 101 take the exam.science 101 take the exam.
 (Aplique el examen a los estudiantes de la(Aplique el examen a los estudiantes de la
segunda sección de ciencias de la computaciónsegunda sección de ciencias de la computación
101)101)
 Have the students in section 2 of computerHave the students in section 2 of computer
science 101 taken the exam. ?science 101 taken the exam. ?
 (Ya presentaron el examen los estudiantes de la(Ya presentaron el examen los estudiantes de la
segunda sección de ciencias de la computaciónsegunda sección de ciencias de la computación
101)101)
A nivel general, para mejorar laA nivel general, para mejorar la
eficiencia se puede hacer loeficiencia se puede hacer lo
siguiente:siguiente:
 No haga dos veces lo que puedeNo haga dos veces lo que puede
hacer una vezhacer una vez
 No haga una vez lo que pueda evitarNo haga una vez lo que pueda evitar
hacerhacer
 No represente diferenciasNo represente diferencias
innecesariasinnecesarias
Rastreo de ANALISIS – ARRIBA – ABAJ0 en la cadena “ wumpus esta
muerto”
[ 0, 5, S FN FV ■ ]
[ 0, 2, S FN ■ FV
La grafica de una oración formada por n palabras consta de n+1 vértices y
varios bordes
GRAFICA DEL ANALISIS GRAMATICAL DE I FEEL THIS
AMBIGÜEDAD
La ambigüedad es intrínseca en las lenguajes
naturales, tanto a nivel morfológico como sintáctico y
semántico. En el caso de la sintaxis, el hecho de que
una frase sea ambigua se traduce en que es posible
asociar dos o mas estructuras sintagmáticas correctas
a dicha frase.
EJEMPLO:
Tomaremos una frase conocida: “Juan vio un hombre
con un telescopio en una colina”. Diferentes
ubicaciones de las subestructuras correspondientes a
los fragmentos “con un telescopio” y “en una colina”
llevan a diferentes estructuras sintagmáticas
completas para la frase, todas ellas correctas.
EVIDENCIA SINTACTICA
Son modificadores tales como los adverbios y
frases prepositivas dan lugar a considerable
ambigüedad debido a que se les puede asociar
a varias cabezas a la vez. EJEMPLO:
Lee asked kim to tell Toby to leave on Saturday.
Lee le pido a Kim que le dijera a Toby que
saliera el sábado.
EVIDENCIA LEXICA
Son muchas palabras ambiguas, pero no todos
los sentidos de una palabra tienen una misma
posibilidad. EJEMPLO:
Si se pregunta cual es el significado de la
palabra en ingles “PEN” la mayoría responderá
que es un instrumento de escritura.
EVIDENCIA SEMANTICA
Es la probabilidad a priori del sentido de una
palabra normalmente es menos importante que
la respectiva probabilidad condicional en un
contexto determinado.
EJEMPLO:
ORACION RELACION
Comí espagueti con albóndigas ( ingrediente del espagueti )
Comí espagueti con ensalada ( plato para acompañar el espagueti)
Comí espagueti con desenfreno ( manera de comer )
Comí espagueti con un tenedor ( instrumento para comer )
Comí espagueti con un un amigo ( acompañante )
MetonimiaMetonimia
Es usar un objeto para representar otro.Es usar un objeto para representar otro.
Ejemplo:Ejemplo:
““Chrysler presento un nuevo modelo”Chrysler presento un nuevo modelo”
METAFORA
Es una figura retórica en al cual se emplea una
frase con un determinado sentido literal para
dar entender otro por medio de una analogía.
Arquitectura de unArquitectura de un
sistema desistema de
Procesamiento delProcesamiento del
Lenguaje NaturalLenguaje Natural
 El usuario le expresa (de alguna forma) a laEl usuario le expresa (de alguna forma) a la
computadora que tipo de procesamiento deseacomputadora que tipo de procesamiento desea
hacer;hacer;
 La computadora analiza las oracionesLa computadora analiza las oraciones
proporcionadas, en el sentido morfológico yproporcionadas, en el sentido morfológico y
sintáctico;sintáctico;
 Luego, se analizan las oracionesLuego, se analizan las oraciones
semánticamente;semánticamente;
 Se realiza el análisis pragmático del texto.Se realiza el análisis pragmático del texto.
 Se ejecuta la expresión final y se entrega alSe ejecuta la expresión final y se entrega al
usuario para su consideración.usuario para su consideración.
 ¿Que es un discurso?¿Que es un discurso?
 En un sentido técnico, un discurso oEn un sentido técnico, un discurso o
un texto es una cadena del lenguaje,un texto es una cadena del lenguaje,
por lo general con extensión superiorpor lo general con extensión superior
a una oración.a una oración.
 Pasos de el hablante para producirPasos de el hablante para producir
un discurso:un discurso:
Intención -> generación->Intención -> generación->
síntesis.síntesis.
 Pasos del escucha dentro delPasos del escucha dentro del
discurso:discurso:
Percepción->análisis-Percepción->análisis-
>desambiguación->>desambiguación->
desincorporación.desincorporación.
Existen 6 tipos de conocimiento para poder lograr laExisten 6 tipos de conocimiento para poder lograr la
comprensión:comprensión:
 Conocimiento general del mundo.Conocimiento general del mundo.
 Conocimiento general sobre la estructura delConocimiento general sobre la estructura del
discurso coherente.discurso coherente.
 Conocimiento general sobre la sintaxis y laConocimiento general sobre la sintaxis y la
semántica.semántica.
 Conocimiento especifico sobre la situación de queConocimiento especifico sobre la situación de que
este hablándose.este hablándose.
 Conocimiento especifico sobre las creencias de losConocimiento especifico sobre las creencias de los
personajes.personajes.
 Conocimiento especifico sobre las creencias delConocimiento especifico sobre las creencias del
hablante.hablante.
 La estructura del discursoLa estructura del discurso
coherente.coherente.
 En lógica, la conjunción esEn lógica, la conjunción es
conmutativa, por lo que no hayconmutativa, por lo que no hay
diferencia entre P^R^Q y R^Q^P.diferencia entre P^R^Q y R^Q^P.
Sin embargo, lo anterior no es validoSin embargo, lo anterior no es valido
en el caso de los lenguajes naturales.en el caso de los lenguajes naturales.
Teoría de Hobbs(1990).Teoría de Hobbs(1990).
 El hablante desea transmitir unEl hablante desea transmitir un
mensaje.mensaje.
 Para hacerlo, el hablante tiene unaPara hacerlo, el hablante tiene una
motivación o meta.motivación o meta.
 El hablante desea facilitar al oyenteEl hablante desea facilitar al oyente
la comprensión del mensaje.la comprensión del mensaje.
 El hablante debe vincular laEl hablante debe vincular la
información nueva con lo que elinformación nueva con lo que el
escucha ya sabe.escucha ya sabe.
Generación de textosGeneración de textos
 En cierto grado es una tarea másEn cierto grado es una tarea más
simple que la comprensión, ya quesimple que la comprensión, ya que
por lo menos la computadora puedepor lo menos la computadora puede
elegir las expresiones que sabeelegir las expresiones que sabe
producir.producir.
 Sin embargo, hay algunos problemas en laSin embargo, hay algunos problemas en la
generación de texto. Uno reside en lageneración de texto. Uno reside en la
necesidad de elegir las palabras ynecesidad de elegir las palabras y
expresiones que «se usan» en el contextoexpresiones que «se usan» en el contexto
dado.dado.
 El otro problema es que el texto producidoEl otro problema es que el texto producido
con los métodos de fuerza bruta escon los métodos de fuerza bruta es
aburrido, incoherente y a veces noaburrido, incoherente y a veces no
entendible.entendible.
 El lenguaje es una estructura muyEl lenguaje es una estructura muy
compleja. Afortunadamente, elcompleja. Afortunadamente, el
codificador y decodificador funcionancodificador y decodificador funcionan
en pasos, construyendo lasen pasos, construyendo las
estructuras más complejas deestructuras más complejas de
bloques más simples:bloques más simples:
 Palabras de letras,Palabras de letras,−−
 Oraciones de palabras,Oraciones de palabras,−−
 Textos de oraciones.Textos de oraciones.−−
Aplicaciones del PLNAplicaciones del PLN
 Traducción automáticaTraducción automática..
 Recuperación de la información.Recuperación de la información.
 Extracción de Información yExtracción de Información y
ResúmenesResúmenes..
 Resolución cooperativa deResolución cooperativa de
problemas.problemas.
 Tutores inteligentesTutores inteligentes..
 Reconocimiento de VozReconocimiento de Voz..

Más contenido relacionado

La actualidad más candente (8)

Examen final compiladores
Examen final compiladoresExamen final compiladores
Examen final compiladores
 
1. modelo entidad relacion ejemplo
1. modelo entidad relacion   ejemplo1. modelo entidad relacion   ejemplo
1. modelo entidad relacion ejemplo
 
Requerimientos funcionales de un sistema de reservas
Requerimientos funcionales de un sistema de reservasRequerimientos funcionales de un sistema de reservas
Requerimientos funcionales de un sistema de reservas
 
Perfil Del Auditor Informático
Perfil Del Auditor InformáticoPerfil Del Auditor Informático
Perfil Del Auditor Informático
 
Manual del usuario, Pagina Web UFT
Manual del usuario, Pagina Web UFTManual del usuario, Pagina Web UFT
Manual del usuario, Pagina Web UFT
 
Mapa conceptual
Mapa conceptualMapa conceptual
Mapa conceptual
 
Presentación past simple
Presentación past simplePresentación past simple
Presentación past simple
 
Simple Present
Simple PresentSimple Present
Simple Present
 

Destacado (8)

La I. A. y el procesamiento del lenguaje natural
La I. A. y el procesamiento del lenguaje naturalLa I. A. y el procesamiento del lenguaje natural
La I. A. y el procesamiento del lenguaje natural
 
Lenguaje Y Neurociencia
Lenguaje Y NeurocienciaLenguaje Y Neurociencia
Lenguaje Y Neurociencia
 
Fisiologia leng
Fisiologia lengFisiologia leng
Fisiologia leng
 
Aprendizaje programado
Aprendizaje programadoAprendizaje programado
Aprendizaje programado
 
[Neurociencias] Procesamiento del lenguaje (Area de Broca y Wernicke)
[Neurociencias] Procesamiento del lenguaje (Area de Broca y Wernicke)[Neurociencias] Procesamiento del lenguaje (Area de Broca y Wernicke)
[Neurociencias] Procesamiento del lenguaje (Area de Broca y Wernicke)
 
El Lenguaje Y Sus Dificultades De Aprendizaje
El Lenguaje Y Sus Dificultades De AprendizajeEl Lenguaje Y Sus Dificultades De Aprendizaje
El Lenguaje Y Sus Dificultades De Aprendizaje
 
Procesamiento de la información
Procesamiento de la informaciónProcesamiento de la información
Procesamiento de la información
 
Procesamiento De InformacióN
Procesamiento De InformacióNProcesamiento De InformacióN
Procesamiento De InformacióN
 

Similar a Procesamiento del Lenguaje Natural

Complement del verb
Complement del verbComplement del verb
Complement del verb
guest9f5196
 
Patricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada, Bloque Nº 2, Producto TeóRicoPatricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada
 
Patricia Losada: Corpus y memoria de traducción
Patricia Losada: Corpus y memoria de traducciónPatricia Losada: Corpus y memoria de traducción
Patricia Losada: Corpus y memoria de traducción
Patricia Losada
 
Microcurriculo de ingles
Microcurriculo de inglesMicrocurriculo de ingles
Microcurriculo de ingles
pilyta27
 
Glosarioling
GlosariolingGlosarioling
Glosarioling
ruga82
 

Similar a Procesamiento del Lenguaje Natural (20)

Complement del verb
Complement del verbComplement del verb
Complement del verb
 
Patricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada, Bloque Nº 2, Producto TeóRicoPatricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada, Bloque Nº 2, Producto TeóRico
 
Patricia Losada: Corpus y memoria de traducción
Patricia Losada: Corpus y memoria de traducciónPatricia Losada: Corpus y memoria de traducción
Patricia Losada: Corpus y memoria de traducción
 
Natural language processing
Natural language processingNatural language processing
Natural language processing
 
Microcurriculo de ingles
Microcurriculo de inglesMicrocurriculo de ingles
Microcurriculo de ingles
 
Lenguajes autómatas.
Lenguajes autómatas.Lenguajes autómatas.
Lenguajes autómatas.
 
Lenguajes de programación
Lenguajes de programaciónLenguajes de programación
Lenguajes de programación
 
Glosarioling
GlosariolingGlosarioling
Glosarioling
 
Evolucion historica del lenguaje de programacion
Evolucion historica del lenguaje de programacionEvolucion historica del lenguaje de programacion
Evolucion historica del lenguaje de programacion
 
Fundamentos_teoricos_de_los_Paradigmas_d.pdf
Fundamentos_teoricos_de_los_Paradigmas_d.pdfFundamentos_teoricos_de_los_Paradigmas_d.pdf
Fundamentos_teoricos_de_los_Paradigmas_d.pdf
 
lenguaje especialidad, corpus, LSP
lenguaje especialidad, corpus, LSPlenguaje especialidad, corpus, LSP
lenguaje especialidad, corpus, LSP
 
Arquitectura de software
Arquitectura de softwareArquitectura de software
Arquitectura de software
 
Glosariofinal
GlosariofinalGlosariofinal
Glosariofinal
 
Glosario: tecnológico y lingüístico
Glosario: tecnológico y lingüísticoGlosario: tecnológico y lingüístico
Glosario: tecnológico y lingüístico
 
Pln
PlnPln
Pln
 
Exposicion
ExposicionExposicion
Exposicion
 
Procesamiento lenguaje natural
Procesamiento lenguaje naturalProcesamiento lenguaje natural
Procesamiento lenguaje natural
 
Clase02 paradigmas
Clase02 paradigmasClase02 paradigmas
Clase02 paradigmas
 
Taller n14 compiladores_10_junio_2021
Taller n14 compiladores_10_junio_2021Taller n14 compiladores_10_junio_2021
Taller n14 compiladores_10_junio_2021
 
Cuestionario2
Cuestionario2Cuestionario2
Cuestionario2
 

Más de menamigue

Más de menamigue (20)

1.1 Fundamentos de TI
1.1 Fundamentos de TI1.1 Fundamentos de TI
1.1 Fundamentos de TI
 
SI para obtener ventaja estrategica
SI para obtener ventaja estrategicaSI para obtener ventaja estrategica
SI para obtener ventaja estrategica
 
SI para apoyo a la toma de decisiones
SI para apoyo a la toma de decisionesSI para apoyo a la toma de decisiones
SI para apoyo a la toma de decisiones
 
sistemas de informacion
sistemas de informacionsistemas de informacion
sistemas de informacion
 
Planificación Estratégica de Sistemas de Información
Planificación Estratégica de Sistemas de InformaciónPlanificación Estratégica de Sistemas de Información
Planificación Estratégica de Sistemas de Información
 
Tecnicas UML
Tecnicas UMLTecnicas UML
Tecnicas UML
 
Emisor Receptor AM
Emisor Receptor AMEmisor Receptor AM
Emisor Receptor AM
 
Grafos propuestos
Grafos propuestosGrafos propuestos
Grafos propuestos
 
Grafos resueltos
Grafos resueltosGrafos resueltos
Grafos resueltos
 
Sql
SqlSql
Sql
 
Fourier
FourierFourier
Fourier
 
Analisis de Senales
Analisis de SenalesAnalisis de Senales
Analisis de Senales
 
Instructivo iupsm.gnomio.com
Instructivo iupsm.gnomio.comInstructivo iupsm.gnomio.com
Instructivo iupsm.gnomio.com
 
Notas electrotecnia
Notas electrotecniaNotas electrotecnia
Notas electrotecnia
 
Proyecto electrotecnia franyer velasquez
Proyecto electrotecnia franyer velasquezProyecto electrotecnia franyer velasquez
Proyecto electrotecnia franyer velasquez
 
Proyecto electrotenia milay cala
Proyecto electrotenia milay calaProyecto electrotenia milay cala
Proyecto electrotenia milay cala
 
Organizacion y metodos
Organizacion y metodosOrganizacion y metodos
Organizacion y metodos
 
Ejercicios C#
Ejercicios C#Ejercicios C#
Ejercicios C#
 
Satelites
SatelitesSatelites
Satelites
 
Enunciados de Sistemas de Información
Enunciados de Sistemas de InformaciónEnunciados de Sistemas de Información
Enunciados de Sistemas de Información
 

Procesamiento del Lenguaje Natural

  • 2. El Procesamiento del Lenguaje Natural (PLN) es la disciplina encargada de producir sistemas informáticos que posibiliten dicha comunicación, por medio de la voz o del texto. Se trata de una disciplina tan antigua como el uso de las computadoras (años 50), de gran profundidad, y con aplicaciones tan importantes como la traducción automática o la búsqueda de información en Internet
  • 3. Nació a finales de la década de los cuarenta, antes de que se acuñara la propia expresión «Inteligencia Artificial» (IA).
  • 4. DESCRIPCION: El Procesamiento del Lenguaje Natural (PLN) es una parte esencial de la Inteligencia Artificial que investiga y formula mecanismos computacionalmente efectivos que faciliten la interrelación hombre/máquina y permitan una comunicación mucho más fluida y menos rígida que los lenguajes formales
  • 5. Entre las tareas principales del procesamiento de lenguaje natural se puede mencionar: Traducción Automatizada Acceso a una Base de Datos Recuperación de información Categorización de Textos Obtención de Datos de un Texto
  • 6. Traducción Automatizada A principios de la década de lo0s 60’s habían bastantes esperanzas en el sentido de que las computadoras llegaran a ser capaces de traducir de un lenguaje a otro
  • 7. Acceso a una Base de Datos El primer logro obtenido por el PLN fue en el area de acceso a las bases de datos. Por 1970 las computadoras principales contaban con muchas bases de datos, pero su acceso se lograba solo escribiendo complicados programas en oscuros lenguajes de programación. La primera de estas interfaces fue el sistema LUNAR
  • 8. Recuperación de Información La recuperación de información, la tarea consiste en escoger de entre un grupo de documentos aquellos que tengan relevancia en una consulta a veces el documento se representa por un reemplazo como es el titulo y una lista de palabras claves y/o un resumen
  • 9. Categorizacion de Textos Las tecnicas PLN han tenido exito en una actividad relacionada con lo anterior; la clasificacion de textos de acuerdo con determinadas categorias. Son diversos los servicios comerciales que de esta forma ofrecen el servicio de permitir el acceso a noticias transmitidas por cable. La categorizacion de textos es compatibles con las tecnicas del PLN en aquellos casos en donde no lo es la RI puesto que en las catogorias son fijas, y , gracias a ello, los diseñadores del sistema pueden dedicar su tiempo a afinar el programa para un problema determinado.
  • 10. Obtencion de Datos de un Texto El cometido de la obtencion de datos consiste en tomar un texto en linea y deducir de el algunas aseveraciones que se puedan incorporar a una base de datos estructurada.
  • 11. Dificultad principal: El lenguaje natural es localmente ambiguo, y la resolución de ambigüedades es necesaria para un procesamiento eficaz. 1. He hit the nail with the hammer.=> «golpear» o «martillar» (Golpeó el clavo con el martillo). 2. The car swerved and hit the tree.=> «chocar» (El coche se desvió bruscamente y chocó contra el árbol). 3. The soldier fired and hit his target.=> «acertar» (El soldado hizo fuego y dio en el blanco).
  • 12. Aparte de la ambigüedad léxica, hay otros tipos de ambigüedades lingüísticas que resolver. Las más importantes son la ambigüedad referencial y la ambigüedad estructural.
  • 13. Componentes de un sistema de procesamiento del lenguaje natural En los sistemas reales de comprension de texto, la entrada esta constituida por una secuencia de caracteres a partir de la cual se obtienen palabras. En la maayoria de los sistemas se aplica un procedimiento que consta de los siguientes pasos: Caracterización Analisis Morfológico Consulta de Diccionario Corrección de Errores
  • 14. La Caracterización es un procedimiento mediante el cual la entrada se fragmenta en diversos elementos basicos: palabras y signos de puntuación.
  • 15. El Analisis Morfologico es el procedimiento que consiste en describir una palabra en funcion de los prefijos, sufijos y raices que estan presentes en ella. Las palabras se generan de 3 maneras: 1-Morfologia por Inflexion 2-Morfologia por Derivacion 3-Composicion
  • 16. La Consulta del diccionario se realiza por cada elemento basico constitutivo. La Corrección de Errores es realizada cuando no se localiza una palabra en el diccionario.hay por lo menos 3 tipos de corrección de errores: Para el primero se recurre a las reglas morfológicas mediante las que se conjetura la posible clase sintactica a la que pertenece la palabra
  • 17. En el Segundo , el uso de letras mayusculas permite suponer que la palabra se trata de un nombre propio En el tercero, se utiliza el conocimiento de que ciertos fomratos especializados indican fechas, horas, numeros del seguro social , etc.
  • 19.  Have the students in section 2 of computerHave the students in section 2 of computer science 101 take the exam.science 101 take the exam.  (Aplique el examen a los estudiantes de la(Aplique el examen a los estudiantes de la segunda sección de ciencias de la computaciónsegunda sección de ciencias de la computación 101)101)  Have the students in section 2 of computerHave the students in section 2 of computer science 101 taken the exam. ?science 101 taken the exam. ?  (Ya presentaron el examen los estudiantes de la(Ya presentaron el examen los estudiantes de la segunda sección de ciencias de la computaciónsegunda sección de ciencias de la computación 101)101)
  • 20. A nivel general, para mejorar laA nivel general, para mejorar la eficiencia se puede hacer loeficiencia se puede hacer lo siguiente:siguiente:  No haga dos veces lo que puedeNo haga dos veces lo que puede hacer una vezhacer una vez  No haga una vez lo que pueda evitarNo haga una vez lo que pueda evitar hacerhacer  No represente diferenciasNo represente diferencias innecesariasinnecesarias
  • 21. Rastreo de ANALISIS – ARRIBA – ABAJ0 en la cadena “ wumpus esta muerto”
  • 22. [ 0, 5, S FN FV ■ ] [ 0, 2, S FN ■ FV La grafica de una oración formada por n palabras consta de n+1 vértices y varios bordes
  • 23. GRAFICA DEL ANALISIS GRAMATICAL DE I FEEL THIS
  • 24.
  • 25. AMBIGÜEDAD La ambigüedad es intrínseca en las lenguajes naturales, tanto a nivel morfológico como sintáctico y semántico. En el caso de la sintaxis, el hecho de que una frase sea ambigua se traduce en que es posible asociar dos o mas estructuras sintagmáticas correctas a dicha frase.
  • 26. EJEMPLO: Tomaremos una frase conocida: “Juan vio un hombre con un telescopio en una colina”. Diferentes ubicaciones de las subestructuras correspondientes a los fragmentos “con un telescopio” y “en una colina” llevan a diferentes estructuras sintagmáticas completas para la frase, todas ellas correctas.
  • 27. EVIDENCIA SINTACTICA Son modificadores tales como los adverbios y frases prepositivas dan lugar a considerable ambigüedad debido a que se les puede asociar a varias cabezas a la vez. EJEMPLO: Lee asked kim to tell Toby to leave on Saturday. Lee le pido a Kim que le dijera a Toby que saliera el sábado.
  • 28. EVIDENCIA LEXICA Son muchas palabras ambiguas, pero no todos los sentidos de una palabra tienen una misma posibilidad. EJEMPLO: Si se pregunta cual es el significado de la palabra en ingles “PEN” la mayoría responderá que es un instrumento de escritura.
  • 29. EVIDENCIA SEMANTICA Es la probabilidad a priori del sentido de una palabra normalmente es menos importante que la respectiva probabilidad condicional en un contexto determinado.
  • 30. EJEMPLO: ORACION RELACION Comí espagueti con albóndigas ( ingrediente del espagueti ) Comí espagueti con ensalada ( plato para acompañar el espagueti) Comí espagueti con desenfreno ( manera de comer ) Comí espagueti con un tenedor ( instrumento para comer ) Comí espagueti con un un amigo ( acompañante )
  • 31. MetonimiaMetonimia Es usar un objeto para representar otro.Es usar un objeto para representar otro. Ejemplo:Ejemplo: ““Chrysler presento un nuevo modelo”Chrysler presento un nuevo modelo”
  • 32. METAFORA Es una figura retórica en al cual se emplea una frase con un determinado sentido literal para dar entender otro por medio de una analogía.
  • 33. Arquitectura de unArquitectura de un sistema desistema de Procesamiento delProcesamiento del Lenguaje NaturalLenguaje Natural
  • 34.  El usuario le expresa (de alguna forma) a laEl usuario le expresa (de alguna forma) a la computadora que tipo de procesamiento deseacomputadora que tipo de procesamiento desea hacer;hacer;  La computadora analiza las oracionesLa computadora analiza las oraciones proporcionadas, en el sentido morfológico yproporcionadas, en el sentido morfológico y sintáctico;sintáctico;  Luego, se analizan las oracionesLuego, se analizan las oraciones semánticamente;semánticamente;  Se realiza el análisis pragmático del texto.Se realiza el análisis pragmático del texto.  Se ejecuta la expresión final y se entrega alSe ejecuta la expresión final y se entrega al usuario para su consideración.usuario para su consideración.
  • 35.  ¿Que es un discurso?¿Que es un discurso?  En un sentido técnico, un discurso oEn un sentido técnico, un discurso o un texto es una cadena del lenguaje,un texto es una cadena del lenguaje, por lo general con extensión superiorpor lo general con extensión superior a una oración.a una oración.
  • 36.  Pasos de el hablante para producirPasos de el hablante para producir un discurso:un discurso: Intención -> generación->Intención -> generación-> síntesis.síntesis.
  • 37.  Pasos del escucha dentro delPasos del escucha dentro del discurso:discurso: Percepción->análisis-Percepción->análisis- >desambiguación->>desambiguación-> desincorporación.desincorporación.
  • 38. Existen 6 tipos de conocimiento para poder lograr laExisten 6 tipos de conocimiento para poder lograr la comprensión:comprensión:  Conocimiento general del mundo.Conocimiento general del mundo.  Conocimiento general sobre la estructura delConocimiento general sobre la estructura del discurso coherente.discurso coherente.  Conocimiento general sobre la sintaxis y laConocimiento general sobre la sintaxis y la semántica.semántica.  Conocimiento especifico sobre la situación de queConocimiento especifico sobre la situación de que este hablándose.este hablándose.  Conocimiento especifico sobre las creencias de losConocimiento especifico sobre las creencias de los personajes.personajes.  Conocimiento especifico sobre las creencias delConocimiento especifico sobre las creencias del hablante.hablante.
  • 39.  La estructura del discursoLa estructura del discurso coherente.coherente.  En lógica, la conjunción esEn lógica, la conjunción es conmutativa, por lo que no hayconmutativa, por lo que no hay diferencia entre P^R^Q y R^Q^P.diferencia entre P^R^Q y R^Q^P. Sin embargo, lo anterior no es validoSin embargo, lo anterior no es valido en el caso de los lenguajes naturales.en el caso de los lenguajes naturales.
  • 40. Teoría de Hobbs(1990).Teoría de Hobbs(1990).  El hablante desea transmitir unEl hablante desea transmitir un mensaje.mensaje.  Para hacerlo, el hablante tiene unaPara hacerlo, el hablante tiene una motivación o meta.motivación o meta.  El hablante desea facilitar al oyenteEl hablante desea facilitar al oyente la comprensión del mensaje.la comprensión del mensaje.  El hablante debe vincular laEl hablante debe vincular la información nueva con lo que elinformación nueva con lo que el escucha ya sabe.escucha ya sabe.
  • 41. Generación de textosGeneración de textos  En cierto grado es una tarea másEn cierto grado es una tarea más simple que la comprensión, ya quesimple que la comprensión, ya que por lo menos la computadora puedepor lo menos la computadora puede elegir las expresiones que sabeelegir las expresiones que sabe producir.producir.
  • 42.  Sin embargo, hay algunos problemas en laSin embargo, hay algunos problemas en la generación de texto. Uno reside en lageneración de texto. Uno reside en la necesidad de elegir las palabras ynecesidad de elegir las palabras y expresiones que «se usan» en el contextoexpresiones que «se usan» en el contexto dado.dado.  El otro problema es que el texto producidoEl otro problema es que el texto producido con los métodos de fuerza bruta escon los métodos de fuerza bruta es aburrido, incoherente y a veces noaburrido, incoherente y a veces no entendible.entendible.
  • 43.  El lenguaje es una estructura muyEl lenguaje es una estructura muy compleja. Afortunadamente, elcompleja. Afortunadamente, el codificador y decodificador funcionancodificador y decodificador funcionan en pasos, construyendo lasen pasos, construyendo las estructuras más complejas deestructuras más complejas de bloques más simples:bloques más simples:  Palabras de letras,Palabras de letras,−−  Oraciones de palabras,Oraciones de palabras,−−  Textos de oraciones.Textos de oraciones.−−
  • 44. Aplicaciones del PLNAplicaciones del PLN  Traducción automáticaTraducción automática..  Recuperación de la información.Recuperación de la información.  Extracción de Información yExtracción de Información y ResúmenesResúmenes..  Resolución cooperativa deResolución cooperativa de problemas.problemas.  Tutores inteligentesTutores inteligentes..  Reconocimiento de VozReconocimiento de Voz..