SlideShare una empresa de Scribd logo
1 de 5
Descargar para leer sin conexión
PRÁCTICA
OBLIGATORIA
3
OFIMÁTICA
AVANZADA
Juan Carlos García Arribas
Eduardo Ramírez Martínez-Esparza
Índice
Pasos Seguidos: Páginas 3 y 4.
Algoritmo empleado: Página 5.
Mejoras propuestas: Página 5.
Descripción de los pasos seguidos
Librerías empleadas: simmetrics y xerces.
Para la realización de esta práctica se creó un juego de 7 clases
diferentes, realizando cada una de ellas un trabajo específico.
1. Clase Noticia: Es la clase que contiene la información
de las noticias. Posee los atributos (título,
parrafo,fecha, listaPalabrasTitulo y listaPalabrasParrafo).
En cuanto a los métodos tiene el constructor, getTitulo y
getParrafo empleados para generar el XML, y por último
buscaParecidos que tiene como entrada un objeto de la
clase Noticia y compara mediante el algoritmo que
especificaremos más adelante si dos objetos de la clase
Noticia tienen relación.
2. Clase Parser: Esta clase se encarga de realizar la
extracción de la información de los documentos XML
dados para la realización de esta práctica. Se le ha
añadido un método extra llamado generaNoticia que
devuelve un objeto de la clase Noticia. Este método tiene
como parámetros de entrada una Lista de la clase String
que contiene los StopWords que se emplearán para
limpiar las palabras.
3. Clase ManejadorSAX: Realiza las llamadas a la clase
Parser y tiene como métodos generarNoticias, al que se
le pasa la ruta del fichero StopWords y la ruta del fichero
de la noticia.
Así mismo, tiene otro método privado llamado
generaStopWrods que abre el fichero de las palabras que
no aportan contenido y los mete en una lista.
4. Clase CrearDOM: Esta clase es empleada para generar
el árbol DOM de XML. La estructura elegida y es: como
raíz GruposNoticias, y como subelemento de
GruposNoticias empleamos a Grupo que contendrá el
número de grupo y el número de noticias. Así mismo
y por último tenemos como subhijo de Grupo a Noticia
que contendrá el título y el primer párrafo.
5. Clase Transformador: Esta clase se encarga de
transformar el documento XML generado por
CrearDOM en html mediante XSL.
6. Clase Cerebro: Es la clase que contiene objetos de
todas las clases anteriormente mencionadas. Su
funcionamiento es sencillo. Primero hacemos una lista de
archivos del directorio que se le pasa al constructor de
esta clase. Después extraemos con SAX toda la
información de los archivos XML listados. Una vez
extraída toda la información, generamos un archivo XML
con CrearDOM y por último lo transformamos a HTML con
la Clase Transformador.
7. La Clase MAIN es el programa principal y crea el objeto
Cerebro al que le pasa la carpeta de noticias y el archivo
de las StopWords. Por último hace la llamada al método
generarXML();
Algoritmo Empleado Para Relacionar Noticias
El algoritmo empleado para la realización de esta práctica emplea la
fecha de la publicación de la noticia para emplear la proximidad
referencial, es decir, las noticias que comparten fecha, tienen más
posibilidades de tener relación.
También empleamos las entidades nombradas extraídas del
primer párrafo y del título para realizar comparaciones.
El algoritmo se basa en un sistema de puntuación bastante
básico donde para conseguir un HIT (acierto), es necesario
puntuar 0,6.
El valor dado para la coincidencia de la fecha, es de 0,2 y el valor
dado para cada apariencia de las entidades nombradas es de
0,4. Por lo tanto, si tienen la misma fecha y una misma entidad
nombrada tendrán relación. Cuando tienen más de una
apariencia de entidad nombrada, se puntuará como 1 pues la
noticia tendrán claramente relación según nuestro algoritmo.
Para comparar las entidades nombradas, buscamos primero en el
título relaciones con la lista del título de la otra noticia y así mismo
con el primer párrafo. Se realiza de manera igual con la lista de
palabras del Primer párrafo de la noticia comparándola con el título
y la lista del primer párrafo.
Mejoras Propuestas
Para mejorar el LayOut (apariencia) empleamos un color fondo
de pantalla amigable para la vista, resalto de títulos en negrita y
se justifica el primer párrafo de cada noticia para una mejor
lectura. Así mismo se emplea un div con posición relativa para
ser más compatible con las resoluciones de los distintos
navegadores.

Más contenido relacionado

La actualidad más candente

La actualidad más candente (13)

Lissette pimentel 11 1149 --- listas, pilas y colas
Lissette pimentel 11 1149 --- listas, pilas y colasLissette pimentel 11 1149 --- listas, pilas y colas
Lissette pimentel 11 1149 --- listas, pilas y colas
 
Listas Enlazadas
Listas EnlazadasListas Enlazadas
Listas Enlazadas
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Métodos de búsqueda Gbi
Métodos de búsqueda GbiMétodos de búsqueda Gbi
Métodos de búsqueda Gbi
 
Webquest
WebquestWebquest
Webquest
 
Unidad 3
Unidad 3Unidad 3
Unidad 3
 
Manejo de archivos y carpetas
Manejo de archivos y carpetasManejo de archivos y carpetas
Manejo de archivos y carpetas
 
Tarea07_Bernalolivaresmariaesther
Tarea07_BernalolivaresmariaestherTarea07_Bernalolivaresmariaesther
Tarea07_Bernalolivaresmariaesther
 
metodos de busqueda
metodos de busquedametodos de busqueda
metodos de busqueda
 
Listas c#
Listas c#Listas c#
Listas c#
 
Programación 3: listas enlazadas
Programación 3: listas enlazadasProgramación 3: listas enlazadas
Programación 3: listas enlazadas
 
Capitulo 9 lombardo fernandez
Capitulo 9 lombardo fernandezCapitulo 9 lombardo fernandez
Capitulo 9 lombardo fernandez
 
Tarea07 bernal olivaresmariaesther
Tarea07 bernal olivaresmariaestherTarea07 bernal olivaresmariaesther
Tarea07 bernal olivaresmariaesther
 

Destacado

Planificaciones computación.....
Planificaciones computación.....Planificaciones computación.....
Planificaciones computación.....israelgarcianeira
 
3 planeaciones mate
3 planeaciones mate3 planeaciones mate
3 planeaciones mateYarelyM9
 
Informe de la competencia de ofimática
Informe de la competencia de ofimáticaInforme de la competencia de ofimática
Informe de la competencia de ofimáticaDiana Marcela Samboni
 
Fr Dc 15 Formato Avance Programatico
Fr Dc 15 Formato  Avance ProgramaticoFr Dc 15 Formato  Avance Programatico
Fr Dc 15 Formato Avance ProgramaticoUTP, TA
 
Presenación taller para niño "Bully"
Presenación taller para niño "Bully"Presenación taller para niño "Bully"
Presenación taller para niño "Bully"nancycarolyna
 
Planeacion estrategica 1.
Planeacion estrategica 1.Planeacion estrategica 1.
Planeacion estrategica 1.Patricia G Dam
 
Secuencias didácticas primer grado Secundaria Tecnica
Secuencias didácticas primer grado Secundaria TecnicaSecuencias didácticas primer grado Secundaria Tecnica
Secuencias didácticas primer grado Secundaria Tecnicajokschirino
 
Ofimática
OfimáticaOfimática
OfimáticaUsebeq
 
Secuencia didactica 2010 2011
Secuencia didactica 2010 2011Secuencia didactica 2010 2011
Secuencia didactica 2010 2011Alfonso Vite
 
Plan de area de informatica primaria y secundaria
Plan de area de informatica primaria y secundariaPlan de area de informatica primaria y secundaria
Plan de area de informatica primaria y secundariaJessica Mendoza
 

Destacado (16)

Planificaciones computación.....
Planificaciones computación.....Planificaciones computación.....
Planificaciones computación.....
 
3 planeaciones mate
3 planeaciones mate3 planeaciones mate
3 planeaciones mate
 
Informe de la competencia de ofimática
Informe de la competencia de ofimáticaInforme de la competencia de ofimática
Informe de la competencia de ofimática
 
Avance ofimatica 1_bloque_i_diurna
Avance ofimatica 1_bloque_i_diurnaAvance ofimatica 1_bloque_i_diurna
Avance ofimatica 1_bloque_i_diurna
 
Ofimatica 3
Ofimatica 3Ofimatica 3
Ofimatica 3
 
Fr Dc 15 Formato Avance Programatico
Fr Dc 15 Formato  Avance ProgramaticoFr Dc 15 Formato  Avance Programatico
Fr Dc 15 Formato Avance Programatico
 
Presenación taller para niño "Bully"
Presenación taller para niño "Bully"Presenación taller para niño "Bully"
Presenación taller para niño "Bully"
 
Planeacion y administracion estrategica
Planeacion y administracion estrategicaPlaneacion y administracion estrategica
Planeacion y administracion estrategica
 
Planeacion estrategica 1.
Planeacion estrategica 1.Planeacion estrategica 1.
Planeacion estrategica 1.
 
Secuencia didactica
Secuencia didacticaSecuencia didactica
Secuencia didactica
 
Cuarto bloque
Cuarto bloque Cuarto bloque
Cuarto bloque
 
Secuencias didácticas primer grado Secundaria Tecnica
Secuencias didácticas primer grado Secundaria TecnicaSecuencias didácticas primer grado Secundaria Tecnica
Secuencias didácticas primer grado Secundaria Tecnica
 
Ofimática
OfimáticaOfimática
Ofimática
 
Secuencia didactica 2010 2011
Secuencia didactica 2010 2011Secuencia didactica 2010 2011
Secuencia didactica 2010 2011
 
Plan de area de informatica primaria y secundaria
Plan de area de informatica primaria y secundariaPlan de area de informatica primaria y secundaria
Plan de area de informatica primaria y secundaria
 
Guia 3
Guia 3Guia 3
Guia 3
 

Similar a Obligatoria

Tema 5 arreglos y cadenas - lsia por gio
Tema 5   arreglos y cadenas - lsia por gioTema 5   arreglos y cadenas - lsia por gio
Tema 5 arreglos y cadenas - lsia por gioRobert Wolf
 
Integracion i reports_con_netbeans
Integracion i reports_con_netbeansIntegracion i reports_con_netbeans
Integracion i reports_con_netbeansDada3311
 
Programación orientada a objetos (Creación de clases)
Programación orientada a objetos (Creación de clases)Programación orientada a objetos (Creación de clases)
Programación orientada a objetos (Creación de clases)KareliaRivas
 
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)Oscar V
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfIsabella186538
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdflunarestrepo3
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfsaraNez13
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfsaraNez13
 
PresentacióN1
PresentacióN1PresentacióN1
PresentacióN1Rokr02
 
Estructura de datos
Estructura de datosEstructura de datos
Estructura de datoscrispi2029
 
Semanas01y02
Semanas01y02Semanas01y02
Semanas01y02luisortiz
 

Similar a Obligatoria (20)

A1 python 3
A1 python 3A1 python 3
A1 python 3
 
Tema 5 arreglos y cadenas - lsia por gio
Tema 5   arreglos y cadenas - lsia por gioTema 5   arreglos y cadenas - lsia por gio
Tema 5 arreglos y cadenas - lsia por gio
 
Práctica web de la sesión 3
Práctica web de la sesión 3Práctica web de la sesión 3
Práctica web de la sesión 3
 
Benita ppp unidad 1
Benita ppp unidad 1Benita ppp unidad 1
Benita ppp unidad 1
 
Integracion i reports_con_netbeans
Integracion i reports_con_netbeansIntegracion i reports_con_netbeans
Integracion i reports_con_netbeans
 
Programación orientada a objetos (Creación de clases)
Programación orientada a objetos (Creación de clases)Programación orientada a objetos (Creación de clases)
Programación orientada a objetos (Creación de clases)
 
Data frame
Data frameData frame
Data frame
 
Lab archivos
Lab archivosLab archivos
Lab archivos
 
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdf
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdf
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdf
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdf
 
Taller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdfTaller_ Excel avanzado.pdf
Taller_ Excel avanzado.pdf
 
PresentacióN1
PresentacióN1PresentacióN1
PresentacióN1
 
POO
POOPOO
POO
 
Guia poo php
Guia poo phpGuia poo php
Guia poo php
 
Estructura de datos
Estructura de datosEstructura de datos
Estructura de datos
 
Estructura de datos
Estructura de datosEstructura de datos
Estructura de datos
 
Semanas01y02
Semanas01y02Semanas01y02
Semanas01y02
 

Más de buugggmenot Perezix (9)

St7920
St7920St7920
St7920
 
Hugo Evans
Hugo EvansHugo Evans
Hugo Evans
 
607
607607
607
 
3 dic 技術論壇
3 dic 技術論壇3 dic 技術論壇
3 dic 技術論壇
 
3 d ic
3 d ic3 d ic
3 d ic
 
3 d
3 d3 d
3 d
 
1.三維積體電路研究群
1.三維積體電路研究群1.三維積體電路研究群
1.三維積體電路研究群
 
19002 ftii 20091_examen1
19002 ftii 20091_examen119002 ftii 20091_examen1
19002 ftii 20091_examen1
 
Eva chaloupková
Eva chaloupkováEva chaloupková
Eva chaloupková
 

Último

Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfYanitza28
 
Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024NicolleAndrade7
 
microsoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamtemicrosoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamte2024020140
 
herramientas web para estudiantes interesados en el tema
herramientas web para estudiantes interesados en el temaherramientas web para estudiantes interesados en el tema
herramientas web para estudiantes interesados en el temaJadeVilcscordova
 
Editorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdfEditorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdfYanitza28
 
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdfjuan23xpx
 
Función del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacionFunción del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacionEmanuelMuoz11
 
presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...axelv9257
 
Tipos de datos en Microsoft Access de Base de Datos
Tipos de datos en Microsoft Access de Base de DatosTipos de datos en Microsoft Access de Base de Datos
Tipos de datos en Microsoft Access de Base de DatosYOMIRAVILLARREAL1
 
Chat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaChat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaEdwinGarca59
 
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptxTipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptxJOELGARCIA849853
 
10°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-810°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-8antoniopalmieriluna
 
Introduccion-a-la-electronica-industrial.pptx
Introduccion-a-la-electronica-industrial.pptxIntroduccion-a-la-electronica-industrial.pptx
Introduccion-a-la-electronica-industrial.pptxcj12paz
 
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptxinfor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptxgustavovasquezv56
 
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptxAVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptxdulcemonterroza
 
Imágenes digitales: Calidad de la información
Imágenes digitales: Calidad de la informaciónImágenes digitales: Calidad de la información
Imágenes digitales: Calidad de la informaciónUniversidad de Sonora
 
NIA_300_PLANEACION_DE_UNA_AUDITORIA_DE_E.pptx
NIA_300_PLANEACION_DE_UNA_AUDITORIA_DE_E.pptxNIA_300_PLANEACION_DE_UNA_AUDITORIA_DE_E.pptx
NIA_300_PLANEACION_DE_UNA_AUDITORIA_DE_E.pptxDaniloDaz4
 
Desarrollo del Dominio del Internet - Estrada
Desarrollo del Dominio del Internet - EstradaDesarrollo del Dominio del Internet - Estrada
Desarrollo del Dominio del Internet - EstradaRicardoEstrada90
 
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdfpresentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdfaxelv9257
 
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptx
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptxTarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptx
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptxVICTORMANUELBEASAGUI
 

Último (20)

Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
 
Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024
 
microsoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamtemicrosoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamte
 
herramientas web para estudiantes interesados en el tema
herramientas web para estudiantes interesados en el temaherramientas web para estudiantes interesados en el tema
herramientas web para estudiantes interesados en el tema
 
Editorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdfEditorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdf
 
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
 
Función del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacionFunción del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacion
 
presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...
 
Tipos de datos en Microsoft Access de Base de Datos
Tipos de datos en Microsoft Access de Base de DatosTipos de datos en Microsoft Access de Base de Datos
Tipos de datos en Microsoft Access de Base de Datos
 
Chat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaChat GPT para la educación Latinoamerica
Chat GPT para la educación Latinoamerica
 
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptxTipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
 
10°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-810°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-8
 
Introduccion-a-la-electronica-industrial.pptx
Introduccion-a-la-electronica-industrial.pptxIntroduccion-a-la-electronica-industrial.pptx
Introduccion-a-la-electronica-industrial.pptx
 
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptxinfor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
 
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptxAVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
 
Imágenes digitales: Calidad de la información
Imágenes digitales: Calidad de la informaciónImágenes digitales: Calidad de la información
Imágenes digitales: Calidad de la información
 
NIA_300_PLANEACION_DE_UNA_AUDITORIA_DE_E.pptx
NIA_300_PLANEACION_DE_UNA_AUDITORIA_DE_E.pptxNIA_300_PLANEACION_DE_UNA_AUDITORIA_DE_E.pptx
NIA_300_PLANEACION_DE_UNA_AUDITORIA_DE_E.pptx
 
Desarrollo del Dominio del Internet - Estrada
Desarrollo del Dominio del Internet - EstradaDesarrollo del Dominio del Internet - Estrada
Desarrollo del Dominio del Internet - Estrada
 
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdfpresentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
 
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptx
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptxTarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptx
Tarea_sesion_15_Reportes Maestro - Detalle con el uso de AJAX.pptx
 

Obligatoria

  • 1. PRÁCTICA OBLIGATORIA 3 OFIMÁTICA AVANZADA Juan Carlos García Arribas Eduardo Ramírez Martínez-Esparza
  • 2. Índice Pasos Seguidos: Páginas 3 y 4. Algoritmo empleado: Página 5. Mejoras propuestas: Página 5.
  • 3. Descripción de los pasos seguidos Librerías empleadas: simmetrics y xerces. Para la realización de esta práctica se creó un juego de 7 clases diferentes, realizando cada una de ellas un trabajo específico. 1. Clase Noticia: Es la clase que contiene la información de las noticias. Posee los atributos (título, parrafo,fecha, listaPalabrasTitulo y listaPalabrasParrafo). En cuanto a los métodos tiene el constructor, getTitulo y getParrafo empleados para generar el XML, y por último buscaParecidos que tiene como entrada un objeto de la clase Noticia y compara mediante el algoritmo que especificaremos más adelante si dos objetos de la clase Noticia tienen relación. 2. Clase Parser: Esta clase se encarga de realizar la extracción de la información de los documentos XML dados para la realización de esta práctica. Se le ha añadido un método extra llamado generaNoticia que devuelve un objeto de la clase Noticia. Este método tiene como parámetros de entrada una Lista de la clase String que contiene los StopWords que se emplearán para limpiar las palabras. 3. Clase ManejadorSAX: Realiza las llamadas a la clase Parser y tiene como métodos generarNoticias, al que se le pasa la ruta del fichero StopWords y la ruta del fichero de la noticia. Así mismo, tiene otro método privado llamado generaStopWrods que abre el fichero de las palabras que no aportan contenido y los mete en una lista. 4. Clase CrearDOM: Esta clase es empleada para generar el árbol DOM de XML. La estructura elegida y es: como raíz GruposNoticias, y como subelemento de GruposNoticias empleamos a Grupo que contendrá el número de grupo y el número de noticias. Así mismo y por último tenemos como subhijo de Grupo a Noticia que contendrá el título y el primer párrafo. 5. Clase Transformador: Esta clase se encarga de transformar el documento XML generado por CrearDOM en html mediante XSL.
  • 4. 6. Clase Cerebro: Es la clase que contiene objetos de todas las clases anteriormente mencionadas. Su funcionamiento es sencillo. Primero hacemos una lista de archivos del directorio que se le pasa al constructor de esta clase. Después extraemos con SAX toda la información de los archivos XML listados. Una vez extraída toda la información, generamos un archivo XML con CrearDOM y por último lo transformamos a HTML con la Clase Transformador. 7. La Clase MAIN es el programa principal y crea el objeto Cerebro al que le pasa la carpeta de noticias y el archivo de las StopWords. Por último hace la llamada al método generarXML();
  • 5. Algoritmo Empleado Para Relacionar Noticias El algoritmo empleado para la realización de esta práctica emplea la fecha de la publicación de la noticia para emplear la proximidad referencial, es decir, las noticias que comparten fecha, tienen más posibilidades de tener relación. También empleamos las entidades nombradas extraídas del primer párrafo y del título para realizar comparaciones. El algoritmo se basa en un sistema de puntuación bastante básico donde para conseguir un HIT (acierto), es necesario puntuar 0,6. El valor dado para la coincidencia de la fecha, es de 0,2 y el valor dado para cada apariencia de las entidades nombradas es de 0,4. Por lo tanto, si tienen la misma fecha y una misma entidad nombrada tendrán relación. Cuando tienen más de una apariencia de entidad nombrada, se puntuará como 1 pues la noticia tendrán claramente relación según nuestro algoritmo. Para comparar las entidades nombradas, buscamos primero en el título relaciones con la lista del título de la otra noticia y así mismo con el primer párrafo. Se realiza de manera igual con la lista de palabras del Primer párrafo de la noticia comparándola con el título y la lista del primer párrafo. Mejoras Propuestas Para mejorar el LayOut (apariencia) empleamos un color fondo de pantalla amigable para la vista, resalto de títulos en negrita y se justifica el primer párrafo de cada noticia para una mejor lectura. Así mismo se emplea un div con posición relativa para ser más compatible con las resoluciones de los distintos navegadores.