SlideShare una empresa de Scribd logo
1 de 19
Herramientas para extracción y mejora de la
calidad de los datos a intercambiar .

Gabriel Berlicki
Administrador de Datos
División de Modernización de Infraestructuras
Procedimiento normal de generacion
de archivos de datos en Latipat
 En la mayoría de los países que Envían datos a Latipat
 EPO y Ompi, el procedimiento de extracción y mejora de
 los mismos pasa por las siguientes etapas:
     • Extracción de datos desde el sistema con un
       procedimiento de la base de datos
     • Constitución de un archivo de texto de acuerdo a
       st32 ( o directamente XML ST36)
     • Que se controla manualmente ( a veces utilizando
       la herramienta IPCONV de EPO)
     • Una vez validado es enviado ( ftp o correo)
Procesamiento de los archivos
 Una vez recibido por EPO, los archivos son validados, y
 en caso de serpasa que hay que corregir algún que otro
  Pero siempre necesario corregidos en forma
  registro.
 automática y hasta en forma manual.
 En el caso de OMPI, se las prioridades, puede pasar
  En el caso particular de esta comenzando a
  que se necesite de un operador humano para realizar la
 implementar un procedimiento similar
  validación del valor o la asignación del real
 Esto es necesario para poder tener un relacionamiento
  No es necesario explicar que es un procedimiento lento,
 valido de los registros recibidos desde los países con los
 equivalentes que pudieseen muchos casos es el que
  tedioso y costoso, y que tener a nivel internacional.
  demora la carga de los datos y su relacionamiento con
 Para los países de Latipat, y luego de todo el
  otros documentos
 entrenamiento proporcionado en los seminarios
 anteriores, se puede mencionar que:
          La calidad es muy buena.
Porque repetimos tanto relacionamiento?
   El problema a fin y al cabo es el lenguaje.
   Los sistemas de traducción automática aun esta en
   pañales.
   Si un usuario no hispano o luso parlante ( ej de US, EU o
   asiáticos ) desea enterarse que es lo que esta protegido
   en un determinado país de Latinoamérica. La puede tener
   muy complicada.
   Cualquier inversor extranjero antes de comenzar un
   proyecto, lo primero que hace es tratar de evaluar que
   protección tiene (en el país a instalarse) en su área
   especifica de trabajo
Cont.
 Nobien hay el tema de producción de genéricos,
 Si solo es algunos sistemas que permiten la
 hay que tener en cuenta que muchos de
 traducción automática de la estrategia
 procedimientos industriales están protegidos.
 búsqueda.
 Y el mismos solo tienen utilidad para el usuario no
 Los existir un documento que proteja dicho
 procedimiento, implica la negociación de una
 profesional.
 licencia de uso. O sea el precio del producto final
 BASF no va a utilizar CLIR para saber si algo lo
 va a ser mayor. no en un país determinado.
 puede afectar o
Cont.
  Lo mas probable es que el inversor procederá a verificar si
  las patentes de sus competidores se encuentran
  presentadas en el país.
  Obviamente eso pasara por una eventual solicitud de
  búsqueda en la oficina del país para tener un documento
  oficial de que no fue presentado.
  Pero inicialmente consultara que no existan registros
  equivalentes a dichos documentos en la Master Database
  (DocDB).
  A través de hacer una búsqueda en Espacenet, en otro
  proveedor privado con acceso a la misma.
  O para máximo nivel de seguridad, en una copia local de
  DocDB que haya podido obtener, particularmente para
  evitar monitoreo de sus intenciones de inversión )
  O en Patenscope (particularmente la cobertura
de países de la región es muy buena).
El punto es …. (…..por fin Gabe…)
  Al fin y al cabo, ellos buscan relacionamientos,
  equivalentes locales...

  Por lo que no es lo mismo que un documento este bien
  relacionado.
Y si se comete un pequeño error?

                                      AU2008904924
                               De    AU2008904924




A:   AU2003904924

     No es un error importante no?
AU2003904924
Problemas de la postcorreccion
 Particularmente, siun lenguaje realiza de EPO, errores en
  El español no es el inversor oficial una búsqueda
 local y el documento que le interesa no posibles
  la corrección manual de los datos son fue encontrado,
 porque el numero se prioridad por elOMPIse le están por
  Los mecanismos de corrección en cual aun busco en
  determinar, probablemente no incluirán corrección
 la base nacional fue ingresado incorrectamente
  humana con interpretación del documento.
 Particularmente si hay un informe firmado por el
  En cualquier caso, toda corrección que se realiza luego
 Director, mencionando que la invención no fue
  del envió a Latipat, difícilmente se refleje en las bases
 registrada en la Oficina...
  nacionales.
 El problema no lo va a tener el administrativo que se
 equivocopuede traer graves problemas a posteriori para
  Lo cual o el examinador que no encontró el
  la oficina nacional.
 documento, el problema es de informática:
  “Que no hizo los esfuerzos necesarios para validar la
  información contenida en la base de datos“.
Digamos que...
 El que un documento no sea relacionado en la forma
 correcta puede tener consecuencias complicadas para
 el inversor...
 Su Director...
 Y USTEDES
 Tengan en cuenta que estos ejemplos son una
 construcción hipotética, no hay casos tan marcados
 como esto....y esperemos que sigan así
Alternativas
 Inclusión de mecanismos de validación de los datos de
 prioridad que se ingresan en las interfaces de captura
 manual de datos.
 Los mismos pueden ser construidos basados en las
 reglas de números de publicación y solicitud que publica
 le EPO en el siguiente link:
 http://www.epo.org/searching/essentials/data/tables.html
 Mayormente allí se encuentran los formatos utilizados
 por los países de los solicitantes que normalmente
 registran prioridades en Latinoamérica.
 Otra alternativa es la validación de los mismos previo al
 envió, con el correspondiente registro de la información
 corregida en la base de datos.
Pucha Gabe mas trabajo....
 Bueno no tanto…

 OMPI esta adicionalmente preparando una aplicación
 para la extracción directa, validación de los datos y
 preparación de contenedor bibliográfico de acuerdo al
 ST.36:
                                  t
                   WIPO Q @ S
                            u      o
                            a      u
                            l      r
                            i      c
                            t      e
                            y
WIPOQ@S que es?
 Una aplicación externa que interroga a la base de datos
 de la oficina sobre las solicitudes que han sido
 publicadas en el mes(u otro intervalo de tiempo)
 Recupera los datos necesarios de los diferentes campos
 de la base (hasta aquí como los procedimientos
 utilizados normalmente)
 A partir de allí procede a validar los datos respecto a
 reglas predefinidas (como las mencionadas
 anteriormente para prioridades)
 Si no es posible validar, interroga al usuario sobre el
 error encontrado y le propone alternativas (brindadas
 por las reglas) y adicionalmente proveyendo la
 información que (en lo posible) se pueda disponer de un
 equivalente encontrado en Espacenet o Patentscope
Cont.
 Finalmente generaría un reporte de lo realizado y los
 archivos correspondientes en formato ST.36 ( y ST.32 si
 se debe mantener compatibilidad de envíos por un
 tiempo limitado)
 Cabria la posibilidad que cuando la información se
 valida se incluya la facilidad de escribir la base de datos.
 Pero esto debería ser discutido con cada oficina, no es
 una decisión fácil de tomar para el encargado de IT y
 tampoco es fácil de implementar( cuestiones de
 seguridad y configuración de como realizar la escritura
 de los datos).
En resumen..

 Básicamente se realizaría la interrogación de la base de
 datos mediante la ejecución de SQLs configurables en
 un archivo XML

 Las reglas de corrección validación se mantendrían en
 una base de datos, que podrían ser actualizadas e
 incluso mejoradas por la oficina( particularmente si
 saben de algún error repetitivo en la captura de los
 datos)
Estado del proyecto.

 Prototipo implementado en ONAPI desde principios de
 2011, produciendo los datos que se envían a EPO y
 Patentscope.

 Si dicho prototipo encuentra una solicitud sin
 clasificación, la cual posee un equivalente en Espacenet
 o Patentscope, descarga la clasificación del mismo y lo
 incluye en el ST.36 del registro a enviar (un beneficio
 adicional de la posibilidad de validar los datos).
Cont.
 Por el momento el prototipo esta basado en línea de
 comando y no interroga al usuario ( interface inicial a
 implementar antes de fin de año)
 En fase de construcción y mejora de las reglas a aplicar
 a las prioridades de los países que se conocen.
 Un producto secundario del proyecto es una base de
 datos con expresiones regulares para corregir los datos
 de prioridad.
 Actualmente disponibles reglas para BR, ES, EP y US.
Cont.

 Posibilidad de versión light, que no interrogue a la base
 de datos y se base en la lectura de un archivo de texto,
 a la IPCONV. Pero que incluya las validaciones.
 Panamá esta comenzando a utilizar una versión similar,
 hasta que sea posible la implementación de la versión
 con interrogación de la base de datos.
Futuro del proyecto

 Versión "funcional" e instalable para fin de año (código
 basado en Perl).

 A partir de allí, comenzaría una la reescritura y mejora
 del código por contratista externo(a la vez de convertir el
 código a Java), para tener una versión como producto
 oficial de OMPI para la segunda mitad de 2012.

Más contenido relacionado

Similar a Gb wipoq@s

Sesion 3: Método de desarrollo de proyecto
Sesion 3: Método de desarrollo de proyectoSesion 3: Método de desarrollo de proyecto
Sesion 3: Método de desarrollo de proyectoelearningCANDANE
 
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-SourceWeb-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-Sourcesenado-web-clon
 
Oswaldo jirones ipc
Oswaldo jirones ipcOswaldo jirones ipc
Oswaldo jirones ipcLATIPAT
 
Sesion 05 erp
Sesion 05 erpSesion 05 erp
Sesion 05 erpmydraw
 
Sistema para la gestión de interrupciones y medios informáticos en Artex S.A
Sistema para la gestión de interrupciones y medios informáticos en Artex S.ASistema para la gestión de interrupciones y medios informáticos en Artex S.A
Sistema para la gestión de interrupciones y medios informáticos en Artex S.ARodrigoGonzlezEsparz
 
Estrategia empresa virtual (punto 2 unidad 2)
Estrategia empresa virtual (punto 2 unidad 2)Estrategia empresa virtual (punto 2 unidad 2)
Estrategia empresa virtual (punto 2 unidad 2)JUAN ENRIQUE
 
Introducción a la base de datos - Taller N° 1
Introducción a la base de datos - Taller N° 1Introducción a la base de datos - Taller N° 1
Introducción a la base de datos - Taller N° 1AndreaTuta
 
Trabajo de base de datos
Trabajo de base de datosTrabajo de base de datos
Trabajo de base de datosMerlyn Peraza
 
Proseso de diseño de un (si)
Proseso de diseño de un (si)Proseso de diseño de un (si)
Proseso de diseño de un (si)marcelino garcia
 
Maria capuzzo blogdigital
Maria capuzzo blogdigitalMaria capuzzo blogdigital
Maria capuzzo blogdigitalMariaCapuzzo
 

Similar a Gb wipoq@s (20)

Taller 1 access
Taller 1 accessTaller 1 access
Taller 1 access
 
Clase 6, 5/9/2007
Clase 6, 5/9/2007Clase 6, 5/9/2007
Clase 6, 5/9/2007
 
Sesion 3: Método de desarrollo de proyecto
Sesion 3: Método de desarrollo de proyectoSesion 3: Método de desarrollo de proyecto
Sesion 3: Método de desarrollo de proyecto
 
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-SourceWeb-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
 
Oswaldo jirones ipc
Oswaldo jirones ipcOswaldo jirones ipc
Oswaldo jirones ipc
 
Sesion 05 erp
Sesion 05 erpSesion 05 erp
Sesion 05 erp
 
Dominios producto final
Dominios producto finalDominios producto final
Dominios producto final
 
Informe big data
Informe big dataInforme big data
Informe big data
 
Sistema para la gestión de interrupciones y medios informáticos en Artex S.A
Sistema para la gestión de interrupciones y medios informáticos en Artex S.ASistema para la gestión de interrupciones y medios informáticos en Artex S.A
Sistema para la gestión de interrupciones y medios informáticos en Artex S.A
 
Estrategia empresa virtual (punto 2 unidad 2)
Estrategia empresa virtual (punto 2 unidad 2)Estrategia empresa virtual (punto 2 unidad 2)
Estrategia empresa virtual (punto 2 unidad 2)
 
Empresa siste +
Empresa siste +Empresa siste +
Empresa siste +
 
Introducción a la base de datos - Taller N° 1
Introducción a la base de datos - Taller N° 1Introducción a la base de datos - Taller N° 1
Introducción a la base de datos - Taller N° 1
 
Ers calzado ferrel
Ers calzado ferrelErs calzado ferrel
Ers calzado ferrel
 
Top Bug
Top BugTop Bug
Top Bug
 
Sistema de tramite documentario ppt
Sistema de tramite documentario pptSistema de tramite documentario ppt
Sistema de tramite documentario ppt
 
METODOLOGIA EMPLEADA
METODOLOGIA EMPLEADAMETODOLOGIA EMPLEADA
METODOLOGIA EMPLEADA
 
La biblia del foot printing
La biblia del foot printingLa biblia del foot printing
La biblia del foot printing
 
Trabajo de base de datos
Trabajo de base de datosTrabajo de base de datos
Trabajo de base de datos
 
Proseso de diseño de un (si)
Proseso de diseño de un (si)Proseso de diseño de un (si)
Proseso de diseño de un (si)
 
Maria capuzzo blogdigital
Maria capuzzo blogdigitalMaria capuzzo blogdigital
Maria capuzzo blogdigital
 

Más de LATIPAT

Ftp data exchange-mechanism
Ftp data exchange-mechanismFtp data exchange-mechanism
Ftp data exchange-mechanismLATIPAT
 
Citation data flow 2012 nat latipat
Citation data flow 2012 nat latipatCitation data flow 2012 nat latipat
Citation data flow 2012 nat latipatLATIPAT
 
2012 11 latipat-cpc_epo
2012 11 latipat-cpc_epo2012 11 latipat-cpc_epo
2012 11 latipat-cpc_epoLATIPAT
 
2012 11 latipat-ccd_epo
2012 11 latipat-ccd_epo2012 11 latipat-ccd_epo
2012 11 latipat-ccd_epoLATIPAT
 
03 patent families latipat the powerpoint
03 patent families latipat   the powerpoint03 patent families latipat   the powerpoint
03 patent families latipat the powerpointLATIPAT
 
Servicios de información y fuentes latest developments sept_2011
Servicios de información y fuentes latest developments sept_2011Servicios de información y fuentes latest developments sept_2011
Servicios de información y fuentes latest developments sept_2011LATIPAT
 
Intercambio electrónico 2011
Intercambio electrónico 2011Intercambio electrónico 2011
Intercambio electrónico 2011LATIPAT
 
Estadistica acceso latipat
Estadistica acceso latipatEstadistica acceso latipat
Estadistica acceso latipatLATIPAT
 
Epo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesEpo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesLATIPAT
 
Presentacion 20111019 latipat
Presentacion 20111019 latipatPresentacion 20111019 latipat
Presentacion 20111019 latipatLATIPAT
 
Presentation vm latipat2011 ver 3
Presentation vm latipat2011 ver 3Presentation vm latipat2011 ver 3
Presentation vm latipat2011 ver 3LATIPAT
 
Papel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arPapel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arLATIPAT
 
Epo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesEpo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesLATIPAT
 
Papel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arPapel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arLATIPAT
 
2011 reunión latipat alberto casado
2011  reunión latipat alberto casado2011  reunión latipat alberto casado
2011 reunión latipat alberto casadoLATIPAT
 
2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentesLATIPAT
 
2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentesLATIPAT
 
2011 alberto casado._reunión_latipat_(version_2)
2011 alberto casado._reunión_latipat_(version_2)2011 alberto casado._reunión_latipat_(version_2)
2011 alberto casado._reunión_latipat_(version_2)LATIPAT
 
Latipat2011
Latipat2011Latipat2011
Latipat2011LATIPAT
 
Latipat cuba
Latipat  cubaLatipat  cuba
Latipat cubaLATIPAT
 

Más de LATIPAT (20)

Ftp data exchange-mechanism
Ftp data exchange-mechanismFtp data exchange-mechanism
Ftp data exchange-mechanism
 
Citation data flow 2012 nat latipat
Citation data flow 2012 nat latipatCitation data flow 2012 nat latipat
Citation data flow 2012 nat latipat
 
2012 11 latipat-cpc_epo
2012 11 latipat-cpc_epo2012 11 latipat-cpc_epo
2012 11 latipat-cpc_epo
 
2012 11 latipat-ccd_epo
2012 11 latipat-ccd_epo2012 11 latipat-ccd_epo
2012 11 latipat-ccd_epo
 
03 patent families latipat the powerpoint
03 patent families latipat   the powerpoint03 patent families latipat   the powerpoint
03 patent families latipat the powerpoint
 
Servicios de información y fuentes latest developments sept_2011
Servicios de información y fuentes latest developments sept_2011Servicios de información y fuentes latest developments sept_2011
Servicios de información y fuentes latest developments sept_2011
 
Intercambio electrónico 2011
Intercambio electrónico 2011Intercambio electrónico 2011
Intercambio electrónico 2011
 
Estadistica acceso latipat
Estadistica acceso latipatEstadistica acceso latipat
Estadistica acceso latipat
 
Epo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesEpo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniques
 
Presentacion 20111019 latipat
Presentacion 20111019 latipatPresentacion 20111019 latipat
Presentacion 20111019 latipat
 
Presentation vm latipat2011 ver 3
Presentation vm latipat2011 ver 3Presentation vm latipat2011 ver 3
Presentation vm latipat2011 ver 3
 
Papel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arPapel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_ar
 
Epo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesEpo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniques
 
Papel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arPapel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_ar
 
2011 reunión latipat alberto casado
2011  reunión latipat alberto casado2011  reunión latipat alberto casado
2011 reunión latipat alberto casado
 
2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes
 
2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes
 
2011 alberto casado._reunión_latipat_(version_2)
2011 alberto casado._reunión_latipat_(version_2)2011 alberto casado._reunión_latipat_(version_2)
2011 alberto casado._reunión_latipat_(version_2)
 
Latipat2011
Latipat2011Latipat2011
Latipat2011
 
Latipat cuba
Latipat  cubaLatipat  cuba
Latipat cuba
 

Último

OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxjosetrinidadchavez
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfDannyTola1
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docxAgustinaNuez21
 
Plan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPEPlan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPELaura Chacón
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIAAbelardoVelaAlbrecht1
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfvictorbeltuce
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxJUANSIMONPACHIN
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
Procesos Didácticos en Educación Inicial .pptx
Procesos Didácticos en Educación Inicial .pptxProcesos Didácticos en Educación Inicial .pptx
Procesos Didácticos en Educación Inicial .pptxMapyMerma1
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxdanalikcruz2000
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfBIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfCESARMALAGA4
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas123yudy
 

Último (20)

OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdf
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docx
 
Plan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPEPlan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPE
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
Procesos Didácticos en Educación Inicial .pptx
Procesos Didácticos en Educación Inicial .pptxProcesos Didácticos en Educación Inicial .pptx
Procesos Didácticos en Educación Inicial .pptx
 
Power Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptxPower Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptx
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
DIA INTERNACIONAL DAS FLORESTAS .
DIA INTERNACIONAL DAS FLORESTAS         .DIA INTERNACIONAL DAS FLORESTAS         .
DIA INTERNACIONAL DAS FLORESTAS .
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfBIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas
 

Gb wipoq@s

  • 1. Herramientas para extracción y mejora de la calidad de los datos a intercambiar . Gabriel Berlicki Administrador de Datos División de Modernización de Infraestructuras
  • 2. Procedimiento normal de generacion de archivos de datos en Latipat En la mayoría de los países que Envían datos a Latipat EPO y Ompi, el procedimiento de extracción y mejora de los mismos pasa por las siguientes etapas: • Extracción de datos desde el sistema con un procedimiento de la base de datos • Constitución de un archivo de texto de acuerdo a st32 ( o directamente XML ST36) • Que se controla manualmente ( a veces utilizando la herramienta IPCONV de EPO) • Una vez validado es enviado ( ftp o correo)
  • 3. Procesamiento de los archivos Una vez recibido por EPO, los archivos son validados, y en caso de serpasa que hay que corregir algún que otro Pero siempre necesario corregidos en forma registro. automática y hasta en forma manual. En el caso de OMPI, se las prioridades, puede pasar En el caso particular de esta comenzando a que se necesite de un operador humano para realizar la implementar un procedimiento similar validación del valor o la asignación del real Esto es necesario para poder tener un relacionamiento No es necesario explicar que es un procedimiento lento, valido de los registros recibidos desde los países con los equivalentes que pudieseen muchos casos es el que tedioso y costoso, y que tener a nivel internacional. demora la carga de los datos y su relacionamiento con Para los países de Latipat, y luego de todo el otros documentos entrenamiento proporcionado en los seminarios anteriores, se puede mencionar que: La calidad es muy buena.
  • 4. Porque repetimos tanto relacionamiento? El problema a fin y al cabo es el lenguaje. Los sistemas de traducción automática aun esta en pañales. Si un usuario no hispano o luso parlante ( ej de US, EU o asiáticos ) desea enterarse que es lo que esta protegido en un determinado país de Latinoamérica. La puede tener muy complicada. Cualquier inversor extranjero antes de comenzar un proyecto, lo primero que hace es tratar de evaluar que protección tiene (en el país a instalarse) en su área especifica de trabajo
  • 5. Cont. Nobien hay el tema de producción de genéricos, Si solo es algunos sistemas que permiten la hay que tener en cuenta que muchos de traducción automática de la estrategia procedimientos industriales están protegidos. búsqueda. Y el mismos solo tienen utilidad para el usuario no Los existir un documento que proteja dicho procedimiento, implica la negociación de una profesional. licencia de uso. O sea el precio del producto final BASF no va a utilizar CLIR para saber si algo lo va a ser mayor. no en un país determinado. puede afectar o
  • 6. Cont. Lo mas probable es que el inversor procederá a verificar si las patentes de sus competidores se encuentran presentadas en el país. Obviamente eso pasara por una eventual solicitud de búsqueda en la oficina del país para tener un documento oficial de que no fue presentado. Pero inicialmente consultara que no existan registros equivalentes a dichos documentos en la Master Database (DocDB). A través de hacer una búsqueda en Espacenet, en otro proveedor privado con acceso a la misma. O para máximo nivel de seguridad, en una copia local de DocDB que haya podido obtener, particularmente para evitar monitoreo de sus intenciones de inversión ) O en Patenscope (particularmente la cobertura de países de la región es muy buena).
  • 7. El punto es …. (…..por fin Gabe…) Al fin y al cabo, ellos buscan relacionamientos, equivalentes locales... Por lo que no es lo mismo que un documento este bien relacionado.
  • 8. Y si se comete un pequeño error? AU2008904924 De AU2008904924 A: AU2003904924 No es un error importante no? AU2003904924
  • 9. Problemas de la postcorreccion Particularmente, siun lenguaje realiza de EPO, errores en El español no es el inversor oficial una búsqueda local y el documento que le interesa no posibles la corrección manual de los datos son fue encontrado, porque el numero se prioridad por elOMPIse le están por Los mecanismos de corrección en cual aun busco en determinar, probablemente no incluirán corrección la base nacional fue ingresado incorrectamente humana con interpretación del documento. Particularmente si hay un informe firmado por el En cualquier caso, toda corrección que se realiza luego Director, mencionando que la invención no fue del envió a Latipat, difícilmente se refleje en las bases registrada en la Oficina... nacionales. El problema no lo va a tener el administrativo que se equivocopuede traer graves problemas a posteriori para Lo cual o el examinador que no encontró el la oficina nacional. documento, el problema es de informática: “Que no hizo los esfuerzos necesarios para validar la información contenida en la base de datos“.
  • 10. Digamos que... El que un documento no sea relacionado en la forma correcta puede tener consecuencias complicadas para el inversor... Su Director... Y USTEDES Tengan en cuenta que estos ejemplos son una construcción hipotética, no hay casos tan marcados como esto....y esperemos que sigan así
  • 11. Alternativas Inclusión de mecanismos de validación de los datos de prioridad que se ingresan en las interfaces de captura manual de datos. Los mismos pueden ser construidos basados en las reglas de números de publicación y solicitud que publica le EPO en el siguiente link: http://www.epo.org/searching/essentials/data/tables.html Mayormente allí se encuentran los formatos utilizados por los países de los solicitantes que normalmente registran prioridades en Latinoamérica. Otra alternativa es la validación de los mismos previo al envió, con el correspondiente registro de la información corregida en la base de datos.
  • 12. Pucha Gabe mas trabajo.... Bueno no tanto… OMPI esta adicionalmente preparando una aplicación para la extracción directa, validación de los datos y preparación de contenedor bibliográfico de acuerdo al ST.36: t WIPO Q @ S u o a u l r i c t e y
  • 13. WIPOQ@S que es? Una aplicación externa que interroga a la base de datos de la oficina sobre las solicitudes que han sido publicadas en el mes(u otro intervalo de tiempo) Recupera los datos necesarios de los diferentes campos de la base (hasta aquí como los procedimientos utilizados normalmente) A partir de allí procede a validar los datos respecto a reglas predefinidas (como las mencionadas anteriormente para prioridades) Si no es posible validar, interroga al usuario sobre el error encontrado y le propone alternativas (brindadas por las reglas) y adicionalmente proveyendo la información que (en lo posible) se pueda disponer de un equivalente encontrado en Espacenet o Patentscope
  • 14. Cont. Finalmente generaría un reporte de lo realizado y los archivos correspondientes en formato ST.36 ( y ST.32 si se debe mantener compatibilidad de envíos por un tiempo limitado) Cabria la posibilidad que cuando la información se valida se incluya la facilidad de escribir la base de datos. Pero esto debería ser discutido con cada oficina, no es una decisión fácil de tomar para el encargado de IT y tampoco es fácil de implementar( cuestiones de seguridad y configuración de como realizar la escritura de los datos).
  • 15. En resumen.. Básicamente se realizaría la interrogación de la base de datos mediante la ejecución de SQLs configurables en un archivo XML Las reglas de corrección validación se mantendrían en una base de datos, que podrían ser actualizadas e incluso mejoradas por la oficina( particularmente si saben de algún error repetitivo en la captura de los datos)
  • 16. Estado del proyecto. Prototipo implementado en ONAPI desde principios de 2011, produciendo los datos que se envían a EPO y Patentscope. Si dicho prototipo encuentra una solicitud sin clasificación, la cual posee un equivalente en Espacenet o Patentscope, descarga la clasificación del mismo y lo incluye en el ST.36 del registro a enviar (un beneficio adicional de la posibilidad de validar los datos).
  • 17. Cont. Por el momento el prototipo esta basado en línea de comando y no interroga al usuario ( interface inicial a implementar antes de fin de año) En fase de construcción y mejora de las reglas a aplicar a las prioridades de los países que se conocen. Un producto secundario del proyecto es una base de datos con expresiones regulares para corregir los datos de prioridad. Actualmente disponibles reglas para BR, ES, EP y US.
  • 18. Cont. Posibilidad de versión light, que no interrogue a la base de datos y se base en la lectura de un archivo de texto, a la IPCONV. Pero que incluya las validaciones. Panamá esta comenzando a utilizar una versión similar, hasta que sea posible la implementación de la versión con interrogación de la base de datos.
  • 19. Futuro del proyecto Versión "funcional" e instalable para fin de año (código basado en Perl). A partir de allí, comenzaría una la reescritura y mejora del código por contratista externo(a la vez de convertir el código a Java), para tener una versión como producto oficial de OMPI para la segunda mitad de 2012.