Gestión documental colaborativa
con Alfresco ECM
César Capillas <cesar@zylk.net>
Presentación


 zylk.net es una consultora TIC, que basa su modelo
    de negocio en el software de código abierto,
    especializada en desarrollos java open-source.
   Su actividad se centra en soluciones de portales,
    gestión documental, inteligencia de negocio y firma
    digital.
   Desde 2010 ostenta la presidencia E.S.L.E
    (Asociación de Empresas de Software Libre de
    Euskadi) y la vicepresidencia de A.S.O.L.I.F.
Introducción
¿ Que es Alfresco ?


 Un conjunto de tecnologías opensource que se
    utilizan para la gestión del ciclo de vida de un
    contenido: crear, capturar, guardar, preservar,
    compartir, versionar, aprobar, publicar y archivar.
   Permitiendo la gestión de la información no
    estructurada de una organización.
   Facilitando el trabajo colaborativo: foros,
    notificaciones, RSS, blogs, wiki, sitios....
¿ Qué es Alfresco?


 Alfresco es un gestor documental empresarial
  opensource (ECM).
Alfresco en el mercado ECM
Escenario ECM/CMS y productos opensource
¿ Porqué utilizar productos open-source ?


 Potencian la innovación utilizando estándares
    abiertos y reutilizando otros proyectos de software
    libre.
   Tienen una mayor flexibilidad y permiten la
    integración con soluciones de terceros.
   No son dependientes de una única plataforma.
   Protegen a los usuarios de los riesgos y desventajas
    de las soluciones de proveedor único.
   Aunque software libre no significa software gratuito,
    en general, implica unos costes de implantación y
    licencias menores.
Beneficios de Alfresco ECM


 Alfresco utiliza:
    Arquitecturas y plataformas abiertas (java)
    Estándares abiertos
    Tecnologías opensource (lo mejorcito de otros
     proyectos de software libre)
Productos de Alfresco



                        Alfresco Explorer



                        Alfresco Share



                        Alfresco Studio
Licencias de Alfresco


 Alfresco Community:
     QA básico
     Versiones mayores solamente
     Licencia LGPL (sin costes)
     Soportada por la comunidad: Wiki, Forum....
 Alfresco Enterprise:
     Certificado y Garantizado
     QA completo
     Versiones de mantenimiento
     Soportado por Alfresco y partners
     Suscripciones anuales por CPU
Licencias de Alfresco


 Alfresco dixit:
     5 veces más rápido que las soluciones
      tradicionales propietarias.
     10 veces más barato que las soluciones
      tradicionales propietarias.
La interfaz web (Alfresco Explorer)
El cliente colaborativo (Alfresco Share)

                                           IMAP
Conceptos básicos
Terminología I: Espacios



   Similar a carpetas
   Organización
    jerárquica
   Propiedades:
      Metadatos
      Permisos
      Reglas
Terminología II: Contenidos

   Es lo que contiene
    un fichero.
   Información
    estructurada o no
    estructurada.
   Múltiples formatos.
   Propiedades:
      Metadatos
      Multidioma
      Versionado
      Workflow
      Contenidos
        relacionados.
Terminología III: Metadatos

   Son propiedades de
    espacios y ficheros
    adaptados a
    negocio.
   Se pueden definir
    tipos de contenidos
    a medida
   Son indexables y
    buscables!
   Se pueden extraer
    del documento
       API's
       Via extractores
       OCR
Terminología III': Aspectos

   Los aspectos
    permiten extender
    cualquier
    funcionalidad en
    Alfresco.
   Serían algo así como
    conjuntos de
    metadatos
    extendidos y
    dinámicos
    aplicables a
    cualquier tipo o
    esquema
    documental.
Terminología IV: Categorías

   Las categorías
    permiten que los
    espacios y
    documentos sean
    clasificados en base
    a una temática de
    negocio.
   Son jerárquicas.
   Sólo las define el
    administrador
   Son indexables y
    buscables via
    buscador y
    navegador de
    categorias
Terminología V: Permisos

   Los permisos de
    acceso se definen
    en los espacios y
    documentos.
   Se incorporan
    usuarios y grupos de
    usuarios con roles
    definidos (conjunto
    de permisos)
   Los roles y permisos
    pueden
    parametrizarse a
    bajo nivel.
   Hay 5 roles por
    defecto.
Características
Características generales de Alfresco


 Repositorio de documentos:
     Un sistema de permisos basado en reglas de control de
        acceso (ACL).
       Integrable en un contexto de empresa (SSO, Directorio
        Activo)
       Escalable, replicable y clusterizable.
 Indexado automático de documentos y
    búsquedas.
   Categorización y control de versiones de
    contenidos.
Características

      Control de versiones   Búsquedas
Más características ...


 Modelos personalizados de contenidos
     Definición de propiedades y aspectos
     Metadatos de negocio
 Sistemas virtuales de unidad compartida:
     CIFS, Webdav, NFS y FTP
 Edicion online de documentos:
     Sharepoint
 Integración con correo electrónico
Características


                  Emulación de filesystems



                           Integración MS Office
Correo electrónico

                     IMAP
Más características ...


 Motores de reglas de contenido
 Workflows personalizados
 API's de desarrollo:
     Java API, JCR, Javascript API, Webscripts,
      REST, CMIS.
Desde el punto de vista del usuario:


 Unidades de red / carpetas compartidas
 Integración de MS Office
 Integración de correo electrónico
 Motores de transformación de contenido
    Conversión de DOC a PDF
    Conversiones entre formatos de imagenes y multimedia
 Reglas de negocio
    Automatización de las conversiones
    Notificaciones automáticas
 Herramienta colaborativa (Alfresco Share)
Alfresco Share: Previsualizaciones
Clientes móviles

                   Alfresco para iPhone y Android
Desde el punto de vista del administrador


 Flujos de trabajo (Workflows)
   Integración jBPM
   Desarrollo de contenido controlado y auditado a través de
    la creación, revisión, aprobación, lanzamiento regulado,
    caducidad, retención y archivo.
 La integración en una arquitectura de empresa
   Sistemas de SSO (CAS, NTML) y cadenas múltiples de
    autenticación a diferentes directorios de usuarios (LDAP,
    Directorio Activo)
 Transformadores y extractores
Desde el punto de vista del desarrollador:


 Integración con portales de empresa
    JSR-168 (especificación de portlet 1.0) basado en
       estándares e integración basada en REST
      Repositorios CMIS
 API's de desarrollo
    Alfresco API
    JCR
    Servicios web
    REST y webscripts
    CMIS
Integración con portales de empresa

Liferay + Alfresco CMIS



                                       Alfresco Portlet
Demo (casos de uso)
Demo Alfresco


 Características básicas:
    Alfresco Explorer / Share
    Unidades en red compartidas
 Características avanzadas:
    Caso de uso: Facturación electrónica
        • Reglas de contenido, tipos de contenidos
          personalizados y extracción de metadatos.
      Caso de uso: Firma digital
        • Procesos de validación simples.
        • Firma desde cliente sinadura.
      Caso de uso: Indexado con motores OCR
Caso de uso: Unidades de red compartidas




         CIFS
         Webdav
         FTP
         NFS
         IMAP
         REST
         Web
          services
Caso de uso: e-Factura con ef4ktur + Alfresco




                          https://www.ef4ktur.com/




 http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/mejorando-ef4ktur%3A-gestion-
 documental-de-facturas-y-explotacion-de-datos
Reglas de contenido en Alfresco

   Una regla de contenido permite definir acciones
    automáticas al subir un determinado contenido (p.
    ej., una factura), como por ejemplo, extraer
    metadatos definidos en un tipo de contenido Factura
Extracción de metadatos

   Hemos definido un tipo
    de contenido a medida
    Factura
   Y los metadatos de
    negocio se extraerían
    automaticamente al
    subir la factura
   Estarían indexados
    automáticamente
   Podrían buscarse en
    Alfresco, por ejemplo, por
    CIF del receptor o
    cualquier otra propiedad
    definida.
Firma digital con certificados en servidor

   Util en procesos de
    validación interna de
    facturas, contratos,
    nominas
   De nuevo con reglas de
    negocio:
      Que firmen con un
       determinado
       certificado de
       software
   O con workflows
    diseñados a medida en
    Alfresco
Firma digital con sinadura en Alfresco




http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/mas-sobre-el-
conector-de-sinadura-y-alfresco
Firma digital con sinadura en Alfresco




             http://www.sinadura.net/
Motores OCR para indexación

   También es posible
    incorporar sistemas de
    reconocimiento de
    caracteres en imágenes
    en los procesos de
    Alfresco.
   Una vez subido y
    reconocido el texto es
    indexado.




http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/integracion-de-ocr-en-alfresco
Motores OCR para indexación

                ¡Podemos buscar texto en las imágenes!




http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/integracion-ocr-en-
alfresco-share
Motores OCR para indexación
Cesar Capillas <cesar at zylk.net>

       http://www.zylk.net

Gestión documental colaborativa con Alfresco ECM

  • 1.
    Gestión documental colaborativa conAlfresco ECM César Capillas <cesar@zylk.net>
  • 2.
    Presentación  zylk.net esuna consultora TIC, que basa su modelo de negocio en el software de código abierto, especializada en desarrollos java open-source.  Su actividad se centra en soluciones de portales, gestión documental, inteligencia de negocio y firma digital.  Desde 2010 ostenta la presidencia E.S.L.E (Asociación de Empresas de Software Libre de Euskadi) y la vicepresidencia de A.S.O.L.I.F.
  • 3.
  • 4.
    ¿ Que esAlfresco ?  Un conjunto de tecnologías opensource que se utilizan para la gestión del ciclo de vida de un contenido: crear, capturar, guardar, preservar, compartir, versionar, aprobar, publicar y archivar.  Permitiendo la gestión de la información no estructurada de una organización.  Facilitando el trabajo colaborativo: foros, notificaciones, RSS, blogs, wiki, sitios....
  • 5.
    ¿ Qué esAlfresco?  Alfresco es un gestor documental empresarial opensource (ECM).
  • 6.
    Alfresco en elmercado ECM
  • 7.
    Escenario ECM/CMS yproductos opensource
  • 8.
    ¿ Porqué utilizarproductos open-source ?  Potencian la innovación utilizando estándares abiertos y reutilizando otros proyectos de software libre.  Tienen una mayor flexibilidad y permiten la integración con soluciones de terceros.  No son dependientes de una única plataforma.  Protegen a los usuarios de los riesgos y desventajas de las soluciones de proveedor único.  Aunque software libre no significa software gratuito, en general, implica unos costes de implantación y licencias menores.
  • 9.
    Beneficios de AlfrescoECM  Alfresco utiliza:  Arquitecturas y plataformas abiertas (java)  Estándares abiertos  Tecnologías opensource (lo mejorcito de otros proyectos de software libre)
  • 10.
    Productos de Alfresco Alfresco Explorer Alfresco Share Alfresco Studio
  • 11.
    Licencias de Alfresco Alfresco Community:  QA básico  Versiones mayores solamente  Licencia LGPL (sin costes)  Soportada por la comunidad: Wiki, Forum....  Alfresco Enterprise:  Certificado y Garantizado  QA completo  Versiones de mantenimiento  Soportado por Alfresco y partners  Suscripciones anuales por CPU
  • 12.
    Licencias de Alfresco Alfresco dixit:  5 veces más rápido que las soluciones tradicionales propietarias.  10 veces más barato que las soluciones tradicionales propietarias.
  • 13.
    La interfaz web(Alfresco Explorer)
  • 14.
    El cliente colaborativo(Alfresco Share) IMAP
  • 15.
  • 16.
    Terminología I: Espacios  Similar a carpetas  Organización jerárquica  Propiedades:  Metadatos  Permisos  Reglas
  • 17.
    Terminología II: Contenidos  Es lo que contiene un fichero.  Información estructurada o no estructurada.  Múltiples formatos.  Propiedades:  Metadatos  Multidioma  Versionado  Workflow  Contenidos relacionados.
  • 18.
    Terminología III: Metadatos  Son propiedades de espacios y ficheros adaptados a negocio.  Se pueden definir tipos de contenidos a medida  Son indexables y buscables!  Se pueden extraer del documento  API's  Via extractores  OCR
  • 19.
    Terminología III': Aspectos  Los aspectos permiten extender cualquier funcionalidad en Alfresco.  Serían algo así como conjuntos de metadatos extendidos y dinámicos aplicables a cualquier tipo o esquema documental.
  • 20.
    Terminología IV: Categorías  Las categorías permiten que los espacios y documentos sean clasificados en base a una temática de negocio.  Son jerárquicas.  Sólo las define el administrador  Son indexables y buscables via buscador y navegador de categorias
  • 21.
    Terminología V: Permisos  Los permisos de acceso se definen en los espacios y documentos.  Se incorporan usuarios y grupos de usuarios con roles definidos (conjunto de permisos)  Los roles y permisos pueden parametrizarse a bajo nivel.  Hay 5 roles por defecto.
  • 22.
  • 23.
    Características generales deAlfresco  Repositorio de documentos:  Un sistema de permisos basado en reglas de control de acceso (ACL).  Integrable en un contexto de empresa (SSO, Directorio Activo)  Escalable, replicable y clusterizable.  Indexado automático de documentos y búsquedas.  Categorización y control de versiones de contenidos.
  • 24.
    Características Control de versiones Búsquedas
  • 25.
    Más características ... Modelos personalizados de contenidos  Definición de propiedades y aspectos  Metadatos de negocio  Sistemas virtuales de unidad compartida:  CIFS, Webdav, NFS y FTP  Edicion online de documentos:  Sharepoint  Integración con correo electrónico
  • 26.
    Características Emulación de filesystems Integración MS Office
  • 27.
  • 28.
    Más características ... Motores de reglas de contenido  Workflows personalizados  API's de desarrollo:  Java API, JCR, Javascript API, Webscripts, REST, CMIS.
  • 29.
    Desde el puntode vista del usuario:  Unidades de red / carpetas compartidas  Integración de MS Office  Integración de correo electrónico  Motores de transformación de contenido  Conversión de DOC a PDF  Conversiones entre formatos de imagenes y multimedia  Reglas de negocio  Automatización de las conversiones  Notificaciones automáticas  Herramienta colaborativa (Alfresco Share)
  • 30.
  • 31.
    Clientes móviles Alfresco para iPhone y Android
  • 32.
    Desde el puntode vista del administrador  Flujos de trabajo (Workflows)  Integración jBPM  Desarrollo de contenido controlado y auditado a través de la creación, revisión, aprobación, lanzamiento regulado, caducidad, retención y archivo.  La integración en una arquitectura de empresa  Sistemas de SSO (CAS, NTML) y cadenas múltiples de autenticación a diferentes directorios de usuarios (LDAP, Directorio Activo)  Transformadores y extractores
  • 33.
    Desde el puntode vista del desarrollador:  Integración con portales de empresa  JSR-168 (especificación de portlet 1.0) basado en estándares e integración basada en REST  Repositorios CMIS  API's de desarrollo  Alfresco API  JCR  Servicios web  REST y webscripts  CMIS
  • 34.
    Integración con portalesde empresa Liferay + Alfresco CMIS Alfresco Portlet
  • 35.
  • 36.
    Demo Alfresco  Característicasbásicas:  Alfresco Explorer / Share  Unidades en red compartidas  Características avanzadas:  Caso de uso: Facturación electrónica • Reglas de contenido, tipos de contenidos personalizados y extracción de metadatos.  Caso de uso: Firma digital • Procesos de validación simples. • Firma desde cliente sinadura.  Caso de uso: Indexado con motores OCR
  • 37.
    Caso de uso:Unidades de red compartidas  CIFS  Webdav  FTP  NFS  IMAP  REST  Web services
  • 38.
    Caso de uso:e-Factura con ef4ktur + Alfresco https://www.ef4ktur.com/ http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/mejorando-ef4ktur%3A-gestion- documental-de-facturas-y-explotacion-de-datos
  • 39.
    Reglas de contenidoen Alfresco  Una regla de contenido permite definir acciones automáticas al subir un determinado contenido (p. ej., una factura), como por ejemplo, extraer metadatos definidos en un tipo de contenido Factura
  • 40.
    Extracción de metadatos  Hemos definido un tipo de contenido a medida Factura  Y los metadatos de negocio se extraerían automaticamente al subir la factura  Estarían indexados automáticamente  Podrían buscarse en Alfresco, por ejemplo, por CIF del receptor o cualquier otra propiedad definida.
  • 41.
    Firma digital concertificados en servidor  Util en procesos de validación interna de facturas, contratos, nominas  De nuevo con reglas de negocio:  Que firmen con un determinado certificado de software  O con workflows diseñados a medida en Alfresco
  • 42.
    Firma digital consinadura en Alfresco http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/mas-sobre-el- conector-de-sinadura-y-alfresco
  • 43.
    Firma digital consinadura en Alfresco http://www.sinadura.net/
  • 44.
    Motores OCR paraindexación  También es posible incorporar sistemas de reconocimiento de caracteres en imágenes en los procesos de Alfresco.  Una vez subido y reconocido el texto es indexado. http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/integracion-de-ocr-en-alfresco
  • 45.
    Motores OCR paraindexación  ¡Podemos buscar texto en las imágenes! http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/integracion-ocr-en- alfresco-share
  • 46.
    Motores OCR paraindexación
  • 47.
    Cesar Capillas <cesarat zylk.net> http://www.zylk.net