SlideShare una empresa de Scribd logo
1 de 38
Descargar para leer sin conexión
Protege a tu rey
Defiende tu contenido de amenazas,
scraping, IA o malos actores
FERNANDO PUENTE
Content is King
“El contenido es de donde espero que se
obtenga el dinero real en Internet”
Bill Gates (January 3, 1996)
Fernando Puente
Informático de vocación y de profesión, formador ocasional
y un enamorado de comer y beber.
● Embajador de marca de Raiola Networks
● Profesor Curso Superior de Periodismo Deportivo
● Consultor especializado en Web Performance
@fpuenteonline
linkedin.com/in/fpuente/
Protegiendo el contenido
Solución
Legal y sencilla
Detallar en los términos y
condiciones de uso las
Condiciones Generales y las
responsabilidades derivadas del
acceso y la utilización de sus
contenidos
Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos
son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de
explotación de los mismos en cualquier forma y en especial, los derechos de reproducción,
distribución, comunicación pública y transformación, de acuerdo con la legislación española y de
la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo
relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por
terceros), que habilita a un uso personal y no comercial de la propia información por parte de
los Usuarios.
TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su
caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros.
Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación
pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o
modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera
reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines
comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así
mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de
imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la
técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las
responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la
LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a
terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad
informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede
licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual
y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente,
con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o
modificación de los contenidos y de cualquier otro elemento.
Protege tu contenido de
visitantes
Humanos
Deshabilitar menú contextual (click derecho)
* Usuarios avanzados pueden acceder al contenido
* Posibilidad de usar plugins del repositorio
Deshabilitar selección de texto
* Usuarios avanzados pueden acceder al contenido
Estrategias de protección adicional
● Marcas de agua y/o copyright en contenido multimedia
● Metadatos en imágenes
● Muro de pago/Paywall
● Registro de usuario o modelo freemium
● Generar el contenido dinámicamente (Javascript)
● Acceso condicional al contenido (restringir por usuario,
zona geográfica o número de visitas/páginas)
* SEO y UX pueden verse afectados de manera importante
* Metadatos y marcas de agua pueden ser eliminadas
Protección ante traducciones de la página
* Existen herramientas/extensiones que no obedecen a estas etiquetas
Protección ante traducciones de elementos
* Existen herramientas/extensiones que no obedecen a estas etiquetas
Protege tu contenido de
visitantes
No solo SEOcotillas
Qué buscan las herramientas SEO
● Enlazado interno/externo
● Estructura web
● Palabras clave
● Datos sensibles o de negocio
● Contenido
Protección anti-competencia
● Eliminar feeds de contenido/Crear feeds incompletos
● Bloquear/moderar comentarios
● Marcas de agua en imágenes
● Habilitar la protección de hotlink
● Deshabilitar incrustado como iframe
* Hotlink puede afectar al contenido compartido en medios fuera de la web
Bloquear competencia (user-agent)
* Pueden realizar el rastreo usando el user agent de Google
Reforzar la seguridad de tu sitio
● Proveedor de hosting de confianza
● Certificado de seguridad
● WordPress y componentes actualizados
● Capas adicionales de seguridad (plugin, WAF, htaccess…)
● Política de roles, usuarios y contraseñas
● Entornos de test y producción (actualizaciones y cambios)
● En general, buenas prácticas
En último caso
● Publicar un aviso de eliminación DMCA (Digital
Millennium Copyright Act)
● Solicitar retirada de contenido por infracciones de derechos
de autor en buscadores
Protege tu contenido de
enlaces dañinos
Disavow links
Desautorizar enlaces
1. Identificar (fraudulentos, artificiales o de baja calidad)
2. Crear lista de enlaces a desautorizar
3. Subir lista por buscador:
https://search.google.com/search-console/disavow-links
Protege tu contenido de
visitantes
No humanos
Estrategias anti-scraping
● Reglas específicas en archivo robots.txt
● Filtrar user-agent
● Bloquear servidores por IP
● Añadir Completely Automated Public Turing test to
tell Computers and Humans Apart (aka CAPTCHA)
● Colocar «honeypots»
● Desativar feed
● Bloquear REST API
Proteger el sitio de scrapeadores (user-agent)
* Pueden realizar el rastreo usando el user agent de Google
Desactivar el feed
Proteger acceso a WordPress REST API
Protege tu contenido de
redes sociales
Difusión
Proteger cómo compartir el contenido
● Marcas de agua y/o copyright en contenido multimedia
● Metadata y etiquetas Open Graph falsas
● Bloqueo, contenido erróneo o redirección para bots
(facebookexternalhit, Twitterbot, TelegramBot,
LinkedInBot…)
* SEO puede verse afectado de manera importante
Protege tu contenido de
motores de búsqueda
Invisibilidad
Proteger el sitio de ser rastreado e indexado
* Cualquier contenido, no solo HTML
Proteger el sitio de ser indexado
* Solo HTML
Proteger cada página de ser almacenada
* Solo HTML
* Aplica a la caché de Google
Protege tu contenido de la
Inteligencia Artificial
Base de conocimiento
Proteger del entrenamiento
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
varios modelos LLM utilizando Common Crawl)
* Puede cambiar en el futuro
Proteger del entrenamiento (nuevo)
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
OpenAI’s web crawler)
* https://platform.openai.com/docs/gptbot (agosto/2023)
Proteger del acceso
* Sólo usado por los plugins de ChatGPT para acceso (live query), no
entrenamiento
* Puede cambiar en el futuro
¿La mejor defensa es un
buen ataque?
Gracias

Más contenido relacionado

Similar a Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

Similar a Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores (20)

Que es la ley sopa
Que es la ley sopaQue es la ley sopa
Que es la ley sopa
 
Aviso Legal
Aviso LegalAviso Legal
Aviso Legal
 
Comunicación Web y Social Media
Comunicación Web y Social MediaComunicación Web y Social Media
Comunicación Web y Social Media
 
Terminos y condiciones de uso
Terminos y condiciones de usoTerminos y condiciones de uso
Terminos y condiciones de uso
 
Banner
BannerBanner
Banner
 
Web 2.0
Web 2.0Web 2.0
Web 2.0
 
Ensayo de la ley sopa
Ensayo de la ley sopaEnsayo de la ley sopa
Ensayo de la ley sopa
 
El derecho a la privacidad del usuario en relación a las políticas de uso
 El derecho a la privacidad del usuario en relación a las políticas de uso El derecho a la privacidad del usuario en relación a las políticas de uso
El derecho a la privacidad del usuario en relación a las políticas de uso
 
Ley s.o.p.a
Ley s.o.p.aLey s.o.p.a
Ley s.o.p.a
 
Conferencia word camp
Conferencia word campConferencia word camp
Conferencia word camp
 
La ley sopa
La ley sopaLa ley sopa
La ley sopa
 
Informe web2.0
Informe web2.0Informe web2.0
Informe web2.0
 
89
8989
89
 
Unidad educativa
Unidad educativaUnidad educativa
Unidad educativa
 
Blogueras Barcelona Aspectos Legales
Blogueras Barcelona Aspectos LegalesBlogueras Barcelona Aspectos Legales
Blogueras Barcelona Aspectos Legales
 
Motores de busqueda
Motores de busquedaMotores de busqueda
Motores de busqueda
 
Taller SEO. Asier Barainka
Taller SEO. Asier BarainkaTaller SEO. Asier Barainka
Taller SEO. Asier Barainka
 
TERMINOS
TERMINOSTERMINOS
TERMINOS
 
Cómo funciona google
Cómo funciona googleCómo funciona google
Cómo funciona google
 
Guia recomendaciones internet_052009
Guia recomendaciones internet_052009Guia recomendaciones internet_052009
Guia recomendaciones internet_052009
 

Más de Fernando Puente

¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…Fernando Puente
 
Qué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicionalQué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicionalFernando Puente
 
WordPress. Modelos de negocio
WordPress. Modelos de negocioWordPress. Modelos de negocio
WordPress. Modelos de negocioFernando Puente
 
Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021Fernando Puente
 
WordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de InternetWordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de InternetFernando Puente
 
Mitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPressMitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPressFernando Puente
 
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressHTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressFernando Puente
 
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019Fernando Puente
 
Tipologías de migración - WordCamp Valencia 2019
Tipologías de migración - WordCamp Valencia 2019Tipologías de migración - WordCamp Valencia 2019
Tipologías de migración - WordCamp Valencia 2019Fernando Puente
 
Básicos para medir tu web - Taller de iniciación
Básicos para medir tu web - Taller de iniciaciónBásicos para medir tu web - Taller de iniciación
Básicos para medir tu web - Taller de iniciaciónFernando Puente
 
Primeros pasos con WPO: aprende a analizar tu web - Taller
Primeros pasos con WPO: aprende a analizar tu web - TallerPrimeros pasos con WPO: aprende a analizar tu web - Taller
Primeros pasos con WPO: aprende a analizar tu web - TallerFernando Puente
 
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!Fernando Puente
 
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...Fernando Puente
 
La analítica nos hace mejores
La analítica nos hace mejoresLa analítica nos hace mejores
La analítica nos hace mejoresFernando Puente
 
Retos de WordPress para llegar al 50% de Internet
Retos de WordPress para llegar al 50% de Internet Retos de WordPress para llegar al 50% de Internet
Retos de WordPress para llegar al 50% de Internet Fernando Puente
 
WP-Cron: ni contigo, ni sin ti
WP-Cron: ni contigo, ni sin tiWP-Cron: ni contigo, ni sin ti
WP-Cron: ni contigo, ni sin tiFernando Puente
 
Taller WPO - Carga condicional de plugins
Taller WPO - Carga condicional de pluginsTaller WPO - Carga condicional de plugins
Taller WPO - Carga condicional de pluginsFernando Puente
 
Extender la funcionalidad de WordPress
Extender la funcionalidad de WordPressExtender la funcionalidad de WordPress
Extender la funcionalidad de WordPressFernando Puente
 
Niveles de escalado para WordPress
Niveles de escalado para WordPressNiveles de escalado para WordPress
Niveles de escalado para WordPressFernando Puente
 
WordPress - Oportunidades laborales
WordPress - Oportunidades laboralesWordPress - Oportunidades laborales
WordPress - Oportunidades laboralesFernando Puente
 

Más de Fernando Puente (20)

¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
 
Qué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicionalQué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicional
 
WordPress. Modelos de negocio
WordPress. Modelos de negocioWordPress. Modelos de negocio
WordPress. Modelos de negocio
 
Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021
 
WordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de InternetWordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de Internet
 
Mitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPressMitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPress
 
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressHTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
 
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
 
Tipologías de migración - WordCamp Valencia 2019
Tipologías de migración - WordCamp Valencia 2019Tipologías de migración - WordCamp Valencia 2019
Tipologías de migración - WordCamp Valencia 2019
 
Básicos para medir tu web - Taller de iniciación
Básicos para medir tu web - Taller de iniciaciónBásicos para medir tu web - Taller de iniciación
Básicos para medir tu web - Taller de iniciación
 
Primeros pasos con WPO: aprende a analizar tu web - Taller
Primeros pasos con WPO: aprende a analizar tu web - TallerPrimeros pasos con WPO: aprende a analizar tu web - Taller
Primeros pasos con WPO: aprende a analizar tu web - Taller
 
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
 
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
 
La analítica nos hace mejores
La analítica nos hace mejoresLa analítica nos hace mejores
La analítica nos hace mejores
 
Retos de WordPress para llegar al 50% de Internet
Retos de WordPress para llegar al 50% de Internet Retos de WordPress para llegar al 50% de Internet
Retos de WordPress para llegar al 50% de Internet
 
WP-Cron: ni contigo, ni sin ti
WP-Cron: ni contigo, ni sin tiWP-Cron: ni contigo, ni sin ti
WP-Cron: ni contigo, ni sin ti
 
Taller WPO - Carga condicional de plugins
Taller WPO - Carga condicional de pluginsTaller WPO - Carga condicional de plugins
Taller WPO - Carga condicional de plugins
 
Extender la funcionalidad de WordPress
Extender la funcionalidad de WordPressExtender la funcionalidad de WordPress
Extender la funcionalidad de WordPress
 
Niveles de escalado para WordPress
Niveles de escalado para WordPressNiveles de escalado para WordPress
Niveles de escalado para WordPress
 
WordPress - Oportunidades laborales
WordPress - Oportunidades laboralesWordPress - Oportunidades laborales
WordPress - Oportunidades laborales
 

Último

INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENAINSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENAdanielaerazok
 
12 Clasificacion de las Computadoras.pdf
12 Clasificacion de las Computadoras.pdf12 Clasificacion de las Computadoras.pdf
12 Clasificacion de las Computadoras.pdfedwinmelgarschlink2
 
Guia para el registro en el sitio slideshare.pdf
Guia para el registro en el sitio slideshare.pdfGuia para el registro en el sitio slideshare.pdf
Guia para el registro en el sitio slideshare.pdflauradbernals
 
02. Mr. Spencer (T.L. Sawn).pdf.libro de un señor
02. Mr. Spencer (T.L. Sawn).pdf.libro de un señor02. Mr. Spencer (T.L. Sawn).pdf.libro de un señor
02. Mr. Spencer (T.L. Sawn).pdf.libro de un señorkkte210207
 
Institucion educativa la esperanza sede la magdalena
Institucion educativa la esperanza sede la magdalenaInstitucion educativa la esperanza sede la magdalena
Institucion educativa la esperanza sede la magdalenadanielaerazok
 
Las redes sociales en el mercado digital
Las redes sociales en el mercado digitalLas redes sociales en el mercado digital
Las redes sociales en el mercado digitalNayaniJulietaRamosRa
 
institucion educativa la esperanza sede magdalena
institucion educativa la esperanza sede magdalenainstitucion educativa la esperanza sede magdalena
institucion educativa la esperanza sede magdalenajuniorcuellargomez
 
Buscadores, SEM SEO: el desafío de ser visto en la web
Buscadores, SEM SEO: el desafío de ser visto en la webBuscadores, SEM SEO: el desafío de ser visto en la web
Buscadores, SEM SEO: el desafío de ser visto en la webDecaunlz
 
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdfNUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdfisrael garcia
 

Último (9)

INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENAINSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
INSTITUCION EDUCATIVA LA ESPERANZA SEDE MAGDALENA
 
12 Clasificacion de las Computadoras.pdf
12 Clasificacion de las Computadoras.pdf12 Clasificacion de las Computadoras.pdf
12 Clasificacion de las Computadoras.pdf
 
Guia para el registro en el sitio slideshare.pdf
Guia para el registro en el sitio slideshare.pdfGuia para el registro en el sitio slideshare.pdf
Guia para el registro en el sitio slideshare.pdf
 
02. Mr. Spencer (T.L. Sawn).pdf.libro de un señor
02. Mr. Spencer (T.L. Sawn).pdf.libro de un señor02. Mr. Spencer (T.L. Sawn).pdf.libro de un señor
02. Mr. Spencer (T.L. Sawn).pdf.libro de un señor
 
Institucion educativa la esperanza sede la magdalena
Institucion educativa la esperanza sede la magdalenaInstitucion educativa la esperanza sede la magdalena
Institucion educativa la esperanza sede la magdalena
 
Las redes sociales en el mercado digital
Las redes sociales en el mercado digitalLas redes sociales en el mercado digital
Las redes sociales en el mercado digital
 
institucion educativa la esperanza sede magdalena
institucion educativa la esperanza sede magdalenainstitucion educativa la esperanza sede magdalena
institucion educativa la esperanza sede magdalena
 
Buscadores, SEM SEO: el desafío de ser visto en la web
Buscadores, SEM SEO: el desafío de ser visto en la webBuscadores, SEM SEO: el desafío de ser visto en la web
Buscadores, SEM SEO: el desafío de ser visto en la web
 
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdfNUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
NUVO PROGRAMAS DE ESCUELAS NUEVO-ACUERDO-CTE.pdf
 

Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

  • 1. Protege a tu rey Defiende tu contenido de amenazas, scraping, IA o malos actores FERNANDO PUENTE
  • 2. Content is King “El contenido es de donde espero que se obtenga el dinero real en Internet” Bill Gates (January 3, 1996)
  • 3. Fernando Puente Informático de vocación y de profesión, formador ocasional y un enamorado de comer y beber. ● Embajador de marca de Raiola Networks ● Profesor Curso Superior de Periodismo Deportivo ● Consultor especializado en Web Performance @fpuenteonline linkedin.com/in/fpuente/
  • 6. Detallar en los términos y condiciones de uso las Condiciones Generales y las responsabilidades derivadas del acceso y la utilización de sus contenidos
  • 7. Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de explotación de los mismos en cualquier forma y en especial, los derechos de reproducción, distribución, comunicación pública y transformación, de acuerdo con la legislación española y de la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por terceros), que habilita a un uso personal y no comercial de la propia información por parte de los Usuarios. TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros. Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente, con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o modificación de los contenidos y de cualquier otro elemento.
  • 8. Protege tu contenido de visitantes Humanos
  • 9. Deshabilitar menú contextual (click derecho) * Usuarios avanzados pueden acceder al contenido * Posibilidad de usar plugins del repositorio
  • 10. Deshabilitar selección de texto * Usuarios avanzados pueden acceder al contenido
  • 11. Estrategias de protección adicional ● Marcas de agua y/o copyright en contenido multimedia ● Metadatos en imágenes ● Muro de pago/Paywall ● Registro de usuario o modelo freemium ● Generar el contenido dinámicamente (Javascript) ● Acceso condicional al contenido (restringir por usuario, zona geográfica o número de visitas/páginas) * SEO y UX pueden verse afectados de manera importante * Metadatos y marcas de agua pueden ser eliminadas
  • 12. Protección ante traducciones de la página * Existen herramientas/extensiones que no obedecen a estas etiquetas
  • 13. Protección ante traducciones de elementos * Existen herramientas/extensiones que no obedecen a estas etiquetas
  • 14. Protege tu contenido de visitantes No solo SEOcotillas
  • 15. Qué buscan las herramientas SEO ● Enlazado interno/externo ● Estructura web ● Palabras clave ● Datos sensibles o de negocio ● Contenido
  • 16. Protección anti-competencia ● Eliminar feeds de contenido/Crear feeds incompletos ● Bloquear/moderar comentarios ● Marcas de agua en imágenes ● Habilitar la protección de hotlink ● Deshabilitar incrustado como iframe * Hotlink puede afectar al contenido compartido en medios fuera de la web
  • 17. Bloquear competencia (user-agent) * Pueden realizar el rastreo usando el user agent de Google
  • 18. Reforzar la seguridad de tu sitio ● Proveedor de hosting de confianza ● Certificado de seguridad ● WordPress y componentes actualizados ● Capas adicionales de seguridad (plugin, WAF, htaccess…) ● Política de roles, usuarios y contraseñas ● Entornos de test y producción (actualizaciones y cambios) ● En general, buenas prácticas
  • 19. En último caso ● Publicar un aviso de eliminación DMCA (Digital Millennium Copyright Act) ● Solicitar retirada de contenido por infracciones de derechos de autor en buscadores
  • 20. Protege tu contenido de enlaces dañinos Disavow links
  • 21. Desautorizar enlaces 1. Identificar (fraudulentos, artificiales o de baja calidad) 2. Crear lista de enlaces a desautorizar 3. Subir lista por buscador: https://search.google.com/search-console/disavow-links
  • 22. Protege tu contenido de visitantes No humanos
  • 23. Estrategias anti-scraping ● Reglas específicas en archivo robots.txt ● Filtrar user-agent ● Bloquear servidores por IP ● Añadir Completely Automated Public Turing test to tell Computers and Humans Apart (aka CAPTCHA) ● Colocar «honeypots» ● Desativar feed ● Bloquear REST API
  • 24. Proteger el sitio de scrapeadores (user-agent) * Pueden realizar el rastreo usando el user agent de Google
  • 26. Proteger acceso a WordPress REST API
  • 27. Protege tu contenido de redes sociales Difusión
  • 28. Proteger cómo compartir el contenido ● Marcas de agua y/o copyright en contenido multimedia ● Metadata y etiquetas Open Graph falsas ● Bloqueo, contenido erróneo o redirección para bots (facebookexternalhit, Twitterbot, TelegramBot, LinkedInBot…) * SEO puede verse afectado de manera importante
  • 29. Protege tu contenido de motores de búsqueda Invisibilidad
  • 30. Proteger el sitio de ser rastreado e indexado * Cualquier contenido, no solo HTML
  • 31. Proteger el sitio de ser indexado * Solo HTML
  • 32. Proteger cada página de ser almacenada * Solo HTML * Aplica a la caché de Google
  • 33. Protege tu contenido de la Inteligencia Artificial Base de conocimiento
  • 34. Proteger del entrenamiento * No funciona en todos los modelos de entrenamiento (ejemplo basado en varios modelos LLM utilizando Common Crawl) * Puede cambiar en el futuro
  • 35. Proteger del entrenamiento (nuevo) * No funciona en todos los modelos de entrenamiento (ejemplo basado en OpenAI’s web crawler) * https://platform.openai.com/docs/gptbot (agosto/2023)
  • 36. Proteger del acceso * Sólo usado por los plugins de ChatGPT para acceso (live query), no entrenamiento * Puede cambiar en el futuro
  • 37. ¿La mejor defensa es un buen ataque?