Dicen que el contenido es el rey y que es el mayor tesoro de tu sitio web, tu mayor diferencial y tu propuesta de valor, pero nadie dice todo lo que cuesta idearlo, diseñarlo y generarlo, y lo fácil que es robarlo, beneficiarse o atentar contra él, afectando de manera directa contra tu negocio. ¿Y si empiezas a protegerlo?
Acompáñame en esta charla a descubrir estrategias para proteger a tu rey, tu contenido digital, de cualquier mal actor que se beneficia o atenta contra tu sitio web con WordPress, manteniendo todas las funcionalidades necesarias para tus visitantes.
Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores
1. Protege a tu rey
Defiende tu contenido de amenazas,
scraping, IA o malos actores
FERNANDO PUENTE
2. Content is King
“El contenido es de donde espero que se
obtenga el dinero real en Internet”
Bill Gates (January 3, 1996)
3. Fernando Puente
Informático de vocación y de profesión, formador ocasional
y un enamorado de comer y beber.
● Embajador de marca de Raiola Networks
● Profesor Curso Superior de Periodismo Deportivo
● Consultor especializado en Web Performance
@fpuenteonline
linkedin.com/in/fpuente/
6. Detallar en los términos y
condiciones de uso las
Condiciones Generales y las
responsabilidades derivadas del
acceso y la utilización de sus
contenidos
7. Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos
son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de
explotación de los mismos en cualquier forma y en especial, los derechos de reproducción,
distribución, comunicación pública y transformación, de acuerdo con la legislación española y de
la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo
relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por
terceros), que habilita a un uso personal y no comercial de la propia información por parte de
los Usuarios.
TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su
caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros.
Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación
pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o
modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera
reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines
comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así
mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de
imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la
técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las
responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la
LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a
terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad
informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede
licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual
y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente,
con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o
modificación de los contenidos y de cualquier otro elemento.
11. Estrategias de protección adicional
● Marcas de agua y/o copyright en contenido multimedia
● Metadatos en imágenes
● Muro de pago/Paywall
● Registro de usuario o modelo freemium
● Generar el contenido dinámicamente (Javascript)
● Acceso condicional al contenido (restringir por usuario,
zona geográfica o número de visitas/páginas)
* SEO y UX pueden verse afectados de manera importante
* Metadatos y marcas de agua pueden ser eliminadas
15. Qué buscan las herramientas SEO
● Enlazado interno/externo
● Estructura web
● Palabras clave
● Datos sensibles o de negocio
● Contenido
16. Protección anti-competencia
● Eliminar feeds de contenido/Crear feeds incompletos
● Bloquear/moderar comentarios
● Marcas de agua en imágenes
● Habilitar la protección de hotlink
● Deshabilitar incrustado como iframe
* Hotlink puede afectar al contenido compartido en medios fuera de la web
18. Reforzar la seguridad de tu sitio
● Proveedor de hosting de confianza
● Certificado de seguridad
● WordPress y componentes actualizados
● Capas adicionales de seguridad (plugin, WAF, htaccess…)
● Política de roles, usuarios y contraseñas
● Entornos de test y producción (actualizaciones y cambios)
● En general, buenas prácticas
19. En último caso
● Publicar un aviso de eliminación DMCA (Digital
Millennium Copyright Act)
● Solicitar retirada de contenido por infracciones de derechos
de autor en buscadores
21. Desautorizar enlaces
1. Identificar (fraudulentos, artificiales o de baja calidad)
2. Crear lista de enlaces a desautorizar
3. Subir lista por buscador:
https://search.google.com/search-console/disavow-links
28. Proteger cómo compartir el contenido
● Marcas de agua y/o copyright en contenido multimedia
● Metadata y etiquetas Open Graph falsas
● Bloqueo, contenido erróneo o redirección para bots
(facebookexternalhit, Twitterbot, TelegramBot,
LinkedInBot…)
* SEO puede verse afectado de manera importante
34. Proteger del entrenamiento
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
varios modelos LLM utilizando Common Crawl)
* Puede cambiar en el futuro
35. Proteger del entrenamiento (nuevo)
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
OpenAI’s web crawler)
* https://platform.openai.com/docs/gptbot (agosto/2023)
36. Proteger del acceso
* Sólo usado por los plugins de ChatGPT para acceso (live query), no
entrenamiento
* Puede cambiar en el futuro