¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)
Evitar que la IA rastree nuestros contenidos
Portada » Evitar que la IA rastree nuestros contenidos

A continuación te mostraremos cómo evitar que la IA rastree nuestros contenidos, esto lo haremos tanto con OpenAI como con ChatGPT, realizando este simple paso, bloquearemos el crawling o también llamado rastreo.

Estos últimos años la informática ha sufrido una auténtica revolución, todo ello gracias a las ya tan conocidas inteligencias artificiales, estas logran realizar imágenes, componer una sinfonía o también, proporcionar contenido sin el mayor esfuerzo.

Este dato anterior entraña unos ciertos riesgos, ya que en ocasiones la información podría estar contaminada o no ser del todo cierta. Esta se suele extraer de información ya creada, pero también, de los contenidos de ciertas páginas, esto es precisamente, lo que nos trae a esta guía, y es lo que veremos a continuación, donde trataremos de bloquear o evitar que la IA rastree nuestros contenidos.


Ir ahora - Crear un avatar en WhatsApp


¿Conoces qué es el fichero robots. txt?

Veamos un resumen de lo siguiente:

Ficheros robots.txt: Estos se emplea para indicarle a los buscadores qué secciones de tu sitio web se pueden rastrear y qué otras no.

Si bien esto no impide que alguien recopile datos, puede controlar qué contenido es accesible al público.

USER-Agent: Es un encabezado de solicitud HTTP que ofrece información sobre el cliente que realiza la petición.

Los navegadores y otras aplicaciones lo utilizan para identificarse ante el servidor web cuando solicitan una página o un acceso en línea.

Disallow: Es una directriz que se utiliza en el archivo robots.txt de un determinado sitio para indicar a los motores de búsqueda qué secciones del sitio web no deben ser rastreadas o indexadas.

El uso del siguiente símbolo seguido de Disallow "/", esta directriz específica, cuando se coloca en el archivo robots.txt, ordena que no accedan a ninguna página del sitio.



Cuando un buscador encuentra la directiva "Disallow: /" en el fichero robots.txt de un sitio web, este interpreta que no dispone del permiso necesario para rastrear las páginas o directorios.

En consecuencia, los motores de búsqueda suelen evitar indexar cualquier tipo de contenido que se encuentre en ese dominio.

Podemos bloquear a OpenAI de la siguiente manera:

  • User-agent: OpenAI
  • Disallow: /

Podemos evitar que la IA de ChatGPT rastree nuestros contenidos de la siguiente manera:

  • User-agent: ChatGPT
  • Disallow: /

Finalmente, podemos indicarle una sección donde si está permitido y aquella que no.

  • User-agent: ChatGPT-User
  • Disallow: /categorias
  • Allow: /blog/Ultimas_tendencias/

Añadiendo el texto anterior, estaremos evitando que la IA rastree nuestros contenidos. Pero siempre dependerá, de si estas siguen un criterio normalizado, ya que es posible que, aun así, lo rastreen de igual manera.

Qué pasos seguir para evitar que la IA rastree nuestros contenidos publicados

Primero lo explicaremos todo el proceso sobre cPanel, y en el siguiente apartado, accedemos al panel de Blogger para añadir el código. Comenzamos accediendo a nuestro servidor de dominio y Hosting, una vez dentro iniciamos sesión.

Pulsamos en el botón de manejar productos y volvemos a autentificarnos para el acceso al panel de control. Hacemos clic en administrador de archivos.

Buscamos en el menú lateral la opción de public_Html y en el apartado derecho, debería de verse un fichero llamado Robots.txt.

En caso de que no se muestre, debemos crearlo, para ello pulsamos con el botón derecho del ratón sobre el escritorio y accedemos a la lengüeta de nuevo. Acto seguido, pulsamos sobre documento de texto. Ahora pegamos alguno de los textos superiores. Sin embargo, podemos escribirlos de manera manual.

El siguiente paso es guardar el fichero y subirlo a nuestro Hosting, para ello, volvemos a public_HTML y pulsamos sobre el botón de cargar, simplemente lo añadimos y subimos al directorio.

Una vez hecho lo anterior, en el navegador introducimos el nombre de la URL + el fichero.txt, de la siguiente manera.

Cómo bloquear que ChatGPT rastree el contenido de Blogger

Cómo bloquear que ChatGPT rastree el contenido de Blogger

Debemos ingresar en el panel de nuestro sitio web y en el menú del lateral izquierdo, buscamos configuración, ya dentro de este, pulsamos sobre el apartado de "archivo robots texto personalizado" y pegamos el código, acto seguido, haremos clic en guardar.

Últimas entradas:

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)
error: Content is protected !!