Güvenlik Web

Web Sitelerini Web Archive’in Kopyalamasını Engellemek

archive.org isimli web sitesinde çılgın bir makine var ve web’de ki her şeyi yedekliyor. 370 milyardan fazla web sitesinin kopyasını yedeklediklerini belirtiyorlar. Yedekten kasıt, sayfaların kopyalarını alıyorlar ve internet sitenizde herhangi bir içerikte değişiklik yapsanız dahi Web Archive üzerinden eski veriyonlarını görebiliyorsunuz. Bu durum site sahipleri için pek hoş olmasa da araştırmacılar için bulunmaz bir kaynak.

Web Archive sitemin kopyasını almasın istiyorsanız onun çözümü de çok basit. Sitenizi barındırdığınız hostinge giriş yaparak robots.txt dosyasına aşağıdakini yazın ve kaydedin;

User-agent: ia_archiver
Disallow: /

Artık siteniz arşivlenmeyecek. archive.org botları sitenizi ziyarete geldiğinde bir ret yanıtı alacak ve geri dönecek. Sitenizi taramayacak.

Bir diğer arşivleme hizmeti veren site ise webcache.googleusercontent.com sitesidir.Bu servis Google’ın ve Türkiye’de mahkeme kararıyla yasaklanmıştı 2016 yıllarında. Sitenizin googleusercontent tarafından ön belleğe alınmasını istemiyorsanız sitenize bir aşağıdaki meta kodunu eklemeniz yeterli olacaktır.

<meta name=”robots” content=”noarchive”>

Yine aynı şekilde Google webcache tarayıcı botları sitenize geldiği zaman sitenizin arşivlenmesini istemediğinizi görecekler ve herhangi bir arşiv işlemi yapmadan geri gidecekler.

Bu Yazıya Bir Yorum Ekleyin

1 Yorum