heritrix Nedir? - Arşivleyici (User Agents)

heritrix

heritrix, İnternet Arşivi tarafından işletilen bir arşivleyicidir. Şu anda yapay zeka veya AI ile ilgili olduğu bilinmemektedir. Bunun yanlış olduğunu düşünüyorsanız veya amacı hakkında daha fazla ayrıntı sağlayabilirseniz, lütfen bizimle iletişime geçin.

Arşivciler web sitelerini kabaca düzenli bir tempoda ziyaret eder, çünkü anlık görüntüler düzenli aralıklarla alındığında daha kullanışlıdır. Popüler web siteleri, gelecekte geçmiş veritabanında sorgulanma olasılıkları daha yüksek olduğu için daha sık ziyaret edilir.

Detaylar

Kullanıcı aracısı (user agents), operatör hakkında detaylı bilgilere ve döküman dosylarına ulaşabilirsiniz.

Operatör Internet Archive
Dokümantasyon -

robots.txt ile Engelleme

Web sitenizin robots.txt dosyasında kullanıcı aracısı belirteci kuralları belirleyerek heritrix botunu engelleyebilir veya erişimini sınırlayabilirsiniz.

# robots.txt Kopyala
# robots.txt
# Bu heritrix botunu engelleyecektir

User-agent: heritrix
Disallow: /

Ayrıca Bakınız

Sunucu Server

What is heritrix?

Browser Crawler

User Agents List

heritrix Nedir

Block heritrix?

Tarama Botlar

Cloudflare

Tarama Botları

Scrapy Scraper

Yayınlanma: Güncellenme:

Bu site genel internet kaynaklarından alınan bilgiler içerir. Kullanım sorumluluğu size aittir. Materyal sahiplerine ait olan içeriklerin, logoların ve telif ihlaliyle ilgili sorumluluğu ilgililere aittir. Bilgilerin doğruluğu ve güncelliği garanti edilmez. Hatalı veya eksik bilgiler için bize iletişim yoluyla bildirin.