SiteBotları
Arama Motoru

Baiduspider

Baidu arama motoru için web taraması yapan bot. Çin pazarında baskın arama motorudur.

User-Agent

Baiduspider

IP Aralığı

Resmi dokümantasyon üzerinden doğrulanmalı.

İlk Görülme

2004yılından bu yana aktif

Tarama Sıklığı

Sık — özellikle Çince içerikler için çok aktif

Ne yapar?

Sayfaları keşfeder ve Baidu arama dizinine ekler.

Detaylı Bilgi

Baiduspider, Çin'in en büyük arama motoru Baidu tarafından işletilen web tarayıcısıdır. Baidu, Çin'de %70'in üzerinde pazar payıyla baskın arama motoru konumundadır ve Baiduspider bu devasa arama motorunun dizinini besleyen temel araçtır. İlk olarak 2004 yılında tespit edilen Baiduspider, başlangıçta ağırlıklı olarak Çince içerikleri tarasa da zamanla küresel ölçekte web taraması yapmaya başlamıştır.

Baiduspider, robots.txt dosyasına genel olarak uyum sağlar ancak geçmişte agresif tarama davranışı nedeniyle eleştirilmiştir. Bazı web sitesi yöneticileri, Baiduspider'ın tarama hızının sunucu kaynaklarını aşırı tükettiğini raporlamıştır. Bu nedenle Çin pazarını hedeflemeyen siteler için Baiduspider'ı engellemek yaygın bir uygulamadır.

Baidu, Baiduspider'ın birden fazla varyantını kullanır: Baiduspider (ana tarayıcı), Baiduspider-image (görsel tarama), Baiduspider-video (video tarama) ve Baiduspider-news (haber tarama). Her birini robots.txt'te ayrı ayrı yönetebilirsiniz.

Çin pazarına yönelik içerik üreten web siteleri için Baiduspider erişiminin açık olması zorunludur. Baidu Webmaster Tools üzerinden sitenizi kaydedebilir, sitemap gönderebilir ve tarama sorunlarını izleyebilirsiniz. Çin'in internet düzenlemeleri nedeniyle, Çin dışından erişilen sitelerin Baidu'da iyi sıralanması ek optimizasyon gerektirebilir. Baiduspider'ın IP adreslerini doğrulamak için reverse DNS sorgulama kullanılabilir.

Engellemeli miyim?

Hedef kitleniz Çin pazarında değilse Baiduspider'ı engelleyebilirsiniz. Bu bot, agresif tarama davranışı sergileyebilir ve sunucu kaynaklarınızı tüketebilir. Çin'den trafik almak istiyorsanız engellememeniz gerekir.

Nasıl engellenir?

  • robots.txt
  • IP bazlı engelleme

Robots.txt örneği

User-agent: Baiduspider
Disallow: /