GPTBot
OpenAI'ın web içeriklerini taramak için kullandığı bot. ChatGPT ve model eğitimi amaçlıdır.
User-Agent
GPTBotIP Aralığı
OpenAI tarafından yayınlanan IP aralıkları
İlk Görülme
2023yılından bu yana aktif
Tarama Sıklığı
Orta sıklıkta — hedefli tarama yapar
Ne yapar?
Web içeriklerini erişim politikasına göre tarayarak AI model geliştirmeye veri sağlar.
Detaylı Bilgi
GPTBot, OpenAI tarafından işletilen ve web içeriklerini taramak için kullanılan resmi web tarayıcısıdır. 2023 yılında duyurulan GPTBot, ChatGPT ve diğer OpenAI ürünlerinin geliştirilmesinde kullanılan eğitim verilerinin toplanması amacıyla çalışır. OpenAI, GPTBot'un kullanıcı tanımlamasını (user-agent string) ve IP aralıklarını kamuya açık olarak paylaşmaktadır.
GPTBot, web sayfalarını tararken belirli filtreleme kurallarına uyar. OpenAI'ın açıklamasına göre bot; paywall arkasındaki içerikleri, kişisel bilgi içeren sayfaları ve OpenAI politikalarını ihlal eden içerikleri taramaktan kaçınır. Ancak bu filtrelemenin kapsamı ve etkinliği tartışma konusudur.
Web sitesi sahipleri, robots.txt dosyasında GPTBot user-agent'ını belirterek taramayı tamamen engelleyebilir veya belirli dizinlere erişimi kısıtlayabilir. Bu engelleme, sitenin arama motorlarındaki görünürlüğünü etkilemez; yalnızca OpenAI'ın AI eğitim verisi toplama sürecini etkiler.
GPTBot'un tanıtılması, yapay zeka şirketlerinin web içeriklerini kullanma biçimleri hakkında önemli bir tartışma başlatmıştır. Birçok büyük haber sitesi ve yayıncı, telif hakları endişeleriyle GPTBot'u engellemektedir. OpenAI, web sitesi sahiplerine şeffaf kontrol mekanizmaları sunarak güven inşa etmeye çalışmaktadır. GPTBot'un tarama davranışı, sunucu kaynaklarını aşırı tüketmeyecek şekilde tasarlanmıştır ve robots.txt kurallarına tam uyum sağlar.
Engellemeli miyim?
İçeriklerinizin OpenAI'ın model eğitiminde kullanılmasını istemiyorsanız GPTBot'u engelleyin. Bu engelleme ChatGPT'nin mevcut yanıtlarını hemen etkilemez ancak gelecekteki eğitim verilerinden çıkarır. İçerik üreticiler için önemli bir telif hakkı kararıdır.
Nasıl engellenir?
- robots.txt
- WAF kuralı
- log analizi ile engelleme
Robots.txt örneği
User-agent: GPTBot Disallow: /