Logo TecMundo
Internet

Cloudflare acusa IA Perplexity de acessar sites mesmo sem autorização

A Perplexity foi acusada de web scraping e crawling mesmo de páginas que não autorizam acessos automatizados

Avatar do(a) autor(a): Igor Almenara Carneiro

schedule06/08/2025, às 09:00

updateAtualizado em 11/03/2026, às 08:33

A Perplexity foi acusada de indexar e extrair conteúdo até mesmo de páginas que não autorizam esse tipo de varredura, segundo denúncia da Cloudflare. A acusação faz parte de uma pesquisa publicada pela provedora de infraestrutura web na última segunda-feira (04).

“Estamos observando um comportamento de rastreamento furtivo do Perplexity, um mecanismo de busca e resposta com inteligência artificial”, afirmou a Cloudflare. “Embora a Perplexity inicialmente rastreie a partir do agente de usuário declarado, quando recebe um bloqueio de rede, parece ocultar sua identidade de rastreamento na tentativa de burlar as preferências do site”, completou.

smart_display

Nossos vídeos em destaque

A Cloudflare acusa a empresa de realizar web crawling e web scraping — respectivamente, os processos automatizados de indexação de páginas e extração de dados online.

Perplexity answering questions about our test website that should have not been accessible by Perplexity
Nos testes, o Cloudflare pediu informações de sites que não deveriam ser captados pelo Perplexity. (Fonte: Cloudflare/Reprodução)

De acordo com a Cloudflare, há “evidências contínuas” de que a Perplexity está modificando seu agente de usuário e alterando seu ASN (Número de Sistema Autônomo) para esconder sua identidade. A atividade foi observada em dezenas de milhares de domínios e milhões de requisições por dia.

“Nós fomos capazes de identificar o crawler usando a combinação de sinais de aprendizagem de máquina e rede”, completou a empresa.

Web crawling e scraping são naturais, mas precisam de autorização

Embora seja esperado que produtos baseados em IA realizem crawling e scraping como parte de seu funcionamento, o problema apontado está no uso de métodos para burlar restrições intencionais dos sites. Segundo a Cloudflare, a Perplexity teria usado navegadores genéricos disfarçados de Chrome no macOS quando seu próprio bot era bloqueado.

Em resposta ao TechCrunch, a Perplexity negou as acusações. A empresa afirmou que os registros apresentados pela Cloudflare não comprovam o acesso a conteúdo protegido e que o bot identificado não pertence a ela.

Atualmente, a Cloudflare trava uma batalha mais ampla contra rastreadores de serviços de IA. Em julho, a empresa lançou ferramentas para que donos de sites bloqueiem o acesso de bots automatizados.

Essa não é a primeira acusação contra a Perplexity: em 2024, veículos como a Wired denunciaram que o buscador estaria plagiando seus conteúdos por meio de scraping não autorizado.

Quer acompanhar mais polêmicas e avanços no mundo da inteligência artificial? Continue no TecMundo e fique por dentro de tudo que envolve tecnologia, privacidade e o futuro da web.

Perguntas Frequentes

O que é a acusação feita pela Cloudflare contra a Perplexity?
A Cloudflare acusou a Perplexity de realizar web scraping e web crawling em páginas que não autorizam acessos automatizados. Isso significa que a Perplexity estaria indexando e extraindo conteúdo de sites sem permissão.
O que são web scraping e web crawling?
Web scraping é o processo automatizado de extração de dados de sites, enquanto web crawling refere-se à indexação automatizada de páginas na internet. Ambos os processos são usados por mecanismos de busca para coletar informações online.
Como a Perplexity estaria burlando as restrições de acesso dos sites?
Segundo a Cloudflare, a Perplexity estaria modificando seu agente de usuário e alterando seu ASN (Número de Sistema Autônomo) para esconder sua identidade de rastreamento, permitindo assim acessar sites que bloqueiam acessos automatizados.
Quais evidências a Cloudflare apresentou contra a Perplexity?
A Cloudflare afirmou ter evidências contínuas de que a Perplexity está modificando seu agente de usuário e ASN para ocultar sua identidade. Essa atividade foi observada em dezenas de milhares de domínios e milhões de requisições diárias.
Qual é a importância de respeitar as preferências de acesso dos sites?
Respeitar as preferências de acesso dos sites é crucial para manter a integridade e a segurança dos dados online. Sites podem ter razões específicas para bloquear acessos automatizados, como proteger informações sensíveis ou evitar sobrecarga de servidores.
star

Continue por aqui