Sobre o Applebot
Saiba mais sobre o Applebot, o web crawler da Apple.
Os dados rastreados pelo Applebot são usados para alimentar vários recursos, como a tecnologia de busca que está integrada a muitas experiências do usuário no ecossistema da Apple, inclusive Spotlight, Siri e Safari. A ativação do Applebot em robots.txt permite que o conteúdo do site apareça nos resultados de busca para usuários da Apple em todo o mundo nesses produtos.
O Applebot acessa muitos tipos de recurso de servidores da web, incluindo, entre outros, robots.txt, sitemaps, feeds RSS, HTML, recursos secundários necessários para renderizar páginas, como javascript, solicitações Ajax, imagens e muito mais.
Como identificar o Applebot
O tráfego proveniente do Applebot é geralmente identificado usando DNS reverso no domínio *.applebot.apple.com.
Outra maneira é combinar o endereço IP com um prefixo CIDR contido no seguinte arquivo JSON: Applebot IP CIDRs.
DNS reverso
O comando host pode ser usado para determinar se um endereço IP faz parte do Applebot. Estes exemplos mostram o comando host e seu resultado:
$ host 17-58-101-179.applebot.apple.com 17-58-101-179.applebot.apple.com has address 17.58.101.179.
O comando host também pode ser usado para verificar se o DNS aponta para o mesmo endereço IP:
$ host 17.58.101.179 179.101.58.17.in-addr.arpa domain name pointer 17-58-101-179.applebot.apple.com.
Agentes do usuário
Um agente do usuário ajuda os webmasters a identificar o tráfego do rastreador para que eles possam obter relatórios precisos de registro de acesso da atividade do rastreador e controlar o acesso ao site via robots.txt.
O Applebot alimenta vários agentes de usuário, incluindo Busca e Podcasts.
Busca
Para rastreamento e renderização de pesquisa na web, o Applebot usa o seguinte formato:
A string user-agent contém "Applebot" e outras informações. O seguinte é o formato geral:
Mozilla/5.0 (Device; OS_version) AppleWebKit/WebKit_version (KHTML, like Gecko)Version/Safari_version [Mobile/Mobile_version] Safari/WebKit_version (Applebot/Applebot_version; +http://www.apple.com/go/applebot)
Exemplo para computador:
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15(KHTML, like Gecko) Version/17.4 Safari/605.1.15 (Applebot/0.1; +http://www.apple.com/go/applebot)
Exemplo para celular:
Mozilla/5.0 (iPhone; CPU iPhone OS 17_4_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.4.1 Mobile/15E148 Safari/604.1 (Applebot/0.1; +http://www.apple.com/go/applebot)
Ocasionalmente, o Applebot atualizará a versão do navegador anunciado enquanto permanece no formato geral acima.
Apple Podcasts
O tráfego iTMS também pode ser proveniente de hosts applebot.apple.com e será identificado pelo seguinte agente do usuário:
User-Agent: iTMS
O agente do usuário do iTMS não segue robots.txt, pois não é um rastreador de pesquisa geral. Ele apenas rastreia URLs associadas ao conteúdo registrado no Apple Podcasts.
Como personalizar regras robot.txt
O Applebot respeita as diretivas padrão do robots.txt em rastreamentos de busca gerais direcionados ao Applebot. Neste exemplo, o Applebot não tenta rastrear documentos incluídos em /private/ ou /not-allowed/:
User-agent: Applebot Allow: / Disallow: /private/ User-agent: * Disallow: /not-allowed/
Se as instruções robots não mencionarem o Applebot, mas mencionarem o Googlebot, o robô da Apple seguirá as instruções do Googlebot.
Regras de renderização e robô
O Applebot pode renderizar o conteúdo do site em um navegador. Se javascript, CSS e outros recursos estiverem bloqueados via robots.txt, talvez não seja possível renderizar o conteúdo corretamente. Isso inclui XHR, JS e CSS que a página pode exigir.
Para que o Applebot indexe o melhor conteúdo para a página, verifique se tudo o que é necessário para o usuário renderizar a página está disponível para o Applebot. Como alternativa, verifique se o site é renderizado de maneira limpa, mesmo que os recursos não estejam disponíveis. Isso geralmente é chamado de degradação graciosa.
Como personalizar regras de indexação para Applebot
O Applebot é compatível com meta tags robots em documentos HTML. Para especificar regras robots em meta tags, coloque as tags na seção
... ...
O Applebot também é compatível com as seguintes diretivas:
noindex: o Applebot não indexa a página, e ela não aparece nas sugestões do Spotlight ou da Siri.
nosnippet: o Applebot não gera uma descrição ou resposta da Internet para a página.
nofollow: o Applebot não segue nenhum link na página.
none: o Applebot não indexa, obtém trechos ou segue os links na página, conforme descrito acima.
all: o Applebot fornece o documento nas sugestões e obtém trechos do conteúdo para apresentar uma breve descrição da página ao lado de uma imagem representativa.
Para inserir diversas diretivas em uma única meta tag, separe-as por vírgula ou insira diversas meta tags.
Exemplo:
Como controlar o uso de dados
Além de seguir todas as regras e diretivas do robots.txt, a Apple tem um agente de usuário secundário, Applebot-Extended, que oferece aos editores da web controles adicionais sobre como o conteúdo do site pode ser usado pela Apple.
Com o Applebot-Extended, os editores da web podem optar por não usar o conteúdo do site para treinar os modelos de base da Apple que alimentam recursos da IA generativa em todos os produtos da Apple, incluindo Inteligência, Serviços e Ferramentas para desenvolvedores Apple.
Você pode adicionar uma regra a robots.txt para não permitir o Applebot-Extended da seguinte forma:
User-agent: Applebot-Extended Disallow: /private/
O Applebot-Extended não rastreia páginas da web. Páginas da web que não permitem o Applebot-Extended ainda podem ser incluídas nos resultados da busca. O Applebot-Extended é usado apenas para determinar como usar os dados rastreados pelo agente do usuário do Applebot.
Permitir o Applebot-Extended ajudará a melhorar os recursos e a qualidade dos modelos de IA generativa da Apple ao longo do tempo.
Sobre classificações de busca
O Apple Search pode levar estes fatores em consideração ao classificar os resultados da busca na web:
Envolvimento agregado do usuário com os resultados da busca
Relevância e correspondência dos termos da busca com os tópicos e o conteúdo da página da web
Número e qualidade dos links de outras páginas na web
Sinais baseados na localização do usuário (dados aproximados)
Características de design da página na web
Os resultados da busca podem usar os fatores acima sem importância (predefinida) da classificação. Os usuários da busca estão sujeitos à política de privacidade em Sugestões da Siri, Busca e Privacidade.
Entre em contato conosco
Caso você tenha perguntas ou dúvidas, entre em contato conosco pelo e-mail applebot@apple.com.
As informações sobre produtos não fabricados pela Apple ou sobre sites independentes não controlados nem testados pela Apple são fornecidas sem recomendação ou aprovação. A Apple não assume responsabilidade alguma com relação à escolha, ao desempenho ou ao uso de sites ou produtos de terceiros. A Apple não garante a precisão nem a confiabilidade de sites de terceiros. Entre em contato com o fornecedor para mais informações.