谷歌搜索引擎蜘蛛IP段官方查询地址

您可以验证访问您服务器的网页抓取工具是否确实是 Google 抓取工具,例如 Googlebot。如果您担心自称是 Googlebot 的垃圾内容发布者或其他麻烦制造者在访问您的网站,则会发现该方法非常有用。

Google 抓取工具分为三类:

类型说明反向 DNS 掩码IP 范围
常见抓取工具用于 Google 产品的常见抓取工具(例如 Googlebot)。它们始终会遵循自动抓取的 robots.txt 规则。crawl-***-***-***-***.googlebot.comgeo-crawl-***-***-***-***.geo.googlebot.comgooglebot.json
特殊情况下的抓取工具为 Google 产品(例如 AdsBot)执行特定功能的抓取工具,并且被抓取的网站与产品之间会就抓取过程达成协议。这些抓取工具可能遵循 robots.txt 规则,也可能不遵循。rate-limited-proxy-***-***-***-***.google.comspecial-crawlers.json
用户触发的抓取器最终用户触发抓取操作的工具和产品功能。例如,Google 网站验证工具会响应用户请求。由于是用户请求的抓取,因此这些抓取器会忽略 robots.txt 规则。
由 Google 控制的抓取工具源自 user-triggered-fetchers-google.json 对象中的 IP,并解析为 google.com 主机名。user-triggered-fetchers.json 对象中的 IP 解析为 gae.googleusercontent.com 主机名。例如,如果 Google Cloud (GCP) 上运行的网站具有需要根据该网站用户的请求提取外部 RSS Feed 的功能,便会使用这些 IP。
***-***-***-***.gae.googleusercontent.comgoogle-proxy-***-***-***-***.google.comuser-triggered-fetchers.json 和 user-triggered-fetchers-google.json

验证 Google 抓取工具的方法有两种:

  • 手动验证:如果是一次性查找,请使用命令行工具。对于大多数用例,此方法足以满足需求。
  • 自动验证:如果是大规模查找,请使用自动解决方案将抓取工具的 IP 地址与已发布的 Googlebot IP 地址列表进行比对。

使用命令行工具

  1. 使用 host 命令对日志中访问服务器的 IP 地址运行 DNS 反向查找。
  2. 验证域名是 googlebot.comgoogle.com 还是 googleusercontent.com
  3. 使用 host 命令对在第 1 步中检索到的域名运行 DNS 正向查找。
  4. 验证该域名与日志中访问服务器的原始 IP 地址是否一致。

示例 1

host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.

host crawl-66-249-66-1.googlebot.com
crawl-66-249-66-1.googlebot.com has address 66.249.66.1

示例 2

host 35.247.243.240
240.243.247.35.in-addr.arpa domain name pointer geo-crawl-35-247-243-240.geo.googlebot.com.

host geo-crawl-35-247-243-240.geo.googlebot.com
geo-crawl-35-247-243-240.geo.googlebot.com has address 35.247.243.240

示例 3

host 66.249.90.77
77.90.249.66.in-addr.arpa domain name pointer rate-limited-proxy-66-249-90-77.google.com.

host rate-limited-proxy-66-249-90-77.google.com
rate-limited-proxy-66-249-90-77.google.com has address 66.249.90.77

使用自动解决方案

或者,您也可以通过将抓取工具的 IP 地址与 Google 抓取工具和抓取器的 IP 范围列表进行比对,按 IP 地址识别 Googlebot:

对于可借以访问您网站的其他 Google IP 地址(例如通过 Apps 脚本),请将访问 IP 地址与通用 Google IP 地址列表进行比对。请注意,JSON 文件中的 IP 地址以 CIDR 格式表示。

下载权限
查看
  • 免费下载
    评论并刷新后下载
    登录后下载
  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余

给TA打赏
共{{data.count}}人
人已打赏
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
QQ客服
  • QQ176363189 点击这里给我发消息
旺旺客服
  • 速度网络服务商 点这里给我发消息
电子邮箱
  • sudu@yunjiasu.cc
微信客服
  • suduwangluo