五月激情久久久_亚洲黄一区二区三区_国产精品午夜久久_亚洲v在线看


本文是 MERJ 和 Vercel 研究實際數據總結了目前主流 AI 爬蟲的幾個特征。

注:Vercel 是 Next.js 的前端云平臺;MERJ 是數據驅動的營銷公司;本文翻譯自 Vercel 的 Blog 文章《The rise of the AI crawler》。

整體上,AI 爬蟲已經成為網絡上的重要存在。在過去一個月中,OpenAI 的 GPTBot 在 Vercel 網絡上產生了 5.69 億次抓取,而 Anthropic 的 Claude 緊隨其后,達到了 3.7 億次。

而這 2 個加起來的請求量只占同期 Googlebot 45 億次抓取的 20%。

規模和分布

Vercel 網絡上的 AI 爬蟲流量非常大。在過去的一個月:

  • Googlebot:Gemini 和 Googlebot 的抓取次數達到 45 億次
  • GPTBot (ChatGPT):5.69 億次抓取
  • Claude:3.7 億次抓取
  • AppleBot:3.14 億次抓取
  • PerplexityBot:2440 萬次抓取

GPTBot、Claude、AppleBot 和 PerplexityBot 合計抓取了近 13 億次,約占 Googlebot 總抓取量的 28%+。

雖然AI 爬蟲尚未達到 Googlebot 的規模,但他們已占據網絡爬蟲流量的很大部分

爬蟲位置分布

這些 AI 爬蟲都在美國數據中心

  • ChatGPT:得梅因(愛荷華州)、菲尼克斯(亞利桑那州)
  • Claude:哥倫布(俄亥俄州)

相比之下,傳統搜索引擎通常會將抓取分散到多個地區。例如,Googlebot 在美國七個不同的地區運營,包括達爾斯(俄勒岡州)、康瑟爾布拉夫斯(愛荷華州)和蒙克斯科納(南卡羅來納州)。

JavaScript 渲染能力

AI 爬蟲在 JavaScript 渲染能力方面存在明顯差異。為了驗證我們的發現,我們分析了使用不同技術棧的 Next.js 應用程序和傳統網頁應用。 調查結果一致表明,目前主要的 AI 爬蟲都不渲染 JavaScript。這包括:

  • OpenAI (OAI-SearchBot, ChatGPT-User, GPTBot)
  • Anthropic (ClaudeBot)
  • Meta (Meta-ExternalAgent)
  • 字節跳動 ByteDance (Bytespider)
  • Perplexity (PerplexityBot)

研究結果還顯示:

  • Google 的 Gemini 利用 Googlebot 的能力,因此能夠完整渲染 JavaScript。
  • AppleBot 通過基于瀏覽器的爬蟲渲染 JavaScript,類似于 Googlebot。它能處理 JavaScript、CSS、Ajax 請求以及完整頁面渲染所需的其他資源。
  • Common Crawl (CCBot),這個經常被用作大語言模型(LLMs)訓練數據集的爬蟲,不渲染頁面。

數據表明,雖然 ChatGPT 和 Claude 的爬蟲確實會獲取 JavaScript 文件(ChatGPT:11.50%,Claude:23.84% 的請求),但它們并不執行這些文件。它們無法讀取客戶端渲染的內容

但請注意,包含在初始 HTML 響應中的內容(如 JSON 數據或延遲的 React Server Components)可能仍會被索引,因為 AI 模型可以解析非HTML內容。

相比之下,Gemini 使用 Google 的基礎設施,使其具有與我們在 Googlebot 分析中記錄的相同渲染能力,能夠完整處理最新的網頁應用。

內容類型優先級

AI 爬蟲在抓取 nextjs.org 時表現出明顯的內容類型偏好。最明顯的特征有:

  • ChatGPT 優先考慮 HTML 內容(57.70% 的抓取量)
  • Claude 高度關注圖片內容(35.17% 的總抓取量)
  • 盡管不執行 JavaScript 文件,但兩種爬蟲都花費大量時間在這些文件上(ChatGPT:11.50%,Claude:23.84%)

作為對比,Googlebot 的抓取量(包括 Gemini 和搜索)分布更加均勻:

  • 31.00% HTML 內容
  • 29.34% JSON 數據
  • 20.77% 純文本
  • 15.25% JavaScript

這些模式表明AI 爬蟲會收集多樣化的內容類型——HTML、圖片,甚至將 JavaScript 文件作為文本收集——這可能是為了訓練他們的模型以適應各種形式的網頁內容。

雖然像 Google 這樣的傳統搜索引擎已經針對搜索索引優化了他們的抓取模式,但較新的AI 公司可能仍在完善他們的內容優先級策略

爬蟲效率問題

我們的數據顯示AI 爬蟲行為存在明顯的低效現象:

  • ChatGPT 有 34.82% 的抓取遇到 404 頁面
  • Claude 表現相似,有 34.16% 的抓取遇到 404 錯誤
  • ChatGPT 另外還有 14.36% 的抓取在處理重定向

對 404 錯誤的分析顯示,除去 robots.txt 之外,這些爬蟲經常嘗試獲取 /static/ 文件夾中的過期資源。這表明AI 爬蟲需要改進 URL 選擇和處理策略以避免不必要的抓取。

這些高比例的 404 錯誤和重定向與 Googlebot 形成鮮明對比 -Googlebot 僅有 8.22% 的請求遇到 404 錯誤,1.49% 的請求遇到重定向。這表明 Google 在優化其爬蟲以抓取真實資源方面確實有更多經驗。

流量相關性分析

我們對流量模式的分析揭示了爬蟲行為和網站流量之間存在關聯性?;趤碜?/span>nextjs.org?的數據:

  • 較高自然流量的頁面會收到更頻繁的爬蟲訪問
  • AI爬蟲在 URL 選擇上存在不可預測的情況
  • 較高的 404 錯誤率表明AI 爬蟲可能需要改進其 URL 選擇和驗證流程

雖然傳統搜索引擎已經開發出復雜的優先級算法,但 AI 爬蟲似乎仍在不斷發展其網絡內容發現方法。

建議

對于希望被抓取的網站站長

  • 優先對關鍵內容進行服務器端渲染。?ChatGPT 和 Claude 不執行 JavaScript,因此任何重要內容都應該在服務器端渲染。這包括主要內容(文章、產品信息、文檔)、元信息(標題、描述、分類)和導航結構。SSR、ISR 和 SSG 能確保您的內容對所有爬蟲都是可訪問的。

  • 客戶端渲染仍適用于增強功能。?您可以放心地對非核心的動態元素使用客戶端渲染,比如訪問計數器、交互式UI增強功能、在線聊天小部件和社交媒體信息流。

  • 高效的URL管理比以往任何時候都更重要。?AI 爬蟲的高 404 錯誤率突顯了維護適當重定向、保持站點地圖更新以及在整個網站使用一致的 URL 模式的重要性。

對于不希望被抓取的網站所有者

  • 使用robots.txt?來控制爬蟲訪問。robots.txt?文件對所有爬蟲都有效。通過指定AI爬蟲的用戶代理(user agent)或產品標識(product token)來設置具體規則,以限制對敏感或非必要內容的訪問。要找到需要禁止的用戶代理,您需要查看每個公司自己的文檔(例如,Applebot和OpenAI的爬蟲)。

  • 使用 Vercel 的 WAF 來阻止AI爬蟲。?我們的"阻止AI機器人防火墻規則"讓您只需一鍵就能阻止AI爬蟲。這個規則會自動配置您的防火墻以拒絕它們的訪問。

對于 AI 用戶

  • JavaScript 渲染的內容可能缺失。?由于 ChatGPT 和 Claude 不執行 JavaScript,它們對動態網絡應用的響應可能不完整或過時。

  • 注意信息來源。?較高的404錯誤率(>34%)意味著當 AI 工具引用特定網頁時,這些 URL 很可能是錯誤的或無法訪問的。對于重要信息,始終直接驗證來源而不是依賴AI提供的鏈接。

  • 預期更新的不一致性。?雖然 Gemini 利用 Google 的基礎設施進行抓取,但其他 AI 助手顯示出較不可預測的模式。有些可能引用較舊的緩存數據。

有趣的是,即使在向 Claude 或 ChatGPT 請求最新的Next.js文檔數據時,我們通常在nextjs.org?的服務器日志中也看不到即時的獲取請求。這表明AI模型可能依賴于緩存數據或訓練數據,即使它們聲稱已獲取最新信息。

總結

我們的分析顯示,AI 爬蟲已經迅速成為網絡上的重要存在,在 Vercel 的網絡上每月有近 10 億次請求。

然而,在渲染能力、內容優先級和效率方面,它們的行為與傳統搜索引擎有明顯不同。遵循已建立的網絡開發最佳實踐——特別是在內容可訪問性方面——仍然至關重要。

備注

  • 原文:《The rise of the AI crawler》https://vercel.com/blog/the-rise-of-the-ai-crawler
  • 作者:Giacomo Zecchini 、Alice Alexandra Moore、Malte Ubl、Ryan Siddle


點贊(3) 打賞

評論列表 共有 0 條評論

暫無評論

服務號

訂閱號

備注【拉群】

商務洽談

微信聯系站長

發表
評論
立即
投稿
返回
頂部
五月激情久久久_亚洲黄一区二区三区_国产精品午夜久久_亚洲v在线看
狠狠久久亚洲欧美专区| 欧美成人三级在线| 欧美三区在线视频| 亚洲精品久久久久久久久久久久久| 久久婷婷综合激情| 在线观看视频欧美| 乱人伦精品视频在线观看| 国产一区二区丝袜高跟鞋图片| 久久精品动漫| 在线欧美影院| 欧美久久久久免费| 中文日韩在线| 国产农村妇女精品一二区| 久久国产欧美精品| 一区二区三区中文在线观看| 免费视频一区| 一区二区三区日韩欧美精品| 国产精品热久久久久夜色精品三区 | 国语自产精品视频在线看一大j8 | 欧美日本在线看| 一本色道久久99精品综合| 欧美午夜在线视频| 久久xxxx精品视频| 亚洲国产一区二区a毛片| 欧美成人精品不卡视频在线观看 | 亚洲国产精品va在线观看黑人| 久久婷婷亚洲| 9l国产精品久久久久麻豆| 欧美—级高清免费播放| 亚洲视频1区2区| 黄色欧美成人| 欧美精品一区二区蜜臀亚洲| 亚洲欧美中文另类| 国产一区二区三区免费在线观看| 欧美高清在线| 亚洲一区二区3| 一区免费观看| 国产精品都在这里| 免费观看久久久4p| 亚洲一区免费在线观看| 伊人激情综合| 国产精品成人国产乱一区| 久久综合给合久久狠狠色| 亚洲欧洲日本专区| 国产日韩av高清| 欧美区高清在线| 久久久久久久久久码影片| 在线一区欧美| 亚洲国产mv| 国产一区二区三区在线观看网站 | 日韩亚洲欧美中文三级| 国产区日韩欧美| 欧美视频成人| 农夫在线精品视频免费观看| 久久超碰97人人做人人爱| av不卡在线| 亚洲国产成人精品久久久国产成人一区| 欧美香蕉大胸在线视频观看| 欧美高清一区| 久久在精品线影院精品国产| 午夜精品久久久久久久久久久久久| 亚洲精品国产精品国自产在线| 狠狠狠色丁香婷婷综合激情| 国产精品入口福利| 欧美日韩中文字幕日韩欧美| 男人的天堂成人在线| 久久九九精品99国产精品| 亚洲视频播放| 国内揄拍国内精品少妇国语| 国产精品女人毛片| 国产精品一区在线播放| 国产精品久久久久久久一区探花 | 午夜精品在线| 久久国产精品一区二区三区四区| 久久精品国产一区二区电影| 久久嫩草精品久久久久| 六十路精品视频| 欧美sm视频| 欧美精品网站| 国产精品久久久久久久久免费| 国产精品视频精品| 国产一区欧美日韩| 亚洲风情亚aⅴ在线发布| 91久久国产综合久久91精品网站| 亚洲精品少妇30p| 亚洲视屏一区| 久久精品日韩| 你懂的视频一区二区| 欧美日韩福利在线观看| 国产精品美女久久久久久2018| 国产午夜精品视频| 亚洲二区三区四区| 亚洲视频每日更新| 久久精品网址| 欧美激情在线狂野欧美精品| 国产精品久久毛片a| 狠狠网亚洲精品| 99精品热视频只有精品10| 欧美一区二区三区喷汁尤物| 免费成人黄色片| 欧美午夜欧美| 在线电影一区| 亚洲影院污污.| 久久久久久久综合狠狠综合| 欧美日韩国产麻豆| 国产一区香蕉久久| 一区二区av| 久久天堂精品| 国产精品免费观看视频| 亚洲国产精品小视频| 亚洲午夜精品网| 免费在线播放第一区高清av| 国产精品私人影院| 亚洲国产日韩欧美在线图片| 亚洲免费网站| 欧美日韩国产黄| 红桃视频成人| 亚洲欧美99| 欧美日韩成人精品| 精品成人国产| 欧美一区二区三区免费在线看 | 欧美影院午夜播放| 欧美喷水视频| 亚洲高清在线观看一区| 亚洲欧美日韩国产成人| 欧美日本中文字幕| 悠悠资源网久久精品| 先锋亚洲精品| 国产精品久久久久国产精品日日 | 国产精品日韩专区| 亚洲精品一区二区三区蜜桃久| 久久九九国产精品| 国产精品亚洲第一区在线暖暖韩国| 日韩写真在线| 欧美电影打屁股sp| 精品成人在线视频| 欧美一区二区精品| 国产精品看片资源| 在线中文字幕不卡| 欧美猛交免费看| 亚洲欧洲久久| 欧美国产日韩一区二区| 在线观看欧美日本| 久久青草福利网站| 国内激情久久| 久久久久.com| 狠狠v欧美v日韩v亚洲ⅴ| 久久激情久久| 国产一区二区三区久久悠悠色av| 亚洲欧美日韩一区二区在线 | 国产欧美一区二区精品婷婷| 亚洲嫩草精品久久| 国产精品激情| 亚洲专区一二三| 国产精品欧美一区喷水 | 久久精品国产96久久久香蕉 | 亚洲国产欧美在线人成| 美女精品网站| 亚洲欧洲日产国产综合网| 欧美成人官网二区| 亚洲福利视频一区二区| 毛片精品免费在线观看| 亚洲国产日韩欧美在线动漫| 欧美成人午夜77777| 亚洲免费电影在线| 欧美调教vk| 午夜精品久久久久久久蜜桃app| 国产精品永久| 久久久久久久久久久一区 | 日韩午夜在线播放| 欧美午夜片在线观看| 欧美一级理论性理论a| 国产亚洲欧美中文| 噜噜噜91成人网| 亚洲国产另类久久久精品极度| 欧美高清你懂得| 在线视频一区观看| 国产美女高潮久久白浆| 久久久久久久成人| 亚洲人成免费| 国产精品mm| 久久久久青草大香线综合精品| 亚洲国产精品视频| 欧美性开放视频| 亚洲欧美日韩中文播放| 韩国在线一区| 欧美理论在线| 久久精品盗摄| 夜夜爽99久久国产综合精品女不卡| 国产精品麻豆va在线播放| 久久久999国产| 99re8这里有精品热视频免费| 国产精品视频一区二区高潮| 久久尤物视频| 亚洲在线观看视频网站| 在线观看国产精品淫| 国产精品成人一区二区三区夜夜夜 | 亚洲欧美日韩在线不卡| 影音先锋亚洲视频| 国产精品白丝av嫩草影院|