راهنمای جامع بودجه خزش (Crawl Budget) در سئو

بودجه خزش از آن دسته مسائل سئویی است که بعضی‌ها در مورد آن اطلاعی ندارند یا خیلی‌ها نمی‌دانند در مورد آن نگران باشند یا نباشند. درواقع از آنجا که بودجه خزش در ابتدای شروع به کار سایت چندان مهم به نظر نمی‌رسد، خیلی‌ها به آن توجهی ندارند، اما رفته‌رفته با بزرگ ‌شدن سایت، توجه به آن اهمیت پیدا می‌کند. ازاین‌رو همواره سوالات زیادی درمورد اینکه چه سایت‌هایی باید نگران بودجه خزش باشند و اینکه راهکارهای بهبود آن چیست، مطرح می‌شود. در این مقاله از وب 24 به این سوالات پاسخ داده‌ایم.

بودجه خزش (Crawl Budget) چیست؟

تعریف دقیق بودجه خزش عبارت است از تعداد صفحات سایت شما که گوگل در یک بازه زمانی مشخص خزش و ایندکس می‌کند. در توضیح این تعریف لازم است بدانید هرچقدر هم که گوگل بزرگ‌تر و قوی‌تر شود، بازهم منابع آن برای خزش صفحات سایت‌ها محدود است. هر روز نه ‌تنها هزاران صفحه به صفحات موجود در وب اضافه می‌شود بلکه هزاران سایت جدید هم متولد می‌شوند که هرکدام روزانه چندین صفحه به وب اضافه می‌کنند.

در این شرایط گوگل هم تلاش دارد تا جای ممکن صفحات بیشتری را ایندکس کند اما واقعا توان رسیدگی به همه آنها را ندارد. به همین دلیل اقدام به اولویت‌بندی سایت‌ها کرده و به هرکدام یک بودجه خزش اختصاص می‌دهد. در واقع با این بودجه خزش مشخص می‌شود که هر روز چند صفحه از یک سایت توسط ربات‌های گوگل خزش می‌شوند.

بودجه خزش

اهمیت بودجه خزش Crawl Budget در سئو

اساس فعالیت‌های سئوی سایت بر یک چیز استوار است و آن هم ایندکس ‌شدن صفحات در گوگل است. اگر صفحات سایت شما به هر دلیلی توسط گوگل ایندکس نشوند، فعالیت‌های سئوی شما بی‌فایده بوده و اصلا امکان حضور در نتایج جستجوی گوگل را نخواهید داشت. ازاین‌رو بودجه خزش سایت اهمیت پیدا می‌کند، زیرا تعداد صفحاتی را که قرار است در یک مدت مشخص خزش شوند، مشخص می‌کند. اگر سایت شما بسته به مقیاسی که دارد، نتواند بودجه خزش موردنیاز خود را بدست آورد، ممکن است بسیاری از صفحات آن در مدت زمان موردنظر شما ایندکس نشوند.

البته قرار نیست همه سایت‌ها بابت بودجه خزش خود نگرانی داشته باشند، چراکه خود گوگل به ‌خوبی امکان تشخیص صفحات جدید و ایندکس آنها را دارد اما در موارد زیر باید مراقب بودجه خزش سایت خود باشید:

  • سایت بسیار بزرگی دارید: اگر سایتی بزرگ مثل سایت‌های فروشگاهی با بیش از 10 هزار صفحه دارید، ممکن است گوگل در پیدا کردن همه صفحات شما مشکل پیدا کند.
  • قسمت جدیدی به سایت اضافه کرده‌اید: اگر به تازگی قسمت جدیدی به سایت اضافه کرده‌اید که هزاران صفحه را در برمی‌گیرد، ممکن است بودجه خزش فعلی شما برای ایندکس ‌کردن همه آن‌ها کافی نباشد.
  • ریدایرکت زیادی روی سایت انجام داده‌اید: ریدایرکت‌های زیاد روی صفحات سایت، می‌تواند بودجه خزش سایت شما را هدر بدهد.

نظر گوگل در مورد بودجه خزش

خود گوگل هم تاکید زیادی دارد که مدیران سایت‌ها یا سئوکارها نباید نگران بودجه خزش سایت خود باشند. چراکه این موضوع خیلی در اختیار آنها نیست. به‌هرحال هر شخصی دوست دارد، صفحات سایتش درست همان روزی که منتشر می‌شوند، خزش شده و در ایندکس گوگل قرار گیرند. اما این روندی است که توسط گوگل مدیریت می‌شود و معمولا هم سایت‌های نه‌چندان بزرگ مشکلی با بودجه خزش خود ندارند. به خصوص اگر سایت شما صفحاتی در حد چندهزار صفحه (زیر 10 هزار صفحه) دارد، اصلا نیازی به تمرکز روی بودجه خزش سایت ندارید. اما برای سایت‌های بزرگ مواردی مثل اولویت‌بندی صفحاتی که می‌خواهید خزش شوند، اینکه هر کدام چه زمانی خزش شوند و میزان منابعی که سرور سایت شما می‌تواند به خزش اختصاص دهد، اهمیت زیادی پیدا می‌کنند.

تعیین بودجه مورد نیاز هر سایت

دو شاخص کلی برای تعیین بودجه خزش هر سایت توسط گوگل معرفی شده که در ادامه آن‌ها را بررسی می‌کنیم:

حد سرعت خزش یا Crawl rate limit 

ربات‌های گوگل به صورت یک شهروند وظیفه‌شناس در فضای وب طراحی شده‌اند. اولویت اول آنها خزش در صفحات سایت‌ها است اما همزمان مراقب این هستند که هنگام خزش در سایت‌ها، تجربه کاربری آنها را تحت تاثیر قرار ندهند. ازاین‌رو گوگل شاخصی را به ‌عنوان «حد سرعت  خزش» تعیین کرده که بیشترین سرعت استخراج صفحات را برای هر سایت مشخص می‌کند. این شاخص در واقع تعداد ارتباطات همزمانی را که ربات گوگل با سایت شما برای خزش صفحات برقرار می‌کند، نشان می‌دهد و مقدار آن وابسته به دو عامل است:

  • سلامت خزش: اگر سایت شما به درخواست‌های ربات گوگل سریع پاسخ دهد، سرعت خزش آن بالا می‌رود. این بدین معنا است که ربات گوگل می‌تواند ارتباطات بیشتری با سایت شما بسازد و در یک محدوده زمانی مشخص، صفحات بیشتری را خزش کند. برعکس آن اگر سایت شما پاسخ‌هایی کند یا همراه با خطا به ربات گوگل بدهد، سرعت خزش پایین می‌آید.
  • تنظیم محدودیت در سرچ کنسول: برخی مدیران سایت‌ها از طریق سرچ کنسول گوگل اقدام به برقراری محدودیت در تعداد صفحات خزش ‌شده می‌کنند. این محدودیت می‌تواند سرعت خزش را کم کند.

تقاضای خزش یا Crawl demand 

یکی از عواملی که باعث افزایش بودجه خزش سایت شما می‌شود، درخواست خزش است. اگر درخواستی برای خزش از طرف سایت شما ایجاد نشود، فعالیت ربات‌های گوگل در آن کم می‌شود. عوامل زیر بر افزایش تقاضای خزش تاثیر دارند:

  • شهرت صفحات: صفحات اینترنتی که در فضای وب محبوب‌تر و مشهورتر هستند، اغلب توسط ربات‌های گوگل بیشتر خزش می‌شوند تا محتوای آنها در ایندکس بروز نگه داشته شود.
  • کهنه‌‌ شدن صفحات: گوگل ترجیح می‌دهد صفحاتی را که کهنه شده‌اند، در ایندکس خود نگه ندارد، به همین دلیل صفحاتی که کمتر به‌روزرسانی می‌شوند، کم‌کم شانس خود را برای خزش از دست می‌دهند.

روش‌های بهبود و افزایش بودجه خزش سایت

اگر سایت فروشگاهی با تعداد صفحات زیادی دارید، حتما نگران بودجه خزش سایت خود هستید. در این قسمت به معرفی راه‌هایی برای افزایش این بودجه می‌پردازیم:

بهبود سرعت سایت

افزایش سرعت بارگیری صفحات نه ‌تنها تجربه کاربری سایت را ارتقا می‌دهد، بلکه بودجه خزش آن را هم بالا می‌برد. در واقع سرعت پایین صفحات سایت باعث هدر رفتن زمانی می‌شود که ربات گوگل به سایت شما اختصاص داده است. بدین ‌ترتیب صفحاتی کمتری را می‌تواند خزش کند.

استفاده از لینک‌سازی داخلی

ربات‌های گوگل صفحاتی را که لینک‌های داخلی و خارجی بیشتری دارند، در اولویت خزش قرار می‌دهند. حالت ایده‌آل لینک‌سازی این است که همه صفحات سایت شما، لینک‌های خارجی ارزشمندی داشته باشند و ربات‌های گوگل را به سمت سایت شما هدایت کنند اما در واقعیت این اتفاق نمی‌افتد. معمولا فقط تعدادی از صفحات مهم سایت لینک‌های خارجی خوبی می‌گیرند. اینجاست که لینک‌سازی داخلی به‌کار می‌آید و می‌تواند ربات‌های گوگل را به سمت چنین صفحاتی هدایت کند.

استفاده از معماری سایت مسطح

با استفاده از معماری سایت مسطح همه صفحات سایت شما به هم مرتبط می‌شوند. بدین ‌ترتیب در صورتی که یک صفحه شهرت و اعتبار بالایی نزد گوگل پیدا کرد، آن را به بقیه صفحات سایت هم منتقل می‌کند. این کار باعث افزایش بودجه خزش سایت شما می‌شود.

از ایجاد صفحات یتیم خودداری کنید

صفحات یتیم صفحاتی هستند که هیچ لینک داخلی یا خارجی دریافت نکرده‌اند. ربات‌های گوگل برای پیدا کردن چنین صفحاتی در سایت، وقت زیادی را صرف می‌کنند. در نتیجه اگر می‌خواهید بودجه خزش سایت شما بالاتر رود، مراقب باشید صفحات یتیم در سایت نداشته باشید. هر صفحه باید حداقل یک لینک داخلی یا خارجی از صفحات دیگر داشته باشد. برای اطلاعات بیشتر می‌توانید مقاله "Orphan page" را مطالعه کنید.

مراقب محتوای تکراری در سایت باشید

گوگل هرگز به محتوای تکراری علاقه‌ای نداشته و نمی‌خواهد منابع خود را با ایندکس کردن صفحاتی که محتوای باارزشی ندارند، هدر دهد. به همین دلیل سعی کنید برای هر موضوع تنها یک صفحه با محتوای یکتا و باکیفیت داشته باشید. البته این کار برای سایت‌هایی با بیش از 10 هزار صفحه، واقعا سخت است. اما راه هوشمندانه و موثری برای افزایش بودجه خزش سایت است.

دلایل هدر رفت بودجه خزش سایت

احتمالا تاکنون متوجه شده‌اید که اگر سایت شما سرعت پایینی داشته باشد، بودجه خزش آن هدر می‌رود، چراکه در یک زمان مشخص، صفحات کمتری قابل خزش هستند. اما علاوه بر سرعت، وجود صفحات متعدد بی‌فایده در سایت هم می‌تواند بودجه خزش را هدر دهد. در ادامه لیستی از مواردی که بودجه خزش را هدر می‌دهند، مرور می‌کنیم:

  • اگر سایت شما هنگام جستجو، برای هر فیلتر جستجو یک آدرس جدید اختصاص می‌دهد، این کار بودجه خزش را هدر می‌دهد.
  • صفحاتی با محتوای یکسان و تکراری همواره در حال تلف‌ کردن بودجه خزش هستند.
  • صفحاتی که محتوای بی‌ارزش دارند، تنها بودجه خزش را مصرف می‌کنند اما رتبه‌ای در نتایج جستجوی گوگل نمی‌گیرند.
  • لینک‌های شکسته و ریدایرکت‌ها باعث می‌شوند ربات‌های گوگل گمراه شوند و زمانی که به سایت شما اختصاص داده شده، هدر رود.
  • وجود صفحات غیرقابل ‌ایندکس در فایل sitemap نتیجه‌ای جز هدر دادن بودجه خزش نخواهد داشت. مراقب آن باشید.
  • اگر زمان زیادی برای بارگیری صفحات سایت نیاز باشد، وقت ربات‌های گوگل و بودجه خزش سایت شما هدر می‌رود.
  • ساختار لینکسازی داخلی ضعیف می‌تواند ربات‌های گوگل را از برخی صفحات منحرف کند.

جمع‌بندی

بودجه خزش معمولا برای سایت‌های فروشگاهی با بیش از 10 هزار صفحه اهمیت بیشتری دارد، اما افزایش آن کار سختی نیست. کافی است مواردی که در این مقاله گفتیم را رعایت کنید تا همه صفحات سایت شما خیلی زود خزش شده و در ایندکس گوگل قرار گیرند.

همچنین بخوانید
فیلتر rejex چیست و در چه مواردی می توان از آن استفاده کرد؟ لیست دستورات rejex برای سرچ کنسول را در این مطلب از وب 24 بخوانید.
قابلیت ها و ضروری ترین کدهای فایل httaccess را در این مطلب از سایت وب24 بخوانید.
در این مطلب از سایت وب 24 با پسوند دامنه و انواع آن آشنا شوید.
چه افزونه ای برای کش وردپرس نصب کنیم؟ لیست بهترین پلاگین های کش برای وردپرس را در این مطلب از سایت وب 24 معرفی شده است.
دیدگاه خود را با ما در میان بگذارید
امتیاز:
captcha