021-88926351
info@ezHost.ir
ورود ثبت نام
Facebook
LinkedIn
Instagram
  • صفحه نخست
  • ثبت دامنه
  • میزبانی وب
    • هاست لینوکس
      • حرفه ای ایران
      • حرفه ای اروپا
      • اقتصادی (لیکونومی)
      • هاست ویژه وردپرس
    • هاست ویندوز
      • حرفه ای ابری ایران
  • سرور مجازی
    • ایران
    • خارج
      • آلمان
      • فنلاند
    • سرور مجازی بایننس و ترید
  • سرور اختصاصی
    • خارج از کشور
      • سرور هلند
  • نمایندگی فروش
    • هاست لینوکس
      • داخل کشور
      • خارج از کشور
    • هاست ویندوز
      • داخل کشور
    • نمایندگی دامنه بین المللی
    • همکاری در فروش
  • سایر خدمات
    • گواهینامه SSL
    • طراحی وب سایت
  • ایزی هاست
    • ورود به ناحیه کاربری
    • وبلاگ ایزی هاست
    • شماره حساب ها
    • فرصت های شغلی
    • سنجش رضایتمندی
    • درباره ما
    • تماس با ما
معرفی و کاربرد فایل Robots.txt

معرفی و کاربرد فایل Robots.txt

آگوست 19, 2015مدیر سایتدانشنامهبدون پیغام

امروزه، تعداد بازدید و ترافیک دریافتی هر وب سایت تا مقدار زیادی محتاج موتور های جستجو می باشد. بنابراین برای جذب مشتریان جدید و کسب درآمد از طریق وب سایت خود، باید تنظیمات لازمی را جهت معرفی سایت به موتورهای جستجو انجام دهید. این تنظیمات در صورتیکه به درستی انجام نپذیرند نیز می توانند در برخی از مواقع، برای سایت شما مشکل ساز شده و حتی باعث متحمل شدن ضرر مالی برای شما گردند. بنابراین تسلط به راهکار های کنترلی و اعمال محدودیت های لازم در این زمینه یکی از عوامل ضروری برای نگهداری وب سایت می باشد.

روباتبه غیر از تنظیمات هر موتور جستجو که با معرفی وب سایت به آن و معمولاً از طریق ابزارهای Webmaster همان موتور خاص انجام می پذیرد، پاره ای دیگر از تنظیمات کلی را نیز می تواند به صورت مرکزی در وب سایت خود اعمال نمود، تا با استفاده از آن، مواردی همچون ایندکس شدن وب سایت در یک موتور خاص، ایندکس شدن پوشه هایی خاص و … را تنظیم نمود.

تمامی موارد فوق الذکر را می توان از طریق قرار دادن فایل متنی ساده ای به نام Robots.txt در فضای هاستینگ وب سایت اعمال نمود. مدیران وب سایت با استفاده از این فایل توضیحات لازمی را برای روبات های موتورهای جستجو آماده می کنند که به این توضیحات Robots Exclusion Protocol گفته می شود.

برای مثال فرض کنید که روبات سایت گوگل قصد چک نمودن آدرس وب سایت شما را به آدرس ( http://www.yourdomain.com/index.html ) دارد. در صورتی که شما از قبل فایل Robots.txt لازم را در فضای میزبانی خود قرار داده باشید، بنابراین روبات گوگل قبل از رفتن به URL اصلی وب سایت شما به URL فایل مذکور یعنی http://www.yourdomain.com/robots.txt رجوع نموده و با عبارت زیر مواجه می گردد:

User-agent: *
 Disallow: /

عبارت User-agent* مشخص می کند که تنظیمات پیش رو در خط های بعدی باید بر روی تمامی روبات ها (ازجمله روبات های گوگل، یاهو و بینگ) اعمال شوند. و عبارت Disallow/ اجازه دسترسی هیچ روباتی را به هیچ یک ازپوشه ها یا فایلهای مربوطه نمی دهد. بنابراین زمانی که روبات گوگل نیز با این عبارات مواجه می شود، دیگر آدرس دیگری از سایت را مشاهده و ایندکس نمی کند.

دونکته قابل ملاحظه در زمان کار با فایل Robots.txt وجود دارد:
– برخی از روبات ها، مخصوصاً روبات های مخرب (Malware) می توانند فایل Robots.txt شما را نادیده بگیرند. برخی از روبات های مخرب از اینکار استفاده کرده تا قادر باشند وب سرور را برای مشاهده ضعف های امنیتی اسکن نمایند و یا آدرس ایمیل های مفید را برای افراد اسپمر جمع آوری کنند.
– فایل Robots.txt برای نمایش به عموم آزاد می باشد. بنابراین همه میتوانندتنظیمات اعمال شده توسط شما را در این فایل مشاهده نمایند.
بنابراین بهتر است از این فایل برای مخفی نمودن اطلاعات خود استفاده نکنید.

چگونگی ساخت فایل Robots.txt

به سادگی می توانید فایلی با فرمت txt در داخل پوشه روت فضای وب سایت خود ساخته و کدهای مربوطه را داخل آن تایپ نمایید. در ساخت این فایل دقت نمایید که نام آن را تماماً با حروف کوچک یعنی robots.txt بنویسید.

محتویات فایل

فایل Robots یک فایل متنی بوده که شامل یک تا چند رکورد می باشد. نمونه کد زیر مثالی از محتویات فایل Robots.txt می باشد:

User-agent: *
 Disallow: /cgi-bin/
 Disallow: /tmp/
 Disallow: /~joe/

در نمونه کد فوق، دایرکتوری های cgi-bin، tmp و همچنین ~joe از لیست فولدرهای قابل ایندکس شدن حذف گردیده و روبات موتور جستجو از پوشه های مذکور صرف نظر می کند.

دقت نمایید که برای خارج نمودن چند فولدر از لیست ایندکسینگ باید هریک را همانند مثال فوق در سطری جداگانه تعریف نمایید و امکان درج آن ها به صورت یکجا یعنی “Disallow: /cgi-bin/ /tmp/” وجود ندارد.

علامت ستاره “*” به معنای تمامی روبات های جستجو گر می باشد.

خارج کردن فولدرهای خاص از لیست ایندکسینگ وب سایت بسته به نوع سرور و وب سایت شما متفاوت می باشد و باید با درنظر گرفتن نکات مختلفی انجام پذیرد. در هر حال از دسترس خارج کردن تمامی پوشه ها از تمامی روبات ها چندان توصیه نمی شود، زیرا با این کار سایت شما دیگر توسط روبات ها ایندکس نشده و در نتایج موتورهای جستجو نیز نمایش داده نمی شود. در ادامه برخی از نمونه کدهای مورد استفاده در فایل Robots.txt شرح داده می شود.

برای ممنوع نمودن تمامی روبات ها از کل وب سایت (یا سرور) مورد استفاده قرار می گیرد.

User-agent: *
 Disallow: /

برای فراهم شدن دسترسی تمامی روبات ها به تمامی پوشه های وب سایت

User-agent: *
 Disallow:

(برای اینکار می توانید همچنین یک فایل Robots.txt خالی تهیه کرده و یا اصلا آن را ایجاد نکنید تا در این صورت به طور پیشفرض روبات ها به تمامی وب سایت شما دسترسی داشته باشند.)

جهت خارج نمودن سه فولدر از لیست ایندکسینگ روبات ها

User-agent: *
 Disallow: /cgi-bin/
 Disallow: /tmp/
 Disallow: /junk/

برای ممنوع کردن یک روبات خاص از دسترسی به سایت

User-agent: BadBot
 Disallow: /

برای اعطای دسترسی به یک روبات خاص

User-agent: Google
 Disallow:

برای کسب اطلاعات بیشتر در مورد نام هریک از روبات های گوگل به این لینک مراجعه نمایید.

Download WordPress Themes Free
Download WordPress Themes
Download WordPress Themes Free
Free Download WordPress Themes
free download udemy course
download lava firmware
Download Premium WordPress Themes Free
online free course
برچسب: Google, Robots, SEO, سئو

مطالب پیشنهادی

اضافه نمودن وب سایت در Google Webmaster Tools

آوریل 8, 2015مدیر سایت

گوگل(Google) در مورد ما چه اطلاعاتی دارد و چگونه آن ها را مدیریت کنیم؟

دسامبر 11, 2017کارشناس محتوا

آشنایی با وردپرس

فوریه 23, 2015مدیر سایت

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

ورود به ناحیه کاربری
مرکز آموزش

تمام حقوق این سایت متعلق به ایزی هاست می باشد