it-swarm.asia

هل تتجاهل عناوين url في ملف robot.txt مع معلمات محددة؟

أرغب في أن يتجاهل google عناوين url مثل هذا:

http://www.mydomain.com/new-printers؟dir=asc&order=price&p=3

يجب تجاهل جميع عناوين url التي تحتوي على المعلمات dir والنظام والسعر ولكن ليس لدي خبرة مع Robots.txt.

اي فكرة؟

59
Luis Valencia

إليك حلولاً إذا كنت تريد عدم السماح بسلسلة الاستعلام:

Disallow: /*?*

أو إذا كنت تريد أن تكون أكثر دقة في سلسلة الاستعلام الخاصة بك:

Disallow: /*?dir=*&order=*&p=*

يمكنك أيضًا إضافة ملف robots.txt الذي يسمح عنوان url بالسماح به

Allow: /new-printer$

سوف يتأكد $ من /new-printer فقط.

مزيد من المعلومات:

http://code.google.com/web/controlcrawlindex/docs/robots_txt.html

http://sanzon.wordpress.com/2008/04/29/advanced-usage-of-robotstxt-w-querystrings/

110
Book Of Zeus

يمكنك حظر هذه المعلمات سلسلة الاستعلام المحددة مع الأسطر التالية

Disallow: /*?*dir=
Disallow: /*?*order=
Disallow: /*?*p=

لذا إذا كان أي عنوان URL يحتوي على dir= أو order= أو p= في أي مكان في سلسلة الاستعلام ، فسيتم حظره.

21
Nick Rolando

سجل موقع الويب الخاص بك باستخدام أدوات مشرفي المواقع من Google. هناك يمكنك إخبار Google بكيفية التعامل مع المعلمات الخاصة بك.

تكوين الموقع -> معلمات URL

يجب أن يكون لديك الصفحات التي تحتوي على هذه المعلمات تشير إلى أنه ينبغي استبعادها من الفهرسة عن طريق علامة التعريف الروبوت. مثلا.

3
Tony McCreath