it-swarm.asia

SEO: محتوى مكرر ناتج عن صفحات ترقيم الصفحات / علامة / فهرس

التكرار المحتمل:
ما هو المحتوى المكرر وكيف يمكنني تجنب التعرض للعقاب بسبب ذلك على موقعي؟

قرأت أنه يجب علي استخدام علامة NoIndex للصفحات الانتقالية مثل الفهرس أو ترقيم الصفحات أو صفحات العلامات. هل هذا صحيح؟ لديّ Tumblr blog التي أفكر في وضع NoIndex عليها في الفهرس والبحث وعلامة ترقيم الصفحات وصفحات التاريخ.

هل NoIndex يكفي أم أن هناك طرق أخرى؟ هل يجب وضع علامة على صفحة فهرس الموقع باعتبارها NoFollow؟ هذا لا يبدو حقا جيدة جدا.

ما الصفحات التي ستضعها NoIndex؟

3
Jiew Meng

إذا كانت عناوين URL للصفحات المتعددة تنتج نفس المحتوى ، فهذا بالضبط ما <link rel="canonical"> هو. إنه لإخبار محركات البحث أن محتوى عناوين URL المتعددة هو نفسه واستخدام هذا المعين كمحتوى أساسي. أن يتجنب الازدواجية القضايا تماما وبسيطة جدا القيام به.

3
John Conde

لا ، يجب ألا توقف محركات البحث عن فهرسة الصفحات أو صفحات العلامات. (و بالتأكيد لا صفحة الفهرس الخاصة بك!) بالنسبة للمدونات أو المواقع التي لا تحتوي على بنية قائمة واضحة ، هذه هي الطريقة الرئيسية للعثور على المحتوى الخاص بك.

في أكثر الأحيان ، يمكن لمحركات البحث أن تعمل على حل هذه الصفحات على ما يرام ، واكتشاف المحتوى الأكثر أهمية لديك ، مثل إدخالات المدونة نفسها.

ومع ذلك ، إذا كنت تلاحظ فهرسة صفحات القائمة هذه أكثر من منشورات المدونة ، فإنني أوصي بحظر فهرسة "التكوينات غير المحدودة" ، على سبيل المثال الفرز حسب الشعبية. أو أي شيء حيث يتم سرد العناصر نفسها في أوامر مختلفة - السماح بفهرسة ترتيب واحد معقول وتجاهل الباقي.

2
DisgruntledGoat

لا يوجد شيء يمكن أن يمنع كل روبوت من تصفح أي صفحة على موقعك ، إلا إذا تم تم منعه قسراً.

ومع ذلك ، يمكنك دائمًا تشجيع الروبوت لمتابعة وفهرسة ما تريد/لا تريد. بعض هذه الطرق تشمل:

  • إنشاء ملف robots.txt ووضعه في الدليل الجذر.
  • تعيين كل خيارات ذاكرة التخزين المؤقت response header بشكل صحيح لكل مورد.
  • إنشاء sitemap.xml مستند مع فقط الصفحات التي تريد أن يكون spوبة.
  • الرسملة المتسقة. وجود كل شيء صغير عدة مرات سيمنع الخداع التي تنطوي على العلوي/الصغير.
  • تجنب تمرير $_GET المتغيرات في URL ، إلا إذا كان ينشئ بيانات فريدة بالفعل. (مثل www.abc.com/index.php?session=21389271893219 استخدم $_POST لهذا بدلاً من ذلك.
  • لا وجود محتوى مكرر. (جرب mod_rewrite و/أو إعادة التوجيه لمنع ذلك)
  • استخدام اكتشاف bot لإرسال 404 NOT FOUND إلى تلك الصفحات و 200 أو إعادة التوجيه إلى المستخدمين المباشرين. (301s قابلة للنقاش)
  • استخدام أدوات مشرفي المواقع من Google لمنع عرض الصفحات في نتائج البحث. (على الرغم من أن هذا عادة ما يكون الحل الأخير).
  • تجنب عناوين URL المشفرة/المشفرة UTF-8 ، ستقوم بتجميعها.
  • استخدم الإدارة المناسبة للجلسة لمنع الوصول إلى المعلومات الآمنة مباشرة.

هناك المزيد ، ولكن هذا يعمل من أجل 99٪ من كل شيء. الحيلة هي جيدة تصميم دليل URL الأولي.

1
Talvi Watia