التكرار المحتمل:
ما هو المحتوى المكرر وكيف يمكنني تجنب التعرض للعقاب بسبب ذلك على موقعي؟
قرأت أنه يجب علي استخدام علامة NoIndex
للصفحات الانتقالية مثل الفهرس أو ترقيم الصفحات أو صفحات العلامات. هل هذا صحيح؟ لديّ Tumblr blog التي أفكر في وضع NoIndex
عليها في الفهرس والبحث وعلامة ترقيم الصفحات وصفحات التاريخ.
هل NoIndex
يكفي أم أن هناك طرق أخرى؟ هل يجب وضع علامة على صفحة فهرس الموقع باعتبارها NoFollow
؟ هذا لا يبدو حقا جيدة جدا.
ما الصفحات التي ستضعها NoIndex
؟
إذا كانت عناوين URL للصفحات المتعددة تنتج نفس المحتوى ، فهذا بالضبط ما <link rel="canonical">
هو. إنه لإخبار محركات البحث أن محتوى عناوين URL المتعددة هو نفسه واستخدام هذا المعين كمحتوى أساسي. أن يتجنب الازدواجية القضايا تماما وبسيطة جدا القيام به.
لا ، يجب ألا توقف محركات البحث عن فهرسة الصفحات أو صفحات العلامات. (و بالتأكيد لا صفحة الفهرس الخاصة بك!) بالنسبة للمدونات أو المواقع التي لا تحتوي على بنية قائمة واضحة ، هذه هي الطريقة الرئيسية للعثور على المحتوى الخاص بك.
في أكثر الأحيان ، يمكن لمحركات البحث أن تعمل على حل هذه الصفحات على ما يرام ، واكتشاف المحتوى الأكثر أهمية لديك ، مثل إدخالات المدونة نفسها.
ومع ذلك ، إذا كنت تلاحظ فهرسة صفحات القائمة هذه أكثر من منشورات المدونة ، فإنني أوصي بحظر فهرسة "التكوينات غير المحدودة" ، على سبيل المثال الفرز حسب الشعبية. أو أي شيء حيث يتم سرد العناصر نفسها في أوامر مختلفة - السماح بفهرسة ترتيب واحد معقول وتجاهل الباقي.
لا يوجد شيء يمكن أن يمنع كل روبوت من تصفح أي صفحة على موقعك ، إلا إذا تم تم منعه قسراً.
ومع ذلك ، يمكنك دائمًا تشجيع الروبوت لمتابعة وفهرسة ما تريد/لا تريد. بعض هذه الطرق تشمل:
robots.txt
ووضعه في الدليل الجذر.response header
بشكل صحيح لكل مورد.sitemap.xml
مستند مع فقط الصفحات التي تريد أن يكون spوبة.$_GET
المتغيرات في URL ، إلا إذا كان ينشئ بيانات فريدة بالفعل. (مثل www.abc.com/index.php?session=21389271893219
استخدم $_POST
لهذا بدلاً من ذلك.404 NOT FOUND
إلى تلك الصفحات و 200
أو إعادة التوجيه إلى المستخدمين المباشرين. (301
s قابلة للنقاش)هناك المزيد ، ولكن هذا يعمل من أجل 99٪ من كل شيء. الحيلة هي جيدة تصميم دليل URL الأولي.