it-swarm.asia

كيف يمكنني اكتشاف الروابط التي تشير إلى واضعي النطاق؟

أنا أعرف كيفية العثور على روابط ميتة التي تذهب إلى 404 صفحة. ومع ذلك ، في هذه الأيام ، لم تعد هناك روابط كثيرة في الواقع ، ولكن بدلاً من ذلك ينتهي بهم الأمر إلى الانتقال إلى مجموعة عشوائية. أدرك أن هذا أمر طويل القامة ، ولكن هل هناك أي طريقة لمعرفة ما إذا كان موقع الويب هو في الواقع مستقطِع نطاق فعليًا دون الذهاب فعليًا إلى كل موقع باستخدام متصفحي وفحصه لمعرفة ما إذا كانت هناك صورة لفتاة تحمل حقيبة ظهر إلخ. .؟

4
delete

طرق الكشف الممكنة للصفحات/المجالات المتوقفة:

العثور على عبارات غير المرغوب فيه

ابحث عن حالة غير حساسة للبحث عن عبارات عامة غير هامة مثل "ما تحتاجه ، عندما تحتاج إليه" و "مصدرك لأي شيء تقريبًا!".

البحث عن دعوات للشراء

ابحث عن نص مثل "الاستفسار عن هذا المجال" و "هذا النطاق قد يكون للبيع".

اختبار 404s على صفحات فرعية عشوائية

زيارة testdomain.com/randomstring. إذا حصلت على 404 ، أو كانت الصفحة نفسها تحتوي على النص "404" أو "غير موجود" ، فمن المحتمل ألا تكون متوقفة.

اختبار لعمليات إعادة التوجيه على الصفحات الفرعية العشوائية

إعادة توجيه أنظمة المجال المستضاف الأخرى testdomain.com/randomstring إلى testdomain.com.

ابحث عن اسم المجال في العلامات الوصفية

تستخدم العديد من قوالب النطاقات المتوقفة التنسيق التالي لعلامة تعريف المؤلف:

<meta name="author" content="Nameofdomain.com" />

وضعه آخرون في الوصف:

<meta name="description" content="nameofdomain.com">

في كل حالة ، يكون المجال هو فقط الشيء الموجود في سمة "المحتوى". من غير المحتمل أن يكون هذا هو الحال بالنسبة للمواقع النشطة.

ابحث عن علامة الإطارات

تستخدم بعض قوالب النطاقات المتوقفة العلامة <frameset> مع إطارات داخلية متعددة لسحب المحتوى الخارجي (غالبًا من "information.com") ، ولكنها لا تعرض شيئًا آخر على الصفحة.

استخدام اختبارات متعددة

لا يوجد واحد من هذه الاختبارات بالضرورة مؤشرات موثوقة للنطاق المستضاف بمفرده. ستضطر على الأرجح إلى الجمع بين اختبارات متعددة لإنشاء خوارزمية خاصة بك ، ثم اختبارها وصقلها استنادًا إلى مجموعة من المجالات المتوقفة المعروفة والمجالات النشطة المعروفة.

2
Nick

هناك أشياء يمكنك البحث عنها. هل العنصر المهيمن على الصفحة هو إطار iFrame؟ هل الرد هو 301/302 الذي يأخذك خارج المجال؟ (العديد من الأحياء العشوائية ببساطة 302 أو 301 أنت إلى صفحتها المقصودة). هل نسبة الارتباط/النص مرتفعة بشكل لا يصدق؟

أود أن أقول إنه صعب للغاية ، لكن هذا على الأقل بعض الخصائص المشتركة.

يبدو أن هناك أيضًا مشروع على صفحة Wikipedia linkrot يشير إلى بعض المشاريع التي تحاول القيام بذلك: http://en.wikipedia.org/wiki/Wikipedia_talk:Linkrot - التفاصيل هي سطحية على الرغم من.

0
Mark Henderson