كيف تجد sitemap موقع ويب

العثور على sitemap لأي موقع ويب مهمة سهلة نسبيًا، وسنساعدك على إنجاز هذه المهمة. سنبدأ بصيغة sitemap الأكثر شيوعًا، XML، ثم نتطرق إلى صيغ أخرى. لنبدأ بالأساسيات.
ما هو sitemap؟
XML sitemap هو قائمة صفحات الموقع، أُنشئت لمساعدة محركات البحث المختلفة. يقدم معلومات مهمة عن URLs الموقع، شاملةً الصفحات، الفيديوهات، الصور، الملفات، والعلاقات بينها. إلى جانب الصفحات، يحتوي XML sitemap على metadata إضافية عن كل URL:
- تاريخ آخر تحديث - تكرار التغيير - الأولوية مقارنة بالصفحات الأخرى.
فيما يخص أفضل ممارسات SEO، يجب تحسين الـ sitemap بحيث يحتوي فقط على محتوى قابل للفهرسة وعالي الجودة. الصفحات المكسورة (404)، التي تُعيد توجيهًا أو المكررة داخله قد تربك محركات البحث.
الـ sitemap أشبه بـ نظرة عامة على الموقع. يُكوَّن بصيغة code وعادةً يبدو هكذا:

أو هكذا:

لماذا تحتاج إلى العثور على sitemap؟
لقد تناولنا أساسيات الـ sitemap وغرضه الرئيسي. والآن لنرَ الأسباب التي قد تدفعك للبحث عن هذا الملف ابتداءً.
كما ناقشنا أعلاه، الـ sitemap طريقة بسيطة لا غنى عنها لإخبار محركات البحث وخصوصًا crawlers (مثل Googlebot) عن المحتوى المهم في موقعنا.
أولًا، قد ترغب في التحقق من وجود XML sitemap. إن وجد، الخطوة التالية هي فحصه والتأكد من أنه مُنشأ بشكل صحيح ويحتوي على المعلومات الصحيحة.
أخيرًا، إن لم يكن هناك sitemap، فقد ترغب في إنشاء واحد وإرساله إلى محركات البحث. ضع في الاعتبار أن XML sitemap ليس إلزاميًا أبدًا. لكنه يساعد crawlers البحث على العثور على المواقع والصفحات الجديدة وفهرستها وترتيبها في النهاية بشكل أسرع.
والآن حان الوقت للتعمق في عمل المحقق وإيجاد ذلك الـ sitemap!
هل أنت جاهز؟ لنبدأ!
طرق بسيطة للعثور على sitemap
لنبدأ الرحلة بـ أسهل الطرق للعثور على sitemap موقع ويب.
1) التحقق يدويًا من المواقع الشائعة لـ XML sitemap
من أكثر الطرق شيوعًا وبساطة للعثور على XML sitemap موقع هو التحقق يدويًا من بعض المواقع الشائعة. الأمر بسيط جدًا، يكفي إدخال URL الموقع في المتصفح ثم تجربة بضعة تنويعات. سنريك:
هذا أكثر المواقع شيوعًا، لكنه ليس الوحيد. لذلك إن لم يحالفك الحظ في المحاولة الأولى، إليك بضع فحوصات سريعة أخرى لتجربتها:
- /sitemap_index.xml (في حال كان الموقع لديه أكثر من sitemap، يكون index لكل الـ sitemaps).
هذه حالة XML sitemap الخاصة بهذه المدوّنة. سنريك:

ويبدو هكذا:

أساسًا، هذه كل الـ sitemaps المنفصلة المُقسَّمة حسب أنواع المنشورات الموجودة فيها.
والآن إن لم يحالفك الحظ بعد، لنجرب المزيد من الخيارات:
- /sitemap-index.xml - /sitemap.php - /sitemap.txt - /sitemap.xml.gz - /sitemap/ - /sitemap/sitemap.xml - /sitemapindex.xml - /sitemap/index.xml - /sitemap1.xml
ملاحظة: ملف XML هو طريقة واحدة فقط لوصف الـ sitemap. هناك أيضًا صيغتا RSS و Atom.
لذلك علينا إضافة بضعة مواقع sitemap محتملة:
- /rss/ - /rss.xml - /atom.xml
سنتحدث عنها أكثر لاحقًا.
للتأكيد، ضع اسم domain موقعك قبل "/" عند تجربة البدائل المختلفة.
2) التحقق من ملف Robots.txt
إن كنت لا تزال معنا، فهذا يعني أنك لم تنجح في إيجاد الملف الذي هو الهدف الرئيسي للمقال، أو أنك ببساطة فضولي وشغوف بتعلم المزيد.
في الحقيقة، أيًا كان السبب الدقيق، لدينا أخبار جيدة - سنواصل الرحلة بـ نصيحة أخرى بسيطة جدًا.
ملف Robots.txt ملف خاص معروف لمختصي SEO (والمبرمجين)، يقدم توجيهات مفيدة لـ crawlers محركات البحث. علاوة على ذلك، هو أيضًا مكان شائع جدًا للعثور على رابط sitemap الموقع.
الفكرة أنه بما أن محركات البحث تزور هذه ملفات robots.txt، يكون منطقيًا تمامًا إضافة رابط الـ sitemap هناك. بهذه الطريقة، سيكون من الأسهل اكتشافه و crawl الموقع.
هل أنت مستعد لخبر جيد آخر؟! إليك - للوصول إلى ملف robots.txt لأي موقع، أضف /robots.txt بعد اسم الـ domain في المتصفح ثم اضغط "Enter". مماثل للخطوة السابقة عندما كنا نضيف مسارات sitemap محتملة مختلفة.
ما الأفضل من مثال واقعي؟ انظر إلى عنوان URL لملف robots.txt الخاص بنا:
https://seocrawl.com/robots.txt
ملف صغير لكنه بسيط ومفيد بميزات مهمة. إن كنت قد فتحته بالفعل، يمكنك على الفور تقريبًا رؤية الجوهرة الصغيرة التي تبحث عنها، ملف الـ sitemap:

تادا! وعدناك بأنه سيكون سهلًا :)
3) التحقق في Google Search Console
حسنًا، الـ sitemap لا يزال غير مُكتشَف؟ لا مشكلة! لدينا المزيد من النصائح لمساعدتك على إيجاد الطريق.
سنريك طريقة سهلة وسريعة أخرى.
Google Search Console (في الماضي، عُرفت أيضًا بـ Webmaster Tools) مكان آخر يمكن إيجاد المسار الذي نبحث عنه فيه. بالطبع، لذلك يجب أن تكون مالك الموقع أو أن يُمنح لك وصول.
إن استوفيت أيًا من هذه المعايير، الخطوة التالية هي تسجيل الدخول إلى GSC واختيار Sitemaps من القائمة اليسرى:

والآن إن أُرسِلت الـ sitemap (أو الـ sitemaps) من قبل أحد سابقًا، يمكنك رؤيتها فورًا:

إلى جانب URL الدقيق للـ sitemap، توجد معلومات إضافية مثل نوع الـ sitemap (ملف index يحتوي على sitemaps أخرى أو sitemap عادي يحتوي على صفحات الموقع)، وقت الإرسال، آخر قراءة، الحالة، وعدد URLs الموجودة فيه.
نصيحة: إن كنت جادًا في SEO وتريد تحسين الأداء العضوي للموقع، فإن Google Search Console أداة أساسية. الرؤى التي يمكنك الحصول عليها منه لا تُحصى.
وكمكافأة إضافية، إن كان لديك GSC يمكنك تجربة أداتنا القوية - SEOcrawl
4) التحقق في Bing Webmaster Tools
الخبر الجيد هو أن Bing Webmaster Tools يعمل تقريبًا بنفس طريقة Google Search Console. ليس مفاجئًا أن الأخير كان يُسمى Google Webmaster Tools، فلديهما الكثير من القواسم المشتركة.
مرة أخرى، سجّل الدخول ثم اذهب إلى الشريط الجانبي الأيسر، حيث يوجد قسم "Sitemaps".

عند النقر، إن كانت الـ sitemap قد أُرسِلت بالفعل، يمكنك رؤية المزيد من التفاصيل.

طرق متقدمة للعثور على sitemap
إن كنت لا تزال معنا، فهذا يعني إما أنك لا تزال تبحث عن مكان ملف الـ sitemap الثمين، أو أنك شجاع جدًا وتريد دخول القسم المتقدم. في كلتا الحالتين، نهنئك على وصولك إلى هنا ونتمنى لك التوفيق :)
نعدك بأن الأمر لن يكون معقدًا أو مخيفًا! لنبدأ!
5) استخدام Google search operators
Google search operators (وتُسمى أيضًا الأوامر) قد تكون قوية جدًا لأهداف SEO مختلفة (مثل العثور على فرص linkbuilding، أفكار محتوى، اكتشاف مشكلات تقنية وغيرها). لكن في هذه الحالة، سنستخدمها للعثور على XML sitemap الموقع المُفحَص.
لذلك علينا الاستفادة من أمر "filetype:". قد يكون مفيدًا فعلًا عند دمجه مع أمر "site:". أساسًا، الجمع بين الأمرين سيبحث فقط عن نوع ملف معين في الموقع الذي نريد.
مثال: site:chess.com filetype:xml
والنتائج التي ستجلبها هذه العملية في Google ستكون التالية:

ها هي! تعرض Google جميع الـ sitemaps المُفهرسة ويمكنك رؤية المزيد من التفاصيل.
في حال ظهرت نتائج غير ذات صلة، يمكنك جعل البحث أكثر تحديدًا. هذه المرة سنضيف operator "inurl" إلى ترسانتنا.
على سبيل المثال: site:uefa.com filetype:xml inurl:sitemap

ملاحظة: كما ذكرنا أعلاه، يمكن أن يكون الـ sitemap ملفًا نصيًا أيضًا. للعثور عليه، يمكن إجراء بحث مماثل بامتداد آخر.
على سبيل المثال: site:WebsiteURL inurl:sitemap filetype:txt
وهذا يأتي بنتائج كهذه:

نصيحة: ستكشف هذه الأوامر مكان الـ sitemap فقط إن كان مُفهرسًا في Google. بعض إضافات WP التي تنشئ الـ sitemap تلقائيًا تضيف وسوم no follow, no index للـ sitemap. لذلك إن لم تجد نتائج، لا تقلق!
نواصل بأفكار جديدة.

6) استخدام أدوات على الإنترنت
تقنية أخرى هي تجربة أدوات على الإنترنت مثل SEO Site Checkup. يكفي لصق URL الموقع والضغط على Checkup. ستحصل على نتيجة كهذه: ملاحظة: تعمل هذه الأداة بفحص المواقع المعتادة للـ sitemap التي ذكرناها سابقًا (sitemap.xml, sitemap1.xml, sitemapindex.xml إلخ.). لذلك في حالات أخرى محددة، قد لا تجد الموقع.
7) التحقق من CMS الموقع
اعتمادًا على نظام إدارة المحتوى (CMS) الذي يعمل عليه الموقع، قد يكون XML sitemap في مواقع مختلفة. الخبر الجيد هو أن أشهر CMS لديها مواقع افتراضية يمكنك بدء البحث منها.
أولًا، علينا تحديد CMS الموقع. عملية بسيطة جدًا ويمكن استخدام أدوات على الإنترنت أو إضافات للمتصفح.
على سبيل المثال، أحد الإضافات المفيدة هو Built With الذي يحدد CMS وكذلك المزيد من البرامج والتطبيقات التي يستخدمها الموقع. هكذا يعرض المعلومة التي تبحث عنها:

إن فضّلت أداة على الإنترنت، أحد الحلول الممكنة هو WhatCMS:

البديل هو CMS Detect:

والآن وقد عرفنا الـ CMS الدقيق، لنرَ بعضًا من أكثر أنظمة إدارة المحتوى شيوعًا والمواقع التي تحتفظ فيها بملف XML عادةً.
Wordpress
قبل 2020، كانت الـ sitemaps تُولَّد عادةً عبر إضافات. لكن الآن، مع ميزة WP المدمجة، يجب أن يكون في /wp-sitemap.xml.
ومع ذلك، إن استخدم الموقع المُفحَص إضافة لتوليد الـ sitemap، يمكن تجربة بعض المواقع التالية:
- /sitemap.xml - /tag-sitemap.xml - /sitemap_index/xml - /category-sitemap.xml
أو يمكن التحقق من إعدادات الإضافة وإيجاد المسار من هناك.
Wix, Shopify, Joomla, Squarespace, Magento
الخبر الجيد هو أن هذه كلها تولّد XML sitemap تلقائيًا للمستخدم. لذلك الموقع الافتراضي (إن لم يُعدَّل) هو: /sitemap.xml
لاحظ أن اسم الـ domain يأتي قبل جزء "/".
مكافأة: Bookmarklet للبحث الفوري عن Sitemap.xml
إن كنت من محبي الإنتاجية وتوفير الوقت في كل مهمة صغيرة (وأي منا في SEO ليس كذلك؟!)، يمكنك إيجاد bookmarklet سريع مفيد للتحقق فورًا من XML sitemap موقع.
يكفي إضافة هذا الكود javascript:
javascript:void(location.href='http://' + location.host + '/sitemap.xml')
اضعه في bookmark، وفي كل مرة تنقر عليه، سيُفتح ملف الـ sitemap إن كان في الموقع الافتراضي /sitemap.xml.
سريع وسهل!
العثور على أنواع أخرى من sitemap
لقد تحدثنا أساسًا عن XML sitemap لأنه الصيغة الأكثر شيوعًا التي تُظهر لـ crawlers ما يحدث في الـ domain. لكن يستحق ذكر الأنواع الأخرى التي قد تجدها في بعض المواقع.
- HTML. عادةً تُنشأ لراحة المستخدم وهي مفيدة جدًا، خصوصًا للمواقع الكبيرة.
على سبيل المثال، تقدم Ebay للزوار "خريطة" افتراضية بصفحاتها الرئيسية وفئاتها: https://pages.ebay.com/sitemap.html

-
RSS. في بعض الحالات، تستخدم المواقع feeds RSS كـ sitemap وتقع عادةً في: /rss/ أو /rss.xml.
-
Atom. الأمر ذاته مع feeds Atom وتُوجَد عادةً هكذا: /atom.xml - TXT. ملف نصي قياسي، وسبق أن ناقشنا أحد هذه الأمثلة. الموقع: /sitemap.txt
لا يوجد sitemap؟ ماذا أفعل في هذه الحالة؟
بعد استعراض الخيارات المختلفة للعثور على الـ sitemap، من الجيد قول كلمة عما يجب فعله في حال لم يكن قد أُنشئ بعد. هذا حال معظم المواقع الجديدة التي على الإنترنت لفترة قصيرة. أو المواقع الصغيرة جدًا.
كذلك، ضع في الاعتبار أنه ليست كل المواقع تحتاج إلى sitemap. إن كان موقعك يحتوي على بضع صفحات فقط، فستكون بخير دون sitemap.
ومع ذلك، إن أردت إنشاء XML sitemap، يكفي استخدام إضافة متوافقة مع نظام CMS الخاص بك. بعض الأمثلة الجيدة لـ WP:
- Rank Math Sitemap Plugin - WP Sitemap Plugin - Google XML Sitemaps - WordPress SEO by Yoast
أو يمكن إنشاء الـ sitemap يدويًا، أو استخدام crawler يستعرض الموقع ويصدّر sitemap ليُرفع.
للتلخيص:
نأمل أن تكون هذه النصائح قد ساعدتك على التعمق أكثر في عالم الـ sitemaps، وأنك أصبحت الآن أكثر ألفة بـ كيف تعمل، لماذا نحتاجها... وبالطبع كيف نجدها.
إن كنت تريد معرفة شيء آخر، أو ببساطة تريد مشاركة تجاربك، أخبرنا في التعليقات :)
حظًا موفقًا!
بقلم: Ognian Mikov

دخل SEO حياتي عام 2012، ومنذ ذلك الحين أعيشه باهتمامٍ كامل. SEO بالنسبة لي أكثر من مجرّد عمل — هو شغف وهواية تُحفِّزني للتعلّم والتطوّر باستمرار. سواء كنت أبحث في موضوع جديد، أو أُنشئ محتوى، أو أتعمّق في إصلاحات تقنية، فإنّ العالم الواسع للتسويق الرقمي والفرص اللانهائية لرفع أداء المواقع تُذهلني دائمًا.
أحمل بكالوريوس في التسويق وماجستير في العلاقات العامة والإعلان. في وقت فراغي، أحبّ قضاء الوقت مع ابنتي ولعب أو مشاهدة الشطرنج وكرة القدم (Само Левски و Més que un club) والبوكر.
اكتشف المزيد من محتوى هذا الكاتب

