Orphan Pages: מה הם ואיך למצוא אותם

כדי שאתר יעבוד ויוכל להציג את העמודים שהוא מכיל כך שמשתמשים יוכלו לצפות בהם, חייב להיות לו מבנה קישורים נכון שעוזר, קודם כל, למשתמשים להגיע לעמודים אלה בלחיצה אחת, וגם מבטיח שהם נסרקים על ידי הבוטים והעכבישים של גוגל כך שהם יופיעו בתוצאות החיפוש. כאשר עמוד אינו משולב במבנה הקישורים, הוא נקרא "orphan page".
אבל, מהו בדיוק orphan page? אנחנו עומדים לטפל במונח זה בפירוט, יחד עם ההשלכות שיכולות להיות לו מנקודת מבט SEO, למה זה קורה, איך למצוא סוגים אלה של עמודים, ואיך לפתור את הבעיות שהם יכולים לגרום. בואו ניגש לזה!
מהם orphan pages?
באופן ספציפי, orphan page הוא עמוד באתר ש, בעוד שהוא עשוי להיות מאונדקס או לא על ידי גוגל או מנוע חיפוש אחר, אינו מתחבר או מקשר למבנה העמודים של הפלטפורמה, והופך מבודד לחלוטין.
באופן זה, אותו עמוד הוא כאילו הוא "צף" באתר מבלי להיות נגיש למשתמשים שעשויים לבקר בו, או לבוטים של גוגל כדי להיות מוצג בתוצאת חיפוש, גם אם הוא מאונדקס. גם אם עמוד מיוצג ב-XML sitemap עם ה-URL המתאים שלו, אין ערובה ש-orphan pages לא קיימים, מכיוון שמכל סיבה או טעות אנושית, אי אפשר להגיע אליו על ידי המשתמש או על ידי סורקי מנועי החיפוש.

לדוגמה, ישנן שתי דרכים שבהן עמודים באתר מתגלים:
-
באמצעות ה-crawler שמוצא את כל העמודים על ידי מעקב אחר הקישורים ביניהם, ו
-
באמצעות רשימת ה-URLs ב-XML sitemap.
כאשר orphan page מבודד קיים, הוא כאילו בלתי נראה, גם אם הוא ב-sitemap, מכיוון שאין לו קישורים המפנים אליו, הוא לא נמצא.
זה גורם לסדרה של בעיות לגבי:
-
תנועה
-
אובדן פוטנציאל
-
בעיות SEO
-
נראות
-
סמכות, ו
-
עונשים אפשריים
...בין השאר שנדון בהם בפירוט בהמשך. כרגע, מה שברור הוא ש-orphan pages פוטנציאליים, לא משנה כמה גדול או קטן האתר, חייבים להיות מתוקנים, מה שאפשרי והוא תרגול תחזוקה נפוץ.
למה זה קורה שלאתר יש orphan pages?
ישנן מספר סיבות לכך שלאתר יש orphan pages, אפילו ללא שהבעלים או המפתח מודע לכך או יודע על זה בנקודה כלשהי. לעתים קרובות, סוגים אלה של עמודים, שאינם רצויים בפלטפורמת אינטרנט, הם בשל שינויים שנעשו בצורה גרועה, מה שבדרך כלל נגרם על ידי טעות אנוש.
להלן, אנחנו מראים את התרחישים העיקריים שבהם נוצרים או נגרמים orphan pages באתר:
-
לפעמים, הקישורים הפנימיים של עמודי אתר משתנים, מה שגורם לכך שחלק מכתובות ה-URL מוסרות מכיוון שהן כבר לא נחוצות, ישנות, או בשל אופטימיזציה של האתר. פעמים רבות, אפילו כאשר קישורים מוסרים, העמודים נשארים באתר צפים מבלי להיות מוסרים לחלוטין.
-
עמודי בדיקת A/B שהמשתמש הסופי לא בא איתם במגע, אשר, לאחר השימוש בפיתוח האתר, נשארים שם מבלי להיות מוסרים.
-
כאשר landing page נוצר זמנית כדי למשוך משתמשים להפוך ללקוחות של אתר, כגון בתקופות של מבצעים, חג המולד, או אחרים, ולאחר שהזמן הזה חלף העמוד נמחק, אבל ה-URL המאונדקס נשאר.
-
כאשר קטגוריה מוסרת מתפריט האתר, אבל לא מבוצעת הפניה מחדש נכונה לאחת אחרת שנוצרה במקומה, ומשאירה את העמוד הנותר ללא קישורים בפלטפורמה.
-
במהלך migration של אתר, נוצרים לעתים קרובות מספר רב של orphan pages שמשנים פורמט, URL ופרמטרים, אבל לא מוסרים והופכים מנותקים ומבודדים מהאתר.
-
כאשר תבנית משמשת לבניית אתר, ועמודי תבנית ברירת מחדל נשארים שאחר כך נשכחים ולא מוסרים.
מאידך, ישנן שתי סיבות נפוצות ל-orphan pages שחייבות להיות מטופלות באופן מיידי; אלה הם בעיקרם עמודים כפולים שצריכים באופן עקבי להפנות מחדש אוטומטית ל-URL יחיד. באופן ספציפי, אנחנו מדברים על שימוש עקבי ב-HTTPS וב-HTTP בעמודים קנוניים ולא קנוניים, וכן על השימוש ב-trailing slashes.
אחרת, סביר להניח שגרסאות מסוימות של העמוד אינן מקושרות וכתוצאה מכך, הופכות ליתומות. במקרה זה, העובדה שהן יתומות אינה הבעיה העיקרית אלא דווקא העובדה שהן כפולות ויגרמו לבעיות של עונש או אובדן אינדוקס, בין השאר, שמתורגמות בגוגל כתוכן מועתק או באיכות נמוכה. נטפל בזה מאוחר יותר בקטע על פתרון orphan pages.
האם orphan pages מועילים או מזיקים ל-SEO?
orphan pages מייצגים בעיה מנקודת מבט SEO, וכן לנראות, סמכות, אובדן תוכן ותנועה, בהתאם לכמות שלהם הקיימת בפלטפורמה. כלומר, פלטפורמה עם אחד, שניים או כמה orphan pages עלולה לא לגרום לכל בעיה, אבל כשהם מהווים אחוז גדול מהאתר, שם מתחילות הבעיות.
אופטימיזציה של אתר כך שלא יהיו לו orphan pages חשובה ל-SEO ובהיבטים אחרים, ולעולם לא יוכל להיאמר שהם מועילים לאתר; אלא דווקא, הם מזיקים לו כשיש יותר מדי.
ראשית, מנועי חיפוש לא יכולים למצוא orphan pages באמצעות קישורים, אז orphan pages לעתים קרובות אינם מאונדקסים ולעולם לא מופיעים בתוצאות החיפוש, ומשפיעים על התנועה, הנראות והפוטנציאל שלהם, אבל נטפל בזה בפירוט יותר מאוחר יותר בקטע משלו.
בעיות כלליות שנגרמות על ידי orphan pages
להלן כמה בעיות כלליות שנגרמות על ידי orphan pages, במיוחד כאשר הן מכסות חלק משמעותי ממבנה הקישורים והכתובות של האתר:
-
חוויית משתמש: orphan pages, באופן בלתי סביר ככל שזה נראה, משפיעים מאוד על חוויית המשתמש של אתר, מכיוון שמשתמשים אינם יכולים לבקר באופן טבעי בעמוד באמצעות תפריט או קישור עניין שלוקח אותם למה שהם מחפשים, גם אם העמוד קיים ויש לו תוכן איכותי.
-
סמכות: אם עמודים חשובים הופכים יתומים ומאבדים את הקישור שלהם לכתובות URL אחרות באתר, כל הסמכות שעשויה להיות להם מתבזבזת, וזה משפיע ישירות על הדירוג בתוצאות החיפוש של גוגל, מכיוון שזה גורם SEO חשוב באופן שבו מנוע החיפוש מסדר תוצאות עבור מילת מפתח ספציפית.
-
הקשר: הקישורים הפנימיים של אתר נותנים הקשר לסורקים של גוגל לדעת איך לאנדקס את העמוד ועבור איזה חיפושים הוא חשוב ורלוונטי. orphan pages גורמים לאתר ולעמודים עצמם לאבד הקשר ומשמעות סמנטית, במקרה שהם מאונדקסים.
עם זאת, כאשר orphan pages קיימים בכמויות גדולות, ההשפעה שלהם בולטת הרבה יותר כשמדובר בדירוג, תנועה וסריקה, אז אלו בעיות שחייבות להיות מטופלות בנפרד ובאופן נרחב יותר.
בעיה של עמוד עם נראות ותנועה נמוכה
orphan pages יש להם השפעה שלילית בולטת כשמדובר ישירות בדירוג או במיקום של האתר ושל העמוד הספציפי שמושפע, וכן בתנועה שלו. וזה מכיוון, כפי שהוזכר קודם, שעמוד יתום מבודד והופך לבלתי נראה, גם למשתמש שאינו יכול למצוא אותו באופן טבעי באתר באמצעות כפתור או קליק, וגם לסורקים של גוגל או של מנועי חיפוש אחרים.
זה ברור משפיע על התנועה של האתר והעמוד, וכן על הנראות שלו, על ידי אי קבלת משתמשים רבים וגם בשל המקום הגרוע או הלא קיים ש-orphan pages יש להם בתוצאות החיפוש. כתוצאה מכך, מתעסקים עם אובדן מוחלט של פוטנציאל לאתר ולעמוד, במיוחד אם הוא כולל תוכן איכותי על מוצרים, שירותים ונושאים אחרים. ההשפעה על התנועה והנראות גם מביאה לאובדן סמכות ורלוונטיות לאתר ביחס לנישה או לתעשייה שלו בהשוואה למתחרים.
בעיה של אובדן סריקה
גוגל כמנוע חיפוש מאנדקסת את העמודים של אתר בהתאם למה שמכונה crawl budget או Crawl Budget, שניתן לתאר כזמן שהסורקים או העכבישים של מנוע החיפוש יבזבזו במציאת עמודים לאנדקס. ככל שלאתר יש יותר עמודים, כך יידרש יותר זמן, כלומר, יותר crawl budget.
כאן האופטימיזציה של מבנה האתר, הארכיטקטורה ואלמנטים אחרים נכנסת לתמונה, כגון orphan pages. אם לאתר יש orphan pages לא רלוונטיים, הוא יצרוך באותה מידה crawl budget, שמתבזבז ויכול לגרום לכך שעמודים בעלי בריאות ותוכן טובים לא יאונדקסו, וישפיע על תוצאות החיפוש ועל התנועה. בקיצור, orphan pages מייצגים בזבוז משאבים שגוגל לא מוכנה להוציא.
הבדל בין orphan pages לעמודי Dead End
כשמדובר ב-SEO, המונח orphan page יכול להיות מבולבל עם המונח dead end page או "Dead End"**, מכיוון שהם מייצגים בעיות דומות, אבל הם לא אותו דבר. כבר הגדרנו קודם מה הם Orphan Pages, בואו נמשיך עם dead ends:
dead end page הוא עמוד שאינו מקושר לאף אחד אחר מהקישורים הפנימיים של האתר, ולא לאף פלטפורמת אינטרנט חיצונית אחרת, כלומר, ברגע שאתם נוחתים עליו, אתם לא יכולים לעשות שום דבר חוץ מלסגור אותו ולעזוב.
כאשר הסורקים של מנוע חיפוש כמו גוגל נופלים על dead end page, אין להם לאן ללכת, ומשם בא שמו, שמצייר אנלוגיה לרחוב ללא מוצא.
איך למצוא orphan pages באתר שלכם?
כדי להתחיל לפתור בעיות הקשורות ל-orphan pages או Orphan Pages, הדבר הראשון שעלינו לעשות הוא למצוא אותן, מכיוון שברור שהן לא מוצגות במבט ראשון לא כמשתמש של האתר ולא כמפתח. למרבה המזל, ניתן להשתמש בכלים שונים כגון תוכנת SEO שמנתחים את כל מבנה האתר שלנו בפירוט, ומקבלים באמצעות יומני השרת את התמונה המלאה של כולם.
אם אתם זקוקים ל-תוכנת SEO עוצמתית שעוזרת לכם לא רק לאתר orphan pages אלא גם להגביר ולשפר את אסטרטגיית ה-SEO שלכם, אל תהססו לבדוק את התוכנית שפותחה בית בידי SEO Alive!
זיהוי orphan pages עם Screaming Frog
כפי שהזכרנו, ישנן מספר תוכניות בשוק שעוזרות לכם לזהות את ה-orphan pages הללו; אנחנו עומדים להתמקד בהסבר באופן פשוט איך לעשות זאת עם אחת מהידועות ביותר, Screaming Frog.
ל-Screaming Frog יש שתי תוכניות שונות, זו הידועה ביותר לכולם, שסורקת את כל האתר ומעקבת אחר הקישורים הפנימיים שהיא מוצאת, ו-log analyser, שמנתח את יומני הגישה של השרת, כלומר, הרישומים שנשארים כאשר Googlebot (או user agent אחר) נכנס לבקר באחד מהעמודים שלנו.
עם הראשונה, אנחנו עומדים לחלץ קובץ שמרשים את סך כתובות ה-URL שה-crawler מוצא תוך כדי ניווט; זה יהיה קובץ Excel שאנחנו יכולים למצוא בקטע הדוחות תחת "all inlinks":

ובכן, ברגע שיש לנו את הקובץ הזה, אנחנו לוקחים את היומנים מהשרת שלנו, שיהיה בדרך כלל קובץ דחוס של הרישומים האמורים, ואנחנו טוענים אותו ל-log analyser של Screaming Frog, כך שכאן יהיה לנו פאנל שבו יופיעו כל כתובות ה-URL ש-Googlebot ביקרה במהלך תקופת הזמן שאנחנו טוענים, בין אם הן מקושרות או לא.
הצעד האחרון יהיה לטעון את קובץ ה-Excel מהשלב הקודם לקטע המופעל של ה-log analyser למטרה זו, ולשונית חדשה תופעל כשנעשה זאת עם האפשרויות הבאות:

-
Matched with URL data: זה יהיה הסט של כתובות URL שמקושרות פנימית ובוקרו על ידי גוגל.
-
Not in log file: אותן כתובות URL שמקושרות אבל מסיבה כלשהי לא מקבלות אירועים (ביקורים) מגוגל.
-
Not in URL data: זוהי הקבוצה שאנחנו מעוניינים בה במקרה זה; אלו כתובות URL שגוגל מבקרת בהן, ומשאירה רישום ביומנים, אבל שה-crawler לא הצליח למצוא בעת ביצוע הסימולציה, מכיוון שהן לא מקושרות פנימית, כלומר, הן ה-Orphan Pages המבוקשות שלנו.
מקבוצה שלישית זו, נחלץ את רשימת העמודים שנקטלג כיתומים, כאשר אלה שמחזירים קוד מצב 200 הם בעיקרם מטרת האופטימיזציה שלנו.
איך לפתור את בעיית orphan pages?
באופן כללי וידני, ישנם ארבעה דברים שניתן לעשות אם יש לכם כתובות URL שאינן משולבות בקישורים הפנימיים, שבהם יש לקבל החלטות מסוימות:
-
ראשית, אם לאחר migration ישנם orphan pages, כפי שסביר שיהיה, והם נסקרים ורבים מהם יש להם תוכן מעט רלוונטי, ללא תוכן או כפול, הדבר הטוב ביותר לעשות הוא למחוק אותם ובמקום המתאים, להוסיף הפניה מחדש 301 לעמודים דומים או מובלטים באתר עם יותר סמכות.
-
שנית, אם מסיבה כלשהי אתם רוצים לשמור על orphan page בשל תוכן טוב, סמכות ותנועה, הצעד הבא הוא לקשר אליו מ-URL אתר שיש לו תוכן קשור, וזה קל להגיע אליו על ידי משתמשים ועל ידי גוגל. כמובן, יש לציין שה-URL של העמוד חייב להיכלל ב-sitemap.
-
שלישית, אם מופיעים orphan pages רבים אבל הטבע שלהם זמני והתוכן שלהם כבר פג תוקף מכיוון שהוא כלל מבצעים ותוכן הקשור לזמן מסוים, בואו נעשה את אותו הדבר כמו בשלב הקודם ונקשר את העמוד לאחר פנימי עם רלוונטיות ושנגיש. עם זאת, במקרה זה אנחנו עושים זאת כך שאותו URL לא יאונדקס על ידי הכללת תג meta "noindex" כדי שהוא לא יילקח בחשבון על ידי הסורקים.
-
לבסוף, במקרה של orphan pages עם תוכן כפול או כמעט כפול, יהיה כדאי לשקול למחוק את העמוד הזה ולהכליל את התוכן באחר כדי לא לאבד אותו ולהמשיך למנף את הפוטנציאל הכללי שלו.
מסקנה
orphan pages הם אלמנט טבעי שיופיע באתר מסיבות שונות, וכאשר הם לא מוגזמים או הכמות שלהם לא גדלה באופן אקספוננציאלי, הם לא מייצגים שום בעיה.
מאידך, כאשר אחוז גדול מאתר ומהקישורים הפנימיים שלו מורכב מעמודים מסוג זה, זה יכול לייצר בעיות רבות לגבי סריקה, דירוג ותנועה הקשורות ל-SEO, וכן סמכות, חוויית משתמש ובעיות אחרות שצריכות להיות מטופלות.
החדשות הטובות הן ש-orphan pages ניתנים לפתרון בדרכים שונות, אבל תמיד בתהליך של ניתוח, מה שאתם צריכים לשאול את עצמכם הוא אם כל orphan page ספציפי רלוונטי לדירוג, לתוכן וניתן לקישור לאחר, וכאשר זה לא המצב, פשוט מחקו אותם.
ואתם, קוראים יקרים... האם ידעתם על קיומם של orphan pages? האם נתקלתם באלמנט הזה באחד הפרויקטים שלכם או של הלקוחות שלכם? השאירו לנו תגובה ואנחנו נחזור אליכם בנושא. תודה רבה ולהתראות בפעם הבאה!
מאת: David Kaufmann

במהלך 10+ השנים האחרונות הייתי מרותק לחלוטין ל-SEO — ולמען האמת, לא הייתי רוצה את זה אחרת.
הקריירה שלי עלתה לרמה חדשה כשעבדתי כמומחה SEO בכיר ב-Chess.com — אחד מ-100 האתרים המבוקרים ביותר באינטרנט. עבודה בקנה מידה כזה לימדה אותי מה ששום קורס או תעודה לא יכלו ללמד.
מהניסיון הזה הקמתי את SEO Alive — סוכנות למותגים שרציניים לגבי צמיחה אורגנית. ומכיוון שלא מצאתי כלי שמטפל גם בעולם הקלאסי וגם בעידן ה-AI כראוי, בניתי את SEOcrawl. אם אתה מחפש שותף SEO מנוסה שאוהב את התחום — אשמח לשמוע ממך!
גלה תוכן נוסף של מחבר זה

