Orphan Pages: คืออะไรและค้นหาอย่างไร

เพื่อให้เว็บไซต์ทำงานและสามารถแสดงหน้าที่มีอยู่ให้ผู้ใช้ดูได้ ต้องมีโครงสร้างการเชื่อมโยงที่เหมาะสม ที่ช่วย ก่อนอื่น ผู้ใช้ในการเข้าถึงหน้าเหล่านั้นด้วยการคลิกครั้งเดียว และยังรับประกันว่าจะถูกรวบรวมข้อมูลโดยบอตและสไปเดอร์ของ Google เพื่อให้ปรากฏในผลการค้นหา เมื่อหน้าไม่ถูกรวมเข้ากับโครงสร้างลิงก์ จะเรียกว่า "orphan page"
แต่ orphan page คืออะไรกันแน่? เราจะกล่าวถึงคำนี้อย่างละเอียด พร้อมกับผลกระทบที่อาจมีจากมุมมอง SEO ทำไมจึงเกิด ค้นหาหน้าประเภทนี้อย่างไร และจะแก้ไขปัญหาที่อาจเกิดอย่างไร มาเริ่มกันเลย!
orphan pages คืออะไร?
โดยเฉพาะ orphan page เป็นหน้าบนเว็บไซต์ที่แม้จะถูกหรือไม่ถูกจัดทำดัชนีโดย Google หรือเครื่องมือค้นหาอื่น แต่ไม่เชื่อมต่อหรือเชื่อมโยงกับโครงสร้างหน้าของแพลตฟอร์ม กลายเป็นแยกตัวอย่างสมบูรณ์
ในวิธีนี้ หน้านั้น เหมือนกับ "ลอย" บนเว็บไซต์โดยไม่สามารถเข้าถึงได้โดยผู้ใช้ที่อาจเยี่ยมชม หรือโดยบอตของ Google เพื่อแสดงในผลการค้นหา แม้ว่าจะถูกจัดทำดัชนีก็ตาม แม้ว่าหน้าจะแสดงใน XML sitemap พร้อม URL ที่สอดคล้อง ก็ไม่มีการรับประกันว่าไม่มี orphan pages เพราะด้วยเหตุผลใดหรือข้อผิดพลาดของมนุษย์ มันไม่สามารถเข้าถึงได้โดยผู้ใช้หรือ crawlers ของเครื่องมือค้นหา

ตัวอย่างเช่น มีสองวิธีที่หน้าเว็บถูกค้นพบบนเว็บไซต์:
-
ผ่าน crawler ที่ค้นหาทุกหน้าโดยติดตามลิงก์ระหว่างกัน และ
-
ผ่านรายการ URL ใน XML sitemap
เมื่อมี orphan page แยกตัว มันเหมือนกับว่ามองไม่เห็น แม้ว่าจะอยู่ใน sitemap เพราะเนื่องจากไม่มีลิงก์ที่ชี้มา จึงไม่ถูกค้นพบ
สิ่งนี้นำมาซึ่งปัญหาชุดหนึ่งเกี่ยวกับ:
-
ผู้เข้าชม
-
การสูญเสียศักยภาพ
-
ปัญหา SEO
-
การมองเห็น
-
อำนาจ และ
-
การลงโทษที่อาจเกิดขึ้น
...และอื่นๆ ที่เราจะกล่าวถึงในรายละเอียดในภายหลัง สำหรับตอนนี้ สิ่งที่ชัดเจนคือ orphan pages ที่อาจมี ไม่ว่าเว็บไซต์จะใหญ่หรือเล็กเพียงใด ต้องได้รับการแก้ไข ซึ่งเป็นไปได้และเป็นการบำรุงรักษาทั่วไป
ทำไมเว็บไซต์จึงมี orphan pages?
มีหลายเหตุผลที่เว็บไซต์มี orphan pages แม้ว่าเจ้าของหรือผู้พัฒนาจะไม่รับรู้หรือไม่รู้ในช่วงเวลาใด บ่อยครั้ง หน้าประเภทนี้ ซึ่งไม่พึงประสงค์บนแพลตฟอร์มเว็บ เกิดจากการเปลี่ยนแปลงที่ทำได้ไม่ดี ซึ่งโดยปกติเกิดจากข้อผิดพลาดของมนุษย์
ด้านล่าง เราแสดง สถานการณ์หลัก ที่ orphan pages ถูกสร้างหรือเกิดขึ้นบนเว็บไซต์:
-
บางครั้ง การเชื่อมโยงภายในของหน้าเว็บไซต์ถูกเปลี่ยน ซึ่งทำให้บาง URL ถูกลบเพราะไม่จำเป็นอีกต่อไป เก่า หรือเนื่องจากการปรับให้เหมาะสมของเว็บไซต์ หลายครั้ง แม้เมื่อลิงก์ถูกลบ หน้ายังคงอยู่บนเว็บไซต์ลอยโดยไม่ถูกลบสมบูรณ์
-
หน้า A/B test ที่ผู้ใช้ปลายทางไม่ได้สัมผัส ซึ่งหลังจากใช้ในการพัฒนาเว็บไซต์ ยังคงอยู่ที่นั่นโดยไม่ถูกลบ
-
เมื่อ landing page ถูกสร้างชั่วคราว เพื่อดึงดูดผู้ใช้ให้กลายเป็นลูกค้าของเว็บไซต์ เช่นในช่วงโปรโมชั่น คริสต์มาส หรืออื่นๆ และหลังจากเวลานั้นผ่านไป หน้าถูกลบ แต่ URL ที่จัดทำดัชนียังคงอยู่
-
เมื่อ หมวดหมู่ถูกลบจากเมนูเว็บไซต์ แต่ ไม่ถูกเปลี่ยนเส้นทาง อย่างเหมาะสมไปยังอันใหม่ที่สร้างแทน ทิ้งหน้าที่เหลือโดยไม่มีลิงก์บนแพลตฟอร์ม
-
ในระหว่าง การย้ายเว็บไซต์ มักสร้าง orphan pages จำนวนมากที่เปลี่ยนรูปแบบ URL และพารามิเตอร์ แต่ไม่ถูกลบและขาดการเชื่อมต่อและแยกตัวจากเว็บไซต์
-
เมื่อ เทมเพลตถูกใช้ในการสร้างเว็บไซต์ และหน้าเทมเพลตเริ่มต้นถูกทิ้งไว้ ซึ่งภายหลังถูกลืมและไม่ถูกลบ
ในทางกลับกัน มีสาเหตุทั่วไปสองอย่างของ orphan pages ที่ต้องแก้ไขและจัดการทันที ซึ่งโดยพื้นฐานเป็น หน้าซ้ำ ที่ควรเปลี่ยนเส้นทางอัตโนมัติไปยัง URL เดียวอย่างสม่ำเสมอ โดยเฉพาะ เรากำลังพูดถึงการใช้ HTTPS และ HTTP อย่างสม่ำเสมอบนหน้า canonical และ non-canonical ตลอดจนการใช้ trailing slashes
มิฉะนั้น เป็นไปได้ว่าบางเวอร์ชันของหน้าไม่ถูกเชื่อมโยง และเป็นผลให้กลายเป็น orphans ในกรณีนี้ ความจริงที่ว่ามันเป็น orphans ไม่ใช่ปัญหาหลัก แต่เป็นข้อเท็จจริงที่ว่ามันเป็นซ้ำและจะทำให้เกิดปัญหาการลงโทษหรือการสูญเสียดัชนี รวมถึงอื่นๆ ซึ่งใน Google แปลเป็นเนื้อหาที่คัดลอกหรือคุณภาพต่ำ เราจะกล่าวถึงสิ่งนี้ในส่วนการแก้ไข orphan pages
orphan pages เป็นประโยชน์หรือเป็นโทษต่อ SEO?
orphan pages เป็นปัญหาจากมุมมอง SEO เช่นเดียวกับการมองเห็น อำนาจ การสูญเสียเนื้อหา และผู้เข้าชม ขึ้นอยู่กับจำนวนที่มีอยู่บนแพลตฟอร์ม นั่นคือ การที่แพลตฟอร์มมีหนึ่ง สอง หรือ orphan pages ไม่กี่หน้าอาจไม่ทำให้เกิดปัญหา แต่เมื่อพวกมันคิดเป็นเปอร์เซ็นต์ใหญ่ของเว็บไซต์ นั่นคือที่ปัญหาเริ่ม
การปรับเว็บไซต์ให้ไม่มี orphan pages เป็นสิ่งสำคัญสำหรับ SEO และในด้านอื่นๆ และไม่สามารถพูดได้ว่ามันเป็นประโยชน์ต่อเว็บไซต์ แต่เป็นโทษเมื่อมีมากเกินไป
อันดับแรก เครื่องมือค้นหาไม่สามารถค้นหา orphan pages ผ่านลิงก์ได้ ดังนั้น orphan pages มักไม่ถูกจัดทำดัชนีและไม่ปรากฏในผลการค้นหา ส่งผลต่อผู้เข้าชม การมองเห็น และศักยภาพ แต่เราจะกล่าวถึงรายละเอียดในส่วนของตัวเอง
ปัญหาทั่วไปที่เกิดจาก orphan pages
ด้านล่างคือปัญหาทั่วไปบางอย่างที่เกิดจาก orphan pages โดยเฉพาะเมื่อครอบคลุมส่วนสำคัญของโครงสร้างลิงก์และ URL ของเว็บไซต์:
-
ประสบการณ์ผู้ใช้: orphan pages แม้จะดูไม่น่าเป็นไปได้ ส่งผลกระทบอย่างมากต่อประสบการณ์ผู้ใช้ของเว็บไซต์ เพราะผู้ใช้ไม่สามารถเยี่ยมชมหน้าได้อย่างเป็นธรรมชาติผ่านเมนูหรือลิงก์ที่สนใจที่นำไปสู่สิ่งที่กำลังหา แม้ว่าหน้าจะมีอยู่และมีเนื้อหาคุณภาพ
-
อำนาจ: หากหน้าสำคัญกลายเป็น orphans และสูญเสียการเชื่อมโยงกับ URL อื่นๆ บนเว็บไซต์ อำนาจทั้งหมดที่อาจมีจะสูญเปล่า และส่งผลโดยตรงต่อการจัดอันดับในผลการค้นหา Google เพราะเป็นปัจจัย SEO ที่สำคัญในวิธีที่เครื่องมือค้นหาเรียงผลลัพธ์สำหรับคำสำคัญเฉพาะ
-
บริบท: การเชื่อมโยงภายในของเว็บไซต์ให้บริบทแก่ crawlers ของ Google เพื่อรู้วิธีจัดทำดัชนีหน้าและสำหรับการค้นหาใดที่สำคัญและเกี่ยวข้อง orphan pages ทำให้เว็บไซต์และหน้าเองสูญเสียบริบทและความหมายเชิงความหมาย ในกรณีที่ถูกจัดทำดัชนี
อย่างไรก็ตาม เมื่อ orphan pages ปรากฏในจำนวนมาก ผลกระทบสังเกตได้ชัดเจนมากขึ้นเมื่อพูดถึงการจัดอันดับ ผู้เข้าชม และการรวบรวมข้อมูล ดังนั้นเหล่านี้เป็นปัญหาที่ต้องแก้ไขแยกกันและกว้างขวางขึ้น
ปัญหาของหน้าที่มีการมองเห็นต่ำและผู้เข้าชม
orphan pages มีอิทธิพลเชิงลบที่โดดเด่นเมื่อพูดถึงโดยตรงกับการจัดอันดับหรือตำแหน่งของเว็บไซต์และหน้าเฉพาะที่ได้รับผลกระทบ รวมถึงผู้เข้าชม และนั่นเป็นเพราะตามที่กล่าวไว้ก่อนหน้า orphan page แยกตัวและกลายเป็นมองไม่เห็น ทั้งสำหรับผู้ใช้ที่ไม่สามารถค้นหาได้อย่างเป็นธรรมชาติบนเว็บไซต์ผ่านปุ่มหรือคลิก และยังสำหรับ crawlers ของ Google หรือเครื่องมือค้นหาอื่น
สิ่งนี้ ส่งผลกระทบต่อผู้เข้าชมเว็บไซต์และหน้าอย่างชัดเจน รวมถึงการมองเห็น โดยไม่ได้รับผู้ใช้จำนวนมากและเนื่องจากตำแหน่งที่ไม่ดีหรือไม่มี ที่ orphan pages มีในผลการค้นหา ผลที่ตามมาคือเราเผชิญกับการสูญเสียศักยภาพทั้งหมดสำหรับเว็บไซต์และหน้า โดยเฉพาะหากรวมเนื้อหาคุณภาพเกี่ยวกับผลิตภัณฑ์ บริการ และหัวข้ออื่น ผลกระทบต่อผู้เข้าชมและการมองเห็นยังส่งผลให้สูญเสียอำนาจและความเกี่ยวข้องสำหรับเว็บไซต์ในกลุ่มของตนเทียบกับคู่แข่ง
ปัญหาการสูญเสียการรวบรวมข้อมูล
Google ในฐานะเครื่องมือค้นหาจัดทำดัชนีหน้าเว็บไซต์ตามที่เรียกว่า crawl budget หรือ Crawl Budget ซึ่งสามารถอธิบายได้ว่าเป็นเวลาที่ crawlers หรือสไปเดอร์ของเครื่องมือค้นหาจะใช้ในการค้นหาหน้าเพื่อจัดทำดัชนี ยิ่งเว็บไซต์มีหน้ามาก จะต้องใช้เวลามาก นั่นคือ crawl budget มากขึ้น
นี่คือที่ การปรับโครงสร้าง สถาปัตยกรรม และองค์ประกอบอื่นของเว็บไซต์เข้ามามีบทบาท เช่น orphan pages หากเว็บไซต์มี orphan pages ที่ไม่เกี่ยวข้อง จะใช้ crawl budget เท่ากัน ซึ่งสูญเปล่าและอาจทำให้หน้าที่มีสุขภาพและเนื้อหาดีไม่ถูกจัดทำดัชนี ส่งผลต่อผลการค้นหาและผู้เข้าชม สรุป orphan pages เป็นการสูญเสียทรัพยากรที่ Google ไม่เต็มใจใช้
ความแตกต่างระหว่าง orphan pages และ Dead End pages
เมื่อพูดถึง SEO คำว่า orphan page** อาจสับสนกับคำว่า dead end page หรือ "Dead End"** เพราะแสดงปัญหาที่คล้ายกัน แต่ไม่เหมือนกัน เราได้นิยามไปแล้วว่า Orphan Pages คืออะไร มาต่อกับ dead ends:
dead end page เป็นหน้าที่ไม่ได้เชื่อมโยงกับหน้าอื่นจากการเชื่อมโยงภายในของเว็บไซต์ หรือกับแพลตฟอร์มเว็บภายนอกอื่นใด นั่นคือ เมื่อคุณลงบนหน้านั้น คุณไม่สามารถทำอะไรได้ยกเว้นปิดและออก
เมื่อ crawlers ของเครื่องมือค้นหาเช่น Google ตกลงบน dead end page ก็ไม่มีที่ไป และจากนั้นมาคือชื่อของมัน ซึ่งวาดภาพเปรียบเทียบกับถนนตัน
ค้นหา orphan pages บนเว็บไซต์ของคุณอย่างไร?
ในการเริ่มแก้ไขปัญหาที่เกี่ยวข้องกับ orphan pages หรือ Orphan Pages สิ่งแรกที่ต้องทำคือค้นหา เพราะแน่นอนว่าไม่ได้แสดงในมุมมองแรกทั้งในฐานะผู้ใช้ของเว็บไซต์หรือในฐานะผู้พัฒนา โชคดีที่สามารถใช้เครื่องมือต่างๆ เช่นซอฟต์แวร์ SEO ที่วิเคราะห์โครงสร้างเว็บไซต์ทั้งหมดอย่างละเอียด รับผ่าน server logs ภาพรวมที่สมบูรณ์ของทั้งหมด
หากคุณต้องการ SEO Software ที่ทรงพลังที่ช่วยคุณไม่เพียงระบุ orphan pages แต่ยังเสริมและปรับปรุงกลยุทธ์ SEO อย่าลังเลที่จะตรวจสอบโปรแกรมที่พัฒนาภายในของ SEO Alive!
การจดจำ orphan pages ด้วย Screaming Frog
ตามที่กล่าวไว้ มีโปรแกรมหลายตัวในตลาดที่ช่วยระบุ orphan pages เหล่านี้ เราจะมุ่งเน้นการอธิบายอย่างง่าย วิธีทำ ด้วยหนึ่งในที่รู้จักกันดีที่สุด Screaming Frog
Screaming Frog มีสองโปรแกรมที่แตกต่าง อันที่รู้จักกันดีที่สุด ซึ่งรวบรวมข้อมูลเว็บไซต์ทั้งหมดโดยติดตามลิงก์ภายในที่พบ และ log analyser ซึ่งวิเคราะห์ access logs ของเซิร์ฟเวอร์ นั่นคือ บันทึกที่ยังคงอยู่เมื่อ Googlebot (หรือ user agent อื่น) เข้ามาเยี่ยมชมหน้าใดของเรา
ด้วยอันแรก เราจะดึงไฟล์ที่แสดงรายการ URL ทั้งหมดที่ crawler พบขณะนำทาง จะเป็นไฟล์ Excel ที่เราสามารถพบในส่วนรายงานภายใต้ "all inlinks":

เมื่อเรามีไฟล์นี้ เราดึง logs จากเซิร์ฟเวอร์ของเรา ซึ่งโดยปกติจะเป็นไฟล์บีบอัดของบันทึกดังกล่าว และโหลดเข้าใน log analyser ของ Screaming Frog เพื่อให้ที่นี่เราจะมีแผงที่ทุก URL ที่ Googlebot เยี่ยมชมในช่วงเวลาที่เราโหลดจะปรากฏ ไม่ว่าจะถูกเชื่อมโยงหรือไม่
ขั้นตอนสุดท้ายจะโหลดไฟล์ Excel จากขั้นตอนก่อนหน้าเข้าในส่วนที่เปิดใช้ของ log analyser สำหรับวัตถุประสงค์นั้น และแท็บใหม่จะเปิดใช้เมื่อทำเช่นนั้นพร้อมตัวเลือกต่อไปนี้:

-
Matched with URL data: นี่จะเป็นชุด URL ที่เชื่อมโยงภายในและถูกเยี่ยมชมโดย Google
-
Not in log file: URL ที่เชื่อมโยงแต่ด้วยเหตุผลใดไม่ได้รับ events (visits) จาก Google
-
Not in URL data: นี่คือกลุ่มที่เราสนใจในกรณีนี้ เป็น URL ที่ Google เยี่ยมชม ทิ้งบันทึกใน logs แต่ crawler ไม่สามารถพบเมื่อทำการจำลอง เพราะไม่ได้เชื่อมโยงภายใน นั่นคือ Orphan Pages ที่เรากำลังหา
จากกลุ่มที่สาม เราจะดึงรายการหน้าที่เราจะจัดประเภทเป็น orphans โดยที่ส่งคืน status code 200 เป็นวัตถุการปรับให้เหมาะสมพื้นฐาน
แก้ปัญหา orphan pages อย่างไร?
โดยทั่วไปและด้วยตนเอง มีสี่สิ่งที่สามารถทำได้ หากคุณมี URL ที่ไม่ได้รวมเข้ากับการเชื่อมโยงภายใน ที่ต้องตัดสินใจบางอย่าง:
-
อันดับแรก หากหลังการย้ายมี orphan pages ตามที่น่าจะมี และพวกมันถูกตรวจสอบและหลายมี เนื้อหาที่เกี่ยวข้องน้อย ไม่มี หรือซ้ำ สิ่งที่ดีที่สุดคือลบ และในกรณีที่เหมาะสม เพิ่มการเปลี่ยนเส้นทาง 301 ไปยังหน้าคล้ายหรือเด่นบนเว็บไซต์ที่มีอำนาจมากกว่า
-
อันดับสอง หากด้วยเหตุผลใด คุณต้องการเก็บ orphan page เนื่องจากเนื้อหาดี อำนาจ และผู้เข้าชม ขั้นตอนต่อไปคือเชื่อมโยงจาก URL เว็บไซต์ที่มีเนื้อหาที่เกี่ยวข้อง และเข้าถึงได้ง่ายโดยผู้ใช้และ Google แน่นอน ควรสังเกตว่า URL ของหน้าต้องรวมใน sitemap
-
อันดับสาม หาก orphan pages จำนวนมากปรากฏแต่ลักษณะเป็นชั่วคราว และเนื้อหาหมดอายุแล้วเพราะรวมโปรโมชั่นและเนื้อหาที่เกี่ยวข้องกับเวลาเฉพาะ ทำเหมือนในขั้นตอนก่อนและเชื่อมโยงหน้ากับอันภายในอื่นที่มีความเกี่ยวข้องและเข้าถึงได้ อย่างไรก็ตาม ในกรณีนี้เราทำให้ URL นั้นไม่ถูกจัดทำดัชนีโดย รวม meta tag "noindex" เพื่อไม่ให้ถูกพิจารณาโดย crawlers
-
สุดท้าย ในกรณีของ orphan pages ที่มีเนื้อหาซ้ำหรือเกือบซ้ำ ควรพิจารณาลบหน้านั้นและรวมเนื้อหาในอันอื่นเพื่อไม่ให้สูญเสียและยังคงใช้ประโยชน์จากศักยภาพทั่วไป
บทสรุป
orphan pages เป็นองค์ประกอบธรรมชาติที่จะปรากฏบนเว็บไซต์ด้วยเหตุผลต่างๆ และเมื่อไม่มากเกินไปหรือจำนวนไม่เติบโตอย่างทวีคูณ ก็ไม่เป็นปัญหา
ในทางกลับกัน เมื่อเปอร์เซ็นต์ใหญ่ของเว็บไซต์และการเชื่อมโยงภายในประกอบด้วยหน้าประเภทนี้ สามารถสร้างปัญหามากเกี่ยวกับการรวบรวมข้อมูล การจัดอันดับ และผู้เข้าชมที่เกี่ยวข้องกับ SEO รวมถึงอำนาจ ประสบการณ์ผู้ใช้ และปัญหาอื่นที่ต้องแก้ไข
ข่าวดีคือ orphan pages สามารถแก้ไขได้หลายวิธี แต่เสมอในกระบวนการวิเคราะห์ สิ่งที่คุณต้องถามตัวเองคือ orphan page เฉพาะแต่ละอันเกี่ยวข้องสำหรับการจัดอันดับ สำหรับเนื้อหา และสามารถเชื่อมโยงกับอันอื่นหรือไม่ และเมื่อไม่ใช่ ก็เพียงลบ
แล้วคุณ ผู้อ่านที่รัก... รู้จักการมีอยู่ของ orphan pages หรือไม่? เคยพบองค์ประกอบนี้ในโครงการของคุณหรือของลูกค้าของคุณ? ทิ้งความคิดเห็นและเราจะตอบกลับ ขอบคุณมากและพบกันใหม่!
โดย: David Kaufmann

ในช่วง 10+ ปีที่ผ่านมา ผมหมกมุ่นกับ SEO อย่างสมบูรณ์ — และพูดตรง ๆ ก็ไม่อยากให้เป็นแบบอื่น
อาชีพของผมก้าวขึ้นไปอีกระดับเมื่อทำงานเป็นผู้เชี่ยวชาญ SEO อาวุโสที่ Chess.com — หนึ่งใน 100 เว็บไซต์ที่มีผู้เข้าชมมากที่สุดในอินเทอร์เน็ต การทำงานในระดับนี้สอนสิ่งที่ไม่มีหลักสูตรหรือประกาศนียบัตรใดสอนได้
จากประสบการณ์นี้ ผมก่อตั้ง SEO Alive — เอเจนซีสำหรับแบรนด์ที่จริงจังกับการเติบโตแบบออร์แกนิก และเพราะหาเครื่องมือที่จัดการทั้งโลกคลาสสิกและยุค AI ได้ดีไม่ได้ ผมจึงสร้าง SEOcrawl ขึ้น หากคุณกำลังมองหาพาร์ตเนอร์ SEO มากประสบการณ์ที่รักสาขานี้ — ยินดีพูดคุยครับ!
ค้นพบเนื้อหาเพิ่มเติมของผู้เขียนคนนี้

