Orphan Pages: Apa Itu dan Bagaimana Menemukannya

Agar website berfungsi dan dapat menampilkan halaman yang dimilikinya sehingga pengguna dapat melihatnya, harus memiliki struktur linking yang tepat yang membantu, pertama-tama, pengguna mencapai halaman tersebut hanya dengan satu klik, dan juga memastikan mereka di-crawl oleh bot dan spider Google sehingga muncul di hasil pencarian. Ketika sebuah halaman tidak terintegrasi ke dalam struktur link, itu disebut "orphan page" (halaman yatim).
Tetapi, apa sebenarnya orphan page itu? Kita akan membahas istilah ini secara detail, bersama dengan konsekuensi yang dapat dimilikinya dari perspektif SEO, mengapa terjadi, cara menemukan jenis halaman ini, dan bagaimana memecahkan masalah yang dapat ditimbulkannya. Mari kita mulai!
Apa itu orphan pages?
Secara khusus, orphan page adalah halaman di sebuah website yang, meskipun mungkin atau mungkin tidak diindeks oleh Google atau mesin pencari lainnya, tidak terhubung atau tertaut ke struktur halaman platform, menjadi sepenuhnya terisolasi.
Dengan cara ini, halaman itu seolah-olah "mengambang" di situs tanpa dapat dijangkau oleh pengguna yang mungkin mengunjunginya, atau oleh bot Google untuk ditampilkan dalam hasil pencarian, bahkan jika diindeks. Bahkan jika sebuah halaman direpresentasikan di sitemap XML dengan URL-nya yang sesuai, tidak ada jaminan bahwa orphan pages tidak ada, karena untuk alasan apa pun atau kesalahan manusia, tidak dapat dijangkau oleh pengguna atau oleh crawler mesin pencari.

Misalnya, ada dua cara halaman di website ditemukan:
-
melalui crawler yang menemukan semua halaman dengan mengikuti link di antaranya, dan
-
melalui daftar URL di sitemap XML.
Ketika orphan page yang terisolasi ada, seolah-olah tidak terlihat, bahkan jika ada di sitemap, karena karena tidak memiliki link yang mengarah ke sana, tidak ditemukan.
Ini menimbulkan serangkaian masalah terkait:
-
traffic
-
kehilangan potensi
-
masalah SEO
-
visibilitas
-
otoritas, dan
-
kemungkinan penalti
...di antara lain yang akan kita bahas secara detail nanti. Untuk saat ini, yang jelas adalah bahwa potensi orphan pages, tidak peduli seberapa besar atau kecil sebuah situs, harus diperbaiki, yang dimungkinkan dan merupakan praktik pemeliharaan umum.
Mengapa terjadi bahwa sebuah website memiliki orphan pages?
Ada beberapa alasan mengapa sebuah website memiliki orphan pages, bahkan tanpa pemilik atau developer menyadarinya atau mengetahuinya pada suatu saat. Sering kali, jenis halaman ini, yang tidak diinginkan pada platform web, disebabkan oleh perubahan yang dilakukan dengan cara yang buruk, yang biasanya disebabkan oleh kesalahan manusia.
Di bawah ini, kami menunjukkan skenario utama di mana orphan pages dihasilkan atau disebabkan pada sebuah website:
-
Terkadang, internal linking halaman website diubah, yang menyebabkan beberapa URL dihapus karena tidak lagi diperlukan, sudah lama, atau karena optimasi situs. Sering kali, bahkan ketika link dihapus, halaman tetap berada di situs mengambang tanpa sepenuhnya dihapus.
-
Halaman tes A/B yang tidak bersentuhan dengan pengguna akhir, yang, setelah digunakan dalam pengembangan situs, tetap berada di sana tanpa dihapus.
-
Ketika sebuah landing page sementara dihasilkan untuk menarik pengguna agar menjadi pelanggan situs, seperti selama periode promosi, Natal, atau lainnya, dan setelah waktu itu berlalu halaman dihapus, tetapi URL terindeks tetap.
-
Ketika sebuah kategori dihapus dari menu situs, tetapi tidak diredirect dengan benar ke yang lain yang dibuat di tempatnya, meninggalkan halaman yang tersisa tanpa link di platform.
-
Selama migrasi situs, banyak orphan pages sering dihasilkan yang berubah format, URL, dan parameter, tetapi tidak dihapus dan menjadi terputus dan terisolasi dari situs.
-
Ketika template digunakan untuk membangun website, dan halaman template default tertinggal yang kemudian dilupakan dan tidak dihapus.
Di sisi lain, ada dua penyebab umum orphan pages yang harus ditangani dan diatasi segera; ini pada dasarnya adalah halaman duplikat yang seharusnya secara konsisten redirect otomatis ke satu URL. Secara khusus, kita berbicara tentang penggunaan HTTPS dan HTTP yang konsisten pada halaman canonical dan non-canonical, serta penggunaan trailing slash.
Jika tidak, kemungkinan beberapa versi halaman tidak ditautkan dan, akibatnya, menjadi yatim. Dalam hal ini, fakta bahwa mereka yatim bukanlah masalah utama melainkan fakta bahwa mereka duplikat dan akan menyebabkan masalah penalti atau kehilangan indexing, antara lain, yang diterjemahkan di Google sebagai konten yang disalin atau berkualitas rendah. Kami akan membahas ini nanti di bagian solusi orphan pages.
Apakah orphan pages bermanfaat atau merugikan SEO?
Orphan pages merepresentasikan masalah dari sudut pandang SEO, serta untuk visibilitas, otoritas, kehilangan konten, dan traffic, tergantung pada jumlah yang ada di platform. Yaitu, platform yang memiliki satu, dua, atau beberapa orphan pages mungkin tidak menyebabkan masalah, tetapi ketika mereka membentuk persentase besar dari situs, di sanalah masalah dimulai.
Mengoptimalkan situs sehingga tidak memiliki orphan pages penting untuk SEO dan dalam aspek lain, dan tidak akan pernah dapat dikatakan bahwa mereka menguntungkan situs; sebaliknya, mereka merugikannya ketika ada terlalu banyak.
Pertama, mesin pencari tidak dapat menemukan orphan pages melalui link, jadi orphan pages sering tidak diindeks dan tidak pernah muncul dalam hasil pencarian, mempengaruhi traffic, visibilitas, dan potensi mereka, tetapi kami akan membahas itu lebih detail nanti di bagiannya sendiri.
Masalah umum yang disebabkan oleh orphan pages
Di bawah ini adalah beberapa masalah umum yang disebabkan oleh orphan pages, terutama ketika mereka mencakup bagian penting dari struktur link dan URL situs:
-
Pengalaman pengguna: orphan pages, sebagaimanapun tidak mungkin tampak, sangat mempengaruhi pengalaman pengguna situs, karena pengguna tidak dapat secara alami mengunjungi halaman melalui menu atau link minat yang membawa mereka ke apa yang mereka cari, bahkan jika halaman itu ada dan memiliki konten berkualitas.
-
Otoritas: jika halaman penting menjadi yatim dan kehilangan linking ke URL lain di situs, semua otoritas yang mungkin mereka miliki terbuang, dan itu langsung mempengaruhi ranking di hasil pencarian Google, karena ini adalah faktor SEO penting dalam cara mesin pencari mengurutkan hasil untuk kata kunci tertentu.
-
Konteks: internal linking sebuah situs memberikan konteks pada crawler Google untuk tahu bagaimana mengindeks halaman dan untuk pencarian mana itu penting dan relevan. Orphan pages menyebabkan situs dan halaman itu sendiri kehilangan konteks dan makna semantik, jika diindeks.
Namun, ketika orphan pages hadir dalam jumlah besar, dampaknya jauh lebih terlihat dalam hal ranking, traffic, dan crawling, jadi ini adalah masalah yang harus ditangani secara terpisah dan lebih luas.
Masalah halaman dengan visibilitas dan traffic rendah
Orphan pages memiliki pengaruh negatif yang nyata dalam hal langsung ke ranking atau positioning situs dan halaman tertentu yang terkena dampak, serta traffic-nya. Dan itu karena, seperti yang disebutkan sebelumnya, orphan page terisolasi dan menjadi tidak terlihat, baik untuk pengguna yang tidak dapat menemukannya secara alami di situs melalui tombol atau klik, dan juga untuk crawler Google atau mesin pencari lainnya.
Ini jelas mempengaruhi traffic situs dan halaman, serta visibilitasnya, dengan tidak menerima banyak pengguna dan juga karena tempat yang buruk atau tidak ada yang dimiliki orphan pages dalam hasil pencarian. Sebagai konsekuensinya, seseorang berurusan dengan kehilangan total potensi situs dan halaman, terutama jika mencakup konten berkualitas tentang produk, layanan, dan topik lainnya. Dampak pada traffic dan visibilitas juga menghasilkan kehilangan otoritas dan relevansi untuk situs sehubungan dengan niche atau industrinya dibandingkan dengan kompetitor.
Masalah kehilangan crawling
Google sebagai mesin pencari mengindeks halaman situs sesuai dengan apa yang dikenal sebagai crawl budget atau Crawl Budget, yang dapat digambarkan sebagai waktu yang akan dihabiskan crawler atau spider mesin pencari untuk menemukan halaman untuk diindeks. Semakin banyak halaman yang dimiliki situs, semakin banyak waktu yang akan dibutuhkan, yaitu lebih banyak crawl budget.
Di sinilah optimasi struktur, arsitektur, dan elemen lain dari website ikut berperan, seperti orphan pages. Jika sebuah situs memiliki orphan pages yang tidak relevan, itu akan sama-sama mengonsumsi crawl budget, yang terbuang dan dapat menyebabkan halaman dengan kesehatan dan konten yang baik tidak diindeks, mempengaruhi hasil pencarian dan traffic. Singkatnya, orphan pages merepresentasikan pemborosan sumber daya yang Google tidak bersedia keluarkan.
Perbedaan antara orphan pages dan halaman Dead End
Dalam SEO, istilah orphan page** dapat dibingungkan dengan istilah dead end page atau "Dead End"**, karena mereka merepresentasikan masalah serupa, tetapi mereka tidak sama. Kami sudah mendefinisikan sebelumnya apa itu Orphan Pages, mari lanjut dengan dead end:
Halaman dead end adalah halaman yang tidak ditautkan ke yang lain dari internal linking situs, atau ke platform web eksternal lainnya, yaitu, sekali Anda mendarat di sana, Anda tidak dapat melakukan apa pun kecuali menutupnya dan pergi.
Ketika crawler mesin pencari seperti Google jatuh pada halaman dead end, mereka tidak punya tempat untuk pergi, dan dari sana datang namanya, yang menggambar analogi dengan jalan buntu.
Bagaimana cara menemukan orphan pages di situs Anda?
Untuk mulai menyelesaikan masalah yang berkaitan dengan orphan pages atau Orphan Pages, hal pertama yang harus kita lakukan adalah menemukan mereka, karena jelas mereka tidak ditampilkan secara sekilas baik sebagai pengguna situs atau sebagai developer. Untungnya, alat berbeda seperti software SEO dapat digunakan yang menganalisis seluruh struktur website kita secara detail, mendapatkan melalui log server gambaran lengkap dari semuanya.
Jika Anda membutuhkan Software SEO yang kuat yang membantu Anda tidak hanya untuk menemukan orphan pages tetapi juga untuk meningkatkan dan memperbaiki strategi SEO Anda, jangan ragu untuk mencoba program yang dikembangkan in-house oleh SEO Alive!
Mengenali orphan pages dengan Screaming Frog
Seperti yang kami sebutkan, ada beberapa program di pasar yang membantu Anda mengidentifikasi orphan pages ini; kami akan fokus pada penjelasan dengan cara sederhana bagaimana melakukannya dengan salah satu yang paling terkenal, Screaming Frog.
Screaming Frog memiliki dua program berbeda, yang paling dikenal semua orang, yang meng-crawl seluruh website mengikuti link internal yang ditemuinya, dan log analyser, yang menganalisis log akses server, yaitu, catatan yang tersisa ketika Googlebot (atau user agent lain) masuk untuk mengunjungi salah satu halaman kita.
Dengan yang pertama, kita akan mengekstrak file yang mendaftarkan total URL yang ditemukan crawler saat menavigasi; itu akan menjadi file Excel yang dapat kita temukan di bagian laporan di bawah "all inlinks":

Nah, setelah kita memiliki file ini, kita ambil log dari server kita, yang biasanya akan menjadi file terkompresi dari catatan yang disebutkan di atas, dan kita memuatnya ke log analyser Screaming Frog, sehingga di sini kita akan memiliki panel di mana semua URL yang telah dikunjungi Googlebot selama periode waktu yang kita muat akan muncul, baik mereka tertaut atau tidak.
Langkah terakhir adalah memuat file Excel dari langkah sebelumnya ke bagian log analyser yang diaktifkan untuk tujuan itu, dan tab baru akan diaktifkan ketika kita melakukannya dengan opsi berikut:

-
Matched with URL data: Ini akan menjadi set URL yang ditautkan secara internal dan telah dikunjungi oleh Google.
-
Not in log file: URL yang ditautkan tetapi karena alasan tertentu tidak menerima event (kunjungan) dari Google.
-
Not in URL data: Ini adalah grup yang kita minati dalam kasus ini; ini adalah URL yang dikunjungi Google, meninggalkan catatan di log, tetapi yang tidak dapat ditemukan crawler saat melakukan simulasi, karena tidak ditautkan secara internal, yaitu, mereka adalah Orphan Pages yang kita cari.
Dari grup ketiga ini, kita akan mengekstrak daftar halaman yang akan kita kategorikan sebagai yatim, dengan yang mengembalikan kode status 200 menjadi objek utama optimasi kita.
Bagaimana cara menyelesaikan masalah orphan pages?
Secara umum dan manual, ada empat hal yang dapat dilakukan jika Anda memiliki URL yang tidak terintegrasi ke dalam internal linking, di mana beberapa keputusan harus dibuat:
-
Pertama, jika setelah migrasi ada orphan pages, sebagaimana kemungkinan akan ada, dan mereka diperiksa dan banyak dari mereka memiliki konten yang kurang relevan, tidak ada, atau duplikat, hal terbaik yang harus dilakukan adalah menghapusnya dan, jika perlu, tambahkan redirect 301 ke halaman serupa atau unggulan di situs dengan otoritas yang lebih banyak.
-
Kedua, jika untuk beberapa alasan Anda ingin mempertahankan orphan page karena konten yang baik, otoritas, dan traffic, langkah berikutnya adalah menautkannya dari URL situs yang memiliki konten terkait, dan yang mudah dijangkau oleh pengguna dan oleh Google. Tentu saja, perlu dicatat bahwa URL halaman harus disertakan di sitemap.
-
Ketiga, jika banyak orphan pages muncul tetapi sifatnya sementara dan kontennya sudah kedaluwarsa karena termasuk promosi dan konten terkait dengan waktu tertentu, mari kita lakukan hal yang sama seperti pada langkah sebelumnya dan tautkan halaman ke yang internal lain dengan relevansi dan yang dapat diakses. Namun, dalam kasus ini kita membuatnya agar URL itu tidak diindeks dengan menyertakan meta tag "noindex" sehingga tidak diperhitungkan oleh crawler.
-
Akhirnya, dalam kasus orphan pages dengan konten duplikat atau hampir duplikat, akan layak untuk mempertimbangkan menghapus halaman itu dan menyertakan kontennya di yang lain untuk tidak kehilangannya dan terus memanfaatkan potensinya secara umum.
Kesimpulan
Orphan pages adalah elemen alami yang akan muncul di website karena berbagai alasan, dan ketika mereka tidak berlebihan atau jumlahnya tidak tumbuh secara eksponensial, mereka tidak merepresentasikan masalah apa pun.
Di sisi lain, ketika sebagian besar dari sebuah website dan internal linkingnya terdiri dari halaman jenis ini, itu dapat menghasilkan banyak masalah terkait crawling, ranking, dan traffic yang berkaitan dengan SEO, serta otoritas, pengalaman pengguna, dan masalah lain yang perlu ditangani.
Kabar baiknya adalah orphan pages dapat diselesaikan dengan berbagai cara, tetapi selalu dalam proses analisis, yang harus Anda tanyakan pada diri sendiri adalah apakah setiap orphan page tertentu relevan untuk ranking, untuk konten, dan dapat ditautkan ke yang lain, dan ketika tidak demikian, cukup hapus mereka.
Dan Anda, pembaca yang budiman... apakah Anda tahu tentang keberadaan orphan pages? Apakah Anda pernah menjumpai elemen ini di salah satu proyek Anda atau klien Anda? Tinggalkan komentar dan kami akan menanggapi Anda tentang hal itu. Terima kasih banyak dan sampai jumpa lagi!
Penulis: David Kaufmann

Saya telah menghabiskan lebih dari 10 tahun terakhir benar-benar terobsesi dengan SEO — dan jujur saja, saya tidak mau menukarnya dengan apa pun.
Karier saya mencapai level baru ketika saya bekerja sebagai senior SEO specialist untuk Chess.com — salah satu dari 100 website paling banyak dikunjungi di seluruh internet. Bekerja di skala seperti itu, di jutaan halaman, puluhan bahasa, dan di salah satu SERPs paling kompetitif yang ada, mengajari saya hal-hal yang tidak akan pernah bisa diberikan oleh kursus atau sertifikasi mana pun. Pengalaman itu mengubah cara pandang saya tentang seperti apa SEO yang benar-benar hebat — dan menjadi fondasi bagi semua yang saya bangun setelahnya.
Dari pengalaman itu, saya mendirikan SEO Alive — sebuah agency untuk brand yang serius menggarap pertumbuhan organik. Kami tidak di sini untuk menjual dashboards dan laporan bulanan. Kami di sini untuk membangun strategi yang benar-benar menggerakkan hasil, menggabungkan yang terbaik dari SEO klasik dengan dunia baru yang menarik dari Generative Engine Optimization (GEO) — memastikan brand Anda tidak hanya muncul di tautan biru Google, tetapi juga di dalam jawaban yang dihasilkan AI yang dikirimkan ChatGPT, Perplexity, dan Google AI Overviews kepada jutaan orang setiap harinya.
Dan karena saya tidak bisa menemukan tool yang menangani kedua dunia itu dengan benar, saya membangunnya sendiri — SEOcrawl, sebuah platform enterprise SEO intelligence yang menyatukan rankings, audit teknis, pemantauan backlinks, kesehatan crawl, dan pelacakan visibilitas brand di AI dalam satu tempat. Inilah platform yang selalu saya harap pernah ada.
Temukan lebih banyak konten dari penulis ini

