Yinelenen İçerik Nasıl Tespit Edilir ve Düzeltilir?

Yinelenen İçerik Nasıl Tespit Edilir ve Düzeltilir?
David Kaufmann
SEO Eğitimi
8 min read

SEO dünyasında çalışıyorsanız, muhtemelen arama motoru sıralamalarını etkileyen ve cezalara yol açabilen en yaygın sorunlardan biriyle, yani yinelenen içerikle başa çıkmak zorunda kaldığınız bir durumla karşılaşmışsınızdır. Google, Bing veya Yahoo gibi arama motorlarının ana hedefi, kullanıcıların arama niyetine en uygun bilgileri görüntülemektir. Bunu yapmak için azalan sırayla sıralarlar; orijinal, yüksek kaliteli içeriği ödüllendirir, kopyalanmış, çoğaltılmış, alakasız ya da sonuç sayfalarında daha üst sıralarda yer almak için manipüle edilmiş içeriği cezalandırırlar.

Bu makalede yinelenen içeriğin ne olduğunu, nasıl tespit edip düzeltebileceğimizi, SEO üzerindeki etkisini ve üzerinde çalışmak için kullanabileceğimiz araçları açıklayacağız. Bize katılır mısınız? Başlayalım! ?

Yinelenen içerik nedir?

Daha önce de belirttiğimiz gibi, Google gibi arama motorları, farklı URL'lere ancak aynı içeriğe sahip iki sayfa olarak yorumlanan yinelenen içeriğe sahip sayfaları cezalandırır. Bu nedenle, mümkün olduğunca, başka bir web sitesinden içeriği kopyalayıp sitenize yapıştırmaktan kaçının (Google ile birçok baş ağrısından ve içeriği aldığınız web sitelerinin sahiplerinden olası yasal işlemlerden kaçınmış olacaksınız!?).

SEO Alive İpucu**:** Arama motoru optimizasyonu konusunda uzmanlaşmış bir ajans olarak, web sitenizdeki içeriğe özen göstermenizi ve bu kötü uygulamadan kaçınmanızı şiddetle tavsiye ederiz. Sabırlı ve azimli olun, orijinal içerik yazın ve sonuçlar geç değil, erken gelecektir. Bu konuda Google, yinelenen içerikle ilgili resmi belgesinde gördüğümüz gibi pozisyonu konusunda çok nettir, bu nedenle yazdığımız içerikle çok dikkatli olmalıyız.

SEO sıralamasında iki tür yinelenen içeriği ayırt edebiliriz: dahili ve harici yinelenen içerik.

Dahili yinelenen içerik

Bu tür yinelenen içerik genellikle URL parametrelerinin zayıf uygulanması veya kategorilerde ve etiketlerde taksonomilerin kötü yönetilmesi nedeniyle ortaya çıkar. Dahili yinelenen içerik oluşturabilecek olası nedenler şunlardır:

  • Kategori ve etiket oluşturmadaki hatalar: Bu hata, makale ve kategorilerin geniş bir listesi olan ve etiketlerin herhangi bir düzen veya mantık olmadan oluşturulduğu bloglarda yaygındır. Bir örnek görelim:

Birkaç kategoriye sahip bir dijital pazarlama blogumuz olduğunu hayal edin:

https://myblogdigital.com/category-a/topic/

https://myblogdigital.com/category-b/topic/

https://myblogdigital.com/category-c/topic/ Yinelenen içerikten kaçınmak için, hangisinin ana olduğunu işaretlemek ve diğer ikisinin ana URL'ye canonicalize edilmesini sağlamak gerekir.

  • "Non-www" vs "www" ve "http" vs "https" alanları: Dikkat etmemiz gereken bir başka hata. Arama motorlarına hangisinin canonical alan olduğunu belirtmemişsek, diğer sürümlere erişebilir ve yinelenen içerik oluşturabilirler. Bu nedenle, SEO Alive olarak, hangisinin canonical alanınız olacağını belirlemenizi ve tercih edilenin olmasını istediğiniz sürüme 301 yönlendirmeleri ayarlamanızı öneririz.
  • Parametreli URL'ler: Bu hata, URL'lerin parametrelerle kullanıcılara bilgi sunmak için filtreleme imkânı verdiği e-ticaret web sitelerinde yaygındır. Bir saat satış sitemiz olduğunu ve aşağıdaki URL'ye sahip olduğumuzu varsayalım:

https://www.mywatchstore.com/watches/garmin?color=black Bu sayfa siyah renkteki tüm "Garmin" model saatleri gösterir.

Sayfalarda filtre ayarlama olasılığı, doğru yönetilmediği takdirde ciddi bir sakınca olabilir, çünkü arama motorları birkaç URL kombinasyonunu görüntüleyebilir:

https://www.mywatchstore.com/watches/garmin?color=black&type=sport

https://www.mywatchstore.com/watches/garmin?type=sport&color=black Bu nedenle SEO Alive olarak, parametreli URL'lerin geri kalanının sayfa otoritesini (URL Ratio) korumasını sağlamak için canonical sürümü filtrelenmemiş sayfaya ayarlamanızı öneririz.

Harici yinelenen içerik

Harici yinelenen içerik, farklı webmaster veya yöneticilere ait bir veya daha fazla web sitesinden tamamen veya kısmen çıkarılan, kopyalanan herhangi bir içeriği ifade eder.

Bu, arama motorlarının gözünde spam olarak kabul edilen bir uygulamadır; bu nedenle makalenin başında belirttiğimiz gibi her ne pahasına olursa olsun kaçınılmalıdır.

Harici yinelenen içeriğin bir başka nedeni, web sitelerinin arama motorlarını manipüle etmek için diğer sitelere trafik gönderdiği sendikasyon stratejileri olabilir. Google'ın algoritması bu tür uygulamaları tespit edecek kadar bugün akıllıdır.

Web sitemizin yinelenen içeriğe sahip olup olmadığını nasıl kontrol edebiliriz?

Yinelenen içeriği nasıl tespit edeceğinizi bilmek, bir web sitesinin içerik stratejisinde son derece önemlidir. Bu faktörü kontrol etmezsek, sayfalarımızın Google'daki üst sonuçlardan kademeli olarak kaymaları riskini taşırız, çünkü Google orijinal, yüksek kaliteli içerik arayışında SERP'leri sürekli olarak rafine eder. Bu nedenle, web sitemizdeki içeriği nasıl tespit edebileceğimize dair bir örnek sunacak ve bu tür içerikten kaçınmak için bazı stratejiler vereceğiz.

Her bir ürün sayfasının yazdırılabilir bir sürümüne sahip olduğumuz çevrimiçi bir mağazamız (e-ticaret) olduğunu varsayalım. Bu, farklı URL'ler altında aynı içeriğin iki "sürümü" olduğundan yinelenen olarak kabul edilir:

Ürün detay sayfası: https://mywebsite.com/product3560

Yazdırılabilir sürüm sayfası: https://mywebsite.com/product3560_print Bu tür yinelenen içerikten kaçınmak için aşağıdaki stratejileri uygulayabiliriz:

Strateji #1: 301 yönlendirmelerinin kullanımı

Web sitemizi yeniden yapılandırdıysak, kullanıcıları, arama motoru botlarını ve crawler işlevine sahip diğer araçları akıllıca yönlendirmek için içerik yönetim sistemlerinin (CMS) farklı depolarına dahil edilen SEO eklentileri veya .htaccess dosyası aracılığıyla 301 yönlendirmeleri (kalıcı yönlendirmeler) kurabiliriz.

Strateji #2: Canonical etiketinin kullanımı

rel="canonical" etiketi, arama motorlarına hangi sayfanın orijinal sayfa (canonical sürüm) ve hangi sayfaların kopya olduğunu söylemek için kullanılır. Bu şekilde, arama motoru örümceği bu meta etiketi ile işaretlenmiş sayfaya tarama bütçesini odaklayacaktır.

Canonical etiketini kullanmak için, önce arama motorları tarafından gösterilmesini istediğimiz sayfayı seçmemiz ve aşağıdaki satırı </head> bölümündeki HTML koduna eklememiz gerekir (Zalando web sitesindeki bir ürün sayfasında canonical örneğine bakalım):

<link rel="canonical" ahref= "https://www.zalando.es/adidas-originals-stripe-circle-camiseta-estampada-white-ad121000k-a11.html"/> Örneğin, bir URL'de bir ürünün detaylarını ve başka bir URL'de aynı ayrıntıları farklı renklerle gösteriyorsak, kullanıcılara göstermek istediğimiz canonical URL'nin hangisi olduğunu Google'a söyleyebiliriz.

Strateji #3: robots.txt dosyasının kullanımı

Bu dosyayı düzenleyerek arama motoru botlarına web sitemizin belirli sayfalarını veya bölümlerini taramamalarını söyleyebiliriz. Web sitemizde aşağıdaki ürün sayfalarına sahip olduğumuzu hayal edin:

https://www.mywebsite.com/category/product-page.html/

https://www.mywebsite.com/category/product-page1.html/ (yinelenen içerikli sürüm)

robots.txt dosyasındaki aşağıdaki yönerge ile:

  • Disallow /product-page.1html/

Yinelenen içeriğin ortaya çıkmasını önleyebiliriz, ayrıca elbette ilk URL'yi canonical sürüm olarak ayarlamayı da unutmamak gerekir.

Yinelenen içeriğin SEO sıralaması üzerindeki etkisi

Google Panda algoritmasının ilk sürümünün 2011 yılında yayınlanmasının ardından, thin content ve yinelenen içeriğe sahip alanları cezalandıran Matt Cutts, 2013 yılında Google'ın yinelenen içeriği nasıl ele aldığı ve SEO açısından sıralama konumları üzerinde ne tür olumsuz etkilere sahip olabileceği hakkında bir video yayınladı:



Matt Cutts'ın videosundan çıkarabileceğimiz sonuçlar, Google'a göre web'in %25-30'unun yinelenen içerik olmasına rağmen, niyet hileli bir şekilde büyük miktarlarda içerik oluşturmak veya kopyalamak ya da arama sonuç sayfalarındaki konumları "black hat" taktikleriyle doğrudan manipüle etmek olmadığı sürece arama motorunun bunu doğrudan spam olarak ele almadığıdır.

Kısacası, bu tür içerik oluşturmak Google gibi arama motorlarına düşük kaliteli sinyaller üretebilir, ayrıca o içeriğin farklı sürümlerine bağlantı verebilecek harici bağlantılar (backlinks) açısından içeriğin link metriklerini (otorite, alaka veya güven gibi) sağlamlaştırmak için bir engel oluşturabilir.

Yinelenen içeriği tespit etmek için araçlar

Yinelenen içeriği tespit etme söz konusu olduğunda, piyasada bu görevi kolaylaştırabilecek sayısız araç vardır. Onlara bir göz atalım! ?

Web sitemizdeki yinelenen içeriği tespit etmek için araçlar

  • Ahrefs: Ahrefs ile, "site audit" işlevselliği içinde ve SEO denetimi için bir proje eklediğimiz sürece, web sitemizin yinelenen içeriğe sahip olup olmadığını görebiliriz. Bunu yapmak için "duplicate content" sekmesine gideceğiz. Oraya geldiğimizde, düzeltmemiz gereken olası hataları belirleyebileceğimiz bir grafik gösterilecektir:

Ahrefs'te yinelenen içerik işlevselliği
Ahrefs'te yinelenen içerik işlevselliği

Ahrefs'in "Duplicate Content" işlevselliğinin görünümü

  • Screaming Frog: Bu iyi bilinen yazılım crawler ile yinelenen içeriği tespit etmek de mümkündür. Bunu yapmak için, kazımak için bir alan girmemiz ve "internal" verilerini .csv formatına dışa aktarmamız gerekecek. Elektronik tabloda iken, hangi sayfaların yinelenen başlıklara, meta açıklamalara, başlıklara vb. sahip olduğunu görüntüleyebilir, sıralayabilir ve filtreleyebilirsiniz.

SEO Alive İpucu: Sahip olduğunuz yinelenen içerik düzeyine ve her sayfanın önemine ve uygunluğuna göre hangi URL'leri düzelteceğinizi ayarlamak için elektronik tablonuzda koşullu biçimlendirme kuralları kullanın.

  • Safecont: Bu araç, yalnızca içerik analizine odaklandığı ve kümeleri ve içerik benzerliklerini tespit etmek ve bulmak için "machine learning" kullandığı için gerçekten ilginçtir. Oldukça kapsamlıdır ve web sitemizdeki yinelenen içeriği tespit etmek istiyorsak kullanımı bize birçok fayda sağlayabilir.

Safecont içerik aracı
Safecont içerik aracı

Safecont'un "Similarity" işlevselliğinin görünümü

Başka bir web sitesinden yinelenen içeriği tespit etmek için araçlar

  • Copyscape: Bir içerik parçasının başka bir web sitesine göre yinelenip yinelenmediğini bilmek istiyorsak, Copyscape, içeriği kopyalayan web sayfalarını tespit etmede uzmanlaşmış bir arama motorudur. Bu arama motorunda, yalnızca kontrol etmek istediğiniz içeriğin barındırıldığı URL'yi girmeniz yeterlidir; araç, o içeriği paylaşan sayfaları en yüksekten en düşük dereceye kadar sıralanmış olarak döndürür.
  • Plagium: Bu, Copyscape'e çok benzer bir başka araçtır; aradaki fark, URL yerine kontrol edilecek metni girmemiz gerekmesidir. Ücretli bir sürümü olduğunu belirtmek gerekir, dolayısıyla "ücretsiz" sürümün kontrol edilecek 5.000 karaktere kadar bir limiti vardır.

Sonuçlar

SEO Alive olarak %100 "White Hat SEO" ajansıyız, bu nedenle makalenin sonundaki tavsiyemiz her zaman yinelenen içerikten kaçınmaktır. Web sitenizde bu tür içerik tespit ederseniz, sağladığımız tüm stratejilere ve ipuçlarına güvenin. ? Unutmayın: Google orijinal, yüksek kaliteli içerikten hoşlanır!

Peki siz, yinelenen içerikle kötü bir deneyiminiz oldu mu veya bu nedenle herhangi bir cezaya maruz kaldınız mı? Nasıl çözdünüz? İsterseniz yorum kutusunda bize anlatın! Cevap vermekten mutluluk duyacağız. Bir sonraki yazıda görüşmek üzere!

Yazar: David Kaufmann

David Kaufmann

Son 10 yılı aşkın süredir tamamen SEO'ya kafayı takmış durumdayım — ve açıkçası, başka türlü olmasını da istemezdim.

Kariyerim, internetin tamamında en çok ziyaret edilen ilk 100 site arasında yer alan Chess.com'da Senior SEO Specialist olarak çalıştığım dönemde yeni bir seviyeye ulaştı. Milyonlarca sayfa, onlarca dil ve var olan en rekabetçi SERPs içinde, o ölçekte çalışmak, bana hiçbir kursun ya da sertifikanın öğretemeyeceği şeyler öğretti. Bu deneyim, gerçekten iyi bir SEO'nun nasıl göründüğüne dair bakış açımı kökten değiştirdi — ve o günden sonra kurduğum her şeyin temeli oldu.

Bu deneyimden yola çıkarak SEO Alive'ı kurdum — organik büyüme konusunda ciddi olan markalar için bir ajans. Biz dashboards ve aylık raporlar satmak için burada değiliz. Gerçekten fark yaratan stratejiler kurmak için buradayız; klasik SEO'nun en iyi yanlarını Generative Engine Optimization (GEO) denen heyecan verici yeni dünyayla birleştirerek — markanızın yalnızca Google'ın mavi linklerinde değil, aynı zamanda ChatGPT, Perplexity ve Google AI Overviews'un her gün milyonlarca insana sunduğu AI tarafından üretilen cevapların içinde de görünmesini sağlayarak.

Ve bu iki dünyayı düzgün şekilde ele alan bir araç bulamadığım için, kendim bir tane geliştirdim — SEOcrawl, rankings, teknik denetimler, backlinks izleme, crawl sağlığı ve AI marka görünürlüğü takibini tek bir yerde bir araya getiren kurumsal bir SEO intelligence platformu. Hep var olmasını dilediğim platform.

→ David tarafından yazılan tüm yazıları oku
Şu yazarın diğer yazıları: David Kaufmann

Bu yazarın diğer içeriklerini keşfedin