Dubbele content en SEO: de ultieme gids

22 maart 2022

Dubbele content verwijst naar zeer vergelijkbare of exact dezelfde content die zich op meerdere pagina's bevindt. Houd hier rekening mee:

  • Wat is dubbele content?

Strikt genomen verwijst dubbele content naar zeer vergelijkbare of exact dezelfde content die zich op meerdere pagina's binnen uw eigen website of op andere websites bevindt.

In het algemeen genomen, is dubbele content content die weinig tot geen waarde toevoegt voor uw bezoekers. Daarom worden pagina's met weinig tot geen content ook als dubbele content beschouwd.

Search engine robots get confused by duplicate content.

De robots van zoekmachines raken in de war door dubbele content.

Waarom is dubbele content slecht voor SEO?

Dubbele content is om twee redenen slecht:

  1. als er verschillende versies van content beschikbaar zijn, is het voor zoekmachines moeilijk om te bepalen welke versie ze moeten indexeren en vervolgens in hun zoekresultaten weergeven. Dit verlaagt de prestaties voor alle versies van de content, omdat ze met elkaar concurreren.
  2. Zoekmachines zullen moeite hebben met het consolideren van linkstatistieken (autoriteit, relevantie en vertrouwen) voor de content, vooral wanneer andere websites naar meer dan één versie van die content linken.

Dubbele content kan ernstige SEO-problemen veroorzaken en tegenstrijdige signalen naar zoekmachines sturen. Neem de juiste maatregelen om ervoor te zorgen dat uw content unieke URL's heeft, zodat elke pagina de beste kans krijgt om goed te scoren en verkeer naar uw site te leiden.

Kan ik een boete voor dubbele content krijgen?

Het hebben van dubbele content kan je SEO-prestaties schaden, maar je krijgt er geen boete van Google als je niet opzettelijk de website van iemand anders hebt gekopieerd. Als u een eerlijke website-eigenaar bent met een aantal technische website-uitdagingen, en u probeert Google niet voor de gek te houden, hoeft u zich geen zorgen te maken dat u een boete van Google krijgt.

Als je grote hoeveelheden content van andere mensen hebt gekopieerd, loop je een dunne lijn. Dit is wat Google erover zegt

(opent in een nieuw tabblad)

“Dubbele content op een site is geen reden voor actie op die site, tenzij blijkt dat de bedoeling van de dubbele content is om misleidend te zijn en de resultaten van zoekmachines te manipuleren. Als uw site problemen heeft met dubbele content en u het bovenstaande advies niet opvolgt, doen we er goed aan om een versie van de content te kiezen voor weergave in onze zoekresultaten. "

Mensen hebben vaak een misvatting over dubbele content. Als ik telkens een kwart had als ik een SEO hoorde zeggen dat dubbele content je een Panda-boete zou opleveren, zou ik minstens $ 50 hebben. Dat is een grap. Kleine industrie.

Hoe dan ook, als u een of twee, minder belangrijke pagina's met dubbele content heeft, hoeft u zich nergens zorgen over te maken. De echte problemen doen zich voor wanneer uw eigen website massa's dubbele content genereert vanwege slechte webontwikkeling en technische SEO-problemen. Deze kunnen leiden tot complicaties bij het crawlen en verkeersproblemen. Dubbele content kan ook zorgwekkend zijn als een ander domein uw content schraapt en die pagina's de uwe overtreffen, wat zelden het geval is, maar het gebeurt wel!

Ten slotte is de grootste zorg met dubbele content waarschijnlijk met betrekking tot de verwatering van backlinks die daardoor optreden. Als ik twee versies van dezelfde pagina heb en gebruikers weten niet welke de 'hoofd'-pagina is, dan ontvangt deze mogelijk backlinks en de andere niet. Op deze manier wordt deze, in plaats van één pagina met alle backlinks, opgesplitst over twee of meer pagina's. Geen bueno.

Wist je dat 25-30% van het web dubbele content is, en dat is oké! U wordt er niet door bestraft en hoewel ik er vast van overtuigd ben dat u moet specificeren hoe u met de duplicaten omgaat, als u niets doet, heeft Google vele manieren waarop ze proberen de duplicatieproblemen voor u op te lossen. Ik zou er niet te veel druk over maken, tenzij je iets doet dat grote problemen kan veroorzaken, zoals het schrapen van content van andere websites.

Wat is de meest voorkomende oplossing voor dubbele content?

In veel gevallen is de beste manier om dubbele content op te lossen, het implementeren van 301-omleidingen van de niet-voorkeursversies van URL's naar de voorkeursversies.

301 redirect: permanently moved content

301-omleiding: permanent verplaatste content

Wanneer URL's toegankelijk moeten blijven voor bezoekers, kunt u geen omleiding gebruiken, maar u kunt een canonieke URL of een robots noindex- omleiding gebruiken. Met de canonieke URL kun je sommige signalen consolideren, terwijl de robots noindex-richtlijn dat niet doet.

Kies je wapen om dubbele content zorgvuldig te bestrijden, want ze hebben allemaal hun voor- en nadelen. Er is geen "one size fits all" -benadering voor dubbele content.

Neem het onderstaande gedeelte door om meer te weten te komen over de verschillende oorzaken van dubbele content en om te zien welke methode het beste past.

Veelvoorkomende oorzaken van dubbele content

Dubbele content is vaak te wijten aan een onjuist ingestelde webserver of website. Deze gebeurtenissen zijn technisch van aard en zullen waarschijnlijk nooit resulteren in een boete van Google. Ze kunnen uw ranglijst echter ernstig schaden, dus het is belangrijk om er een prioriteit van te maken om ze te corrigeren.

Maar naast technische oorzaken zijn er ook door mensen aangestuurde oorzaken: content die met opzet wordt gekopieerd en elders wordt gepubliceerd. Zoals we al zeiden, kunnen deze straffen opleveren als ze kwaadwillende bedoelingen hebben.

Dubbele content vanwege technische redenen

Niet-www versus www en HTTP versus HTTPs

Stel dat u het www- subdomein en HTTPs gebruikt. Dan is uw voorkeursmanier om uw content tevia presenterenhttps://www.example.com. Dit is uw canonieke domein.

Als uw webserver slecht is geconfigureerd, is uw content mogelijk ook toegankelijk via:

Duplicate content due to different canonical domains.

Dubbele content vanwege verschillende canonieke domeinen.

Kies een geprefereerde manier om uw content weer te geven en implementeer 301-omleidingen voor niet-geprefereerde manieren die naar de voorkeursversie leiden: https://www.example.com.

URL-structuur:

hoofdletters" class="redactor-autoparser-object">https://www.example.com.

en kleine letters Voor Google zijn URL's hoofdlettergevoelig. Dit betekent dat https://example.com/url-a/" class="redactor-autoparser-object">https://example.com/url-a/ en https://example.com/url-A/ als verschillende URL's worden gezien. Wanneer u links maakt, is het gemakkelijk om een typefout te maken, waardoor beide versies van de URL worden geïndexeerd. Houd er rekening mee dat URL's niet hoofdlettergevoelig zijn voor Bing.


Een schuine streep naar voren (/) aan het einde van een URL wordt eenaan het einde genoemd schuine streep. Vaak zijn URL's hier via beide varianten toegankelijk: https://example.com/url-a en https://example.com/url-a/" class="redactor-autoparser-object">https://example.com/url-a/.

Duplicate content due to inconsistencies in URL casing and trailing slash usage.

Dubbele content als gevolg van inconsistenties in het gebruik van hoofdletters en kleine letters aan het einde van de URL.

Kies een voorkeursstructuur voor uw URL's en implementeer voor niet-voorkeurs-URL-versies een 301-omleiding naar de voorkeurs-URL-versie.

Bij het consolideren van dubbele content gaat het niet om het vermijden van boetes van Google. Het gaat om het bouwen van links. Links zijn waardevol voor SEO-prestaties, maar als links op dubbele pagina's terechtkomen, helpen ze u niet. Ze gaan verloren.



Indexpagina's (index.html, index.php)

Zonder uw medeweten kan uw homepage toegankelijk zijn via meerdere URL's omdat uw webserver verkeerd is geconfigureerd . Naast https://www.example.com is uw homepage mogelijk ook toegankelijk via:

Kies een voorkeursmanier om uw startpagina te bedienen en implementeer 301-omleidingen van niet-voorkeursversies naar de voorkeursversie.

Als uw website een van deze URL's gebruikt om content weer te geven, zorg er dan voor dat u deze pagina's canoniek maakt, omdat het omleiden ervan de pagina's zou breken.

Parameters voor het filteren

Websites gebruiken vaak parameters in URL's, zodat ze filterfunctionaliteit kunnen bieden. Neem deze URL bijvoorbeeld:

https://www.example.com/toys/cars?colour=black

Deze pagina zou alle zwarte speelgoedauto's tonen.

Hoewel dit prima is voor bezoekers, kan het grote problemen veroorzaken voor zoekmachines. Filteropties genereren vaak een vrijwel oneindig aantal combinaties wanneer er meer dan één filteroptie beschikbaar is. Temeer omdat de parameters ook kunnen worden herschikt.

Deze twee URL's zouden exact dezelfde content tonen:

Duplicate content due to different order of URL parameters.

dubbele content vanwege een verschillende volgorde van URL-parameters.

Implementeer canonieke URL's - één voor elke ongefilterde hoofdpagina - om dubbele content te voorkomen en de autoriteit van de door het filter geleverde pagina te consolideren. Houd er rekening mee dat dit geenvoorkomt crawlbudget problemen met het. U kunt ook de parameterafhandelingsfunctionaliteit in Google Search Console en Bing Webmaster Tools gebruiken om hun crawlers te instrueren hoe ze met parameters moeten omgaan.

Dubbele content is het meest doordringende en verkeerd begrepen SEO-probleem. Er zijn zoveel vormen van duplicatie waar u op moet letten, en een kleine technische fout kan leiden tot letterlijk duizenden dubbele pagina's. Canonical is niet altijd de juiste oplossing, en dit artikel van ContentKing doet geweldig werk door het probleem en de oplossing voor tientallen veelvoorkomende problemen met dubbele content te identificeren.

Ik heb zeer succesvolle websites zien gedwarsboomd door dubbele content. In deze gevallen kan het oplossen van de problemen die alleen al tot dubbele content leiden, vaak resulteren in een toename van 20% of meer in organisch verkeer. Als u miljoenen bezoekers heeft, kan dat honderdduizenden extra inkomsten opleveren.

Taxonomieën

Een taxonomie is een groeperingsmechanisme om content te classificeren. Ze worden vaak gebruikt in Content Management Systemen om categorieën en tags te ondersteunen.

Stel dat u een blogpost heeft die in drie categorieën is ingedeeld. De blogpost is mogelijk toegankelijk via alle drie:

Duplicate content due to pages being in multiple categories.

Dubbele content omdat pagina's in meerdere categorieën zijn.

Zorg ervoor dat u een van deze categorieën als de primaire categorie kiest, en zorg ervoor dat de anderen canoniek worden aangepast aan die categorie met behulp van de canonieke URL.

Dupliceren is een enorm probleem voor veel oudere platforms die te zwaar zijn ingesteld om te vertrouwen op parameters voor interne paginastructuur, maar het is ook een probleem voor nieuwere platforms zoals WordPress met / tag / pagina's die vaak het beste vanaf het begin niet geïndexeerd kunnen worden.

David Iwanow, Travel Network

(opent in een nieuw tabblad)

Speciale pagina's voor afbeeldingen

Sommige Content Management Systemen maken een aparte pagina voor elke afbeelding. Deze pagina toont vaak alleen de afbeelding op een verder lege pagina. Omdat deze pagina geen andere content heeft, lijkt deze erg op alle andere afbeeldingspagina's en komt het dus neer op dubbele content.

Schakel indien mogelijk de functie uit om afbeeldingen speciale pagina's te geven. Als dat niet mogelijk is, is het op één na beste om een meta robots noindex-attribuut aan de pagina toe te voegen.

Reactiepagina's

Als u reacties heeft ingeschakeld op uw website, kan het zijn dat u deze na een bepaald bedrag automatisch pagineert. De gepagineerde commentaarpagina's tonen de originele content; alleen de opmerkingen onderaan zullen anders zijn.

De artikel-URL die opmerkingen 1-20 laat zien, kan bijvoorbeeld https://www.example.com/category/topic/ zijn, met https://www.example.com/category/topic/comments-2/ voor opmerkingen 21-40, en https://www.example.com/category/topic/comments-3/ voor opmerkingen 41-60.

Gebruik de paginatielinkrelaties om aan te geven dat dit een reeks gepagineerde pagina's is.

Lokalisatie en hreflang

Als het op lokalisatie aankomt, kunnen er dubbele contentsproblemen ontstaan wanneer u exact dezelfde content gebruikt om mensen in verschillende regio's te targeten die dezelfde taal spreken.

Bijvoorbeeld: wanneer u een speciale website heeft voor de Canadese markt en ook een voor de Amerikaanse markt - beide in het Engels - is de kans groot dat er veel duplicatie in de content zit.

Google kan dit goed detecteren en vouwt deze resultaten meestal samen. Het hreflang- kenmerk helpt dubbele content te voorkomen. Dus als u dezelfde content voor verschillende doelgroepen gebruikt, zorg er dan voor dat u hreflang implementeert als onderdeel van een solide internationale SEO-strategie.

Het grootste probleem met dubbele content is dat Google de context verkeerd begrijpt en dat bezoekers op de verkeerde pagina terechtkomen. Dit gebeurde in het verleden met een klant waarbij Google het verschil tussen Londen, VK en Londen, Ontario, Canada niet kon begrijpen, omdat de content 85-90% vergelijkbaar was.

Indexeerbare pagina

's met zoekresultaten Veel websites bieden zoekfunctionaliteit, waardoor bezoekers de content van de website kunnen doorzoeken. De pagina's waarop de zoekresultaten worden weergegeven, lijken allemaal erg op elkaar en bieden in de meeste gevallen geen enkele waarde voor zoekmachines. Daarom wil je niet dat ze indexeerbaar zijn voor zoekmachines.

Voorkom dat zoekmachines de pagina's met zoekresultaten indexeren door het meta robots noindex-attribuut te gebruiken. En ook in het algemeen is het een goede gewoonte om niet naar uw pagina's met zoekresultaten te linken.

In het geval van een groot aantal pagina's met zoekresultaten die door zoekmachines worden gecrawld, is het raadzaam om te voorkomen dat zoekmachines deze in de eerste plaats openen met behulp van het robots.txt-bestand.

Indexeerbare staging- / testomgeving

Het is ook een best practice om staging-omgevingen te gebruiken voor het uitrollen en testen van nieuwe functies op websites. Maar deze worden vaak ten onrechte toegankelijk en indexeerbaar gelaten voor zoekmachines.

Duplicate content due to multiple environments being publicly available.

Dubbele content doordat meerdere omgevingen openbaar beschikbaar zijn.

Gebruik HTTP-verificatie om toegang tot staging- / testomgevingen te voorkomen. Een bijkomend voordeel hiervan is dat u voorkomt dat de verkeerde mensen er ook toegang toe krijgen.

Mocht uw staging- / testomgeving ooit geïndexeerd worden, volg dan de stappen die in deze URL-verwijderingsgids worden beschreven om ze snel te verwijderen.

Vermijd het publiceren van werk-in-uitvoering-content.

Als u een nieuwe pagina maakt die weinig content bevat, sla deze dan op zonder deze nog te publiceren. Vaak levert het weinig tot geen waarde op.

Sla onafgemaakte pagina's op als concept. Als je pagina's met beperkte content moet publiceren, voorkom dan dat zoekmachines indexeren ze: gebruik het meta robots noindex-attribuut.

Parameters die worden gebruikt voor tracking

Parameters worden ook vaak gebruikt voor trackingdoeleinden. Bij het delen van URL's op Twitter wordt bijvoorbeeld de bron aan de URL toegevoegd. Dit is een andere bron van dubbele content. Neem bijvoorbeeld deze URL die is getweet met Buffer:

https://www.contentkingapp.com... is een best practice om zelfreferenties te implementeren canonieke URL's op pagina's. Als je dat al hebt gedaan, lost dit het probleem op. Alle URL's met deze trackingparameters worden standaard canoniek gemaakt naar de versie zonder de parameters.

Sessie-ID's

Sessies kunnen bezoekersinformatie opslaan voor webanalyse. Als aan elke URL die een bezoeker vraagt een sessie-ID wordt toegevoegd, ontstaat er veel dubbele content, omdat de content op deze URL's exact hetzelfde is.

Als u bijvoorbeeld doorklikt naar een gelokaliseerde versie van onze website, voegen we een Google Analytics-sessievariabele toe zoals https://www.contentking.nl/?_ga=2.41368868.703611965.1506241071-1067501800.1494424269. Het toont de startpagina met exact dezelfde content, alleen op een andere URL.

Nogmaals: het is een best practice om zelfverwijzende canonieke URL's op pagina's te implementeren. Als je dat al hebt gedaan, lost dit het probleem op. Alle URL's met deze trackingparameters worden standaard canoniek gemaakt naar de versie zonder de parameters.

Printvriendelijke versie

Wanneer pagina's een printvriendelijke versie hebben op een aparte URL, zijn er in wezen twee versies van dezelfde content. Stel je dit voor: https://www.example.com/some-page/ en https://www.example.com/print/some-page/.

Implementeer een canonieke URL die van de printvriendelijke versie naar de normale versie van de pagina leidt.

Dubbele content veroorzaakt door gekopieerde content

Bestemmingspagina's voor betaald zoeken

Betaald zoeken vereist speciale bestemmingspagina's die zijn gericht op specifieke zoekwoorden. De landingspagina's zijn vaak kopieën van originele pagina's, die vervolgens worden aangepast om op deze specifieke zoekwoorden te richten. Omdat deze pagina's erg op elkaar lijken, produceren ze dubbele content als ze worden geïndexeerd door zoekmachines.

Duplicate content due to minor differences between landing pages.

Dubbele content vanwege kleine verschillen tussen bestemmingspagina's.

Voorkom dat zoekmachines de bestemmingspagina's indexeren door het meta robots noindex-attribuut te implementeren. Over het algemeen is het een goede gewoonte om geen links naar uw bestemmingspagina's te plaatsen of deze op te nemen in uw XML-sitemap.

Andere partijen die uw content kopiëren

Dubbele content kan ook afkomstig zijn van anderen die uw content kopiëren en elders publiceren. Dit is met name een probleem als uw website een lage domeinautoriteitheeft en degene die uw content kopieert een hogere domeinautoriteit heeft. Websites met een hogere domeinautoriteit worden vaak vaker gecrawld, waardoor de gekopieerde content als eerste wordt gecrawld op de website van degene die de content heeft gekopieerd. Ze kunnen nu worden gezien als de oorspronkelijke auteur en boven u staan.

Zorg ervoor dat andere websites u crediteren door zowel een canonieke URL te implementeren die naar uw pagina leidt als naar uw pagina. Als ze dit niet willen, kun je een DMCA-verzoek naar Google sturen

(opent in een nieuw tabblad)

 en / of juridische stappen ondernemen.

content kopiëren van andere websites Het

kopiëren van content van andere websites is ook een vorm van dubbele content. Google heeft gedocumenteerd

(opent in een nieuw tabblad)

 hoe je dit het beste kunt aanpakken vanuit een SEO-oogpunt: linken naar de originele bron, gecombineerd met een canonieke URL of een meta robots noindex- tag. Houd er rekening mee dat niet alle website-eigenaren blij zijn met het publiceren van hun content, dus het wordt aanbevolen om toestemming te vragen voor het gebruik van hun content.

Het vinden van duplicate content

Finding duplicate content binnen uw eigen websitevan

met behulpContentKing, kunt u gemakkelijk vinden duplicate content door te controleren of uw pagina's hebben een unieke pagina titel, meta descriptionen H1kop.U kunt dit doen door naar de sectie Problemen te gaan en de kaarten "Meta-informatie" en "contentskoppen" te openen. Kijk of er openstaande problemen zijn met betrekking tot:

  • "Paginatitel is niet uniek"
  • "Metabeschrijving is niet uniek"
  • "H1-kop is niet uniek"

Test uw website snel op dubbele content

Met ContentKing kunt u eenvoudig testen of uw website lijdt aan dubbele content problemen. U kunt binnen 20 seconden aan de slag.

Domain

Laden

Controleer duplicate content

geen installatie nodig

Google Search Console Index Coverage rapport komt ook goed van pas bij het vinden van duplicate content op uw site. Let op de volgende problemen:

Dubbele content buiten uw eigen website zoeken

Als u een kleine website heeft, kunt u in Google zoeken naar woordgroepen tussen aanhalingstekens. Als ik bijvoorbeeld wil zien of er andere versies van dit artikel zijn, kan ik zoeken naar "Met ContentKing kun je gemakkelijk dubbele content vinden door te controleren of je pagina's een unieke paginatitel, metabeschrijving en H1-kop hebben. "

Veelgestelde vragen over dubbele content

  1. Kan ik een boete krijgen voor dubbele content?
  2. Zal het oplossen van dubbele contentsproblemen mijn ranglijst verbeteren?
  3. Hoeveel dubbele content is acceptabel?

⚠️ Kan ik een boete krijgen voor het hebben van dubbele content?

Als je niet opzettelijk iemands website hebt gekopieerd, is het zeer onwaarschijnlijk dat je een dubbele contentstraf krijgt. Als je grote hoeveelheden content van andere mensen hebt gekopieerd, loop je een dunne lijn. Dit is wat Google erover zegt

dubbele content op een site is geen reden voor actie op die site, tenzij het lijkt alsof de bedoeling van de dubbele content is om misleidend te zijn en de resultaten van zoekmachines te manipuleren. Als uw site te kampen heeft met dubbele contentsproblemen en u het bovenstaande advies niet opvolgt, doen we er goed aan om een versie van de content te kiezen om in onze zoekresultaten weer te geven.

🔧 Zal het oplossen van dubbele contentsproblemen mijn ranglijst verbeteren?

Ja, want door de dubbele contentsproblemen op te lossen, vertel je zoekmachines welke pagina's ze echt zouden moeten crawlen, indexeren en rangschikken.

U voorkomt ook dat zoekmachines hunbesteden crawlbudget voor uw websiteaan irrelevante dubbele pagina's. Ze kunnen zich concentreren op de unieke content op uw website waarvoor u wilt rangschikken.

🧮 Hoeveel dubbele content is acceptabel?

Er is geen goed antwoord op deze vraag. Echter:

als u wilt rangschikken met een pagina, moet deze waardevol zijn voor uw bezoekers en unieke content hebben.

Als je meer wilt blijven lezen over dubbele content, raden we je aan deze bronnen te bekijken:


Gebruik de gratis zoekwoord tool

Boost SEO results with powerful keyword research

Gratis zoekwoord tool

Wil je hoger in Google komen?

Linktopics laat zien hoe je je website eenvoudig hoger in Google krijgt en meer verkeer naar je website krijgt.