Wat is gescrapte inhoud?

Geschraapte inhoud (content scraping, web scraping en data scraping) verwijst naar inhoud die van de ene site is gehaald en op een andere site opnieuw is gepubliceerd zonder toestemming van de auteur of uitgever. De inhoud kan handmatig worden gekopieerd of automatisch met behulp van scraperbots. 

Het scrapen van inhoud is controversieel, omdat het vaak juridische en ethische vragen oproept over plagiaat, schending van auteursrecht en het ongeoorloofde gebruik van bedrijfseigen informatie.

Inhoud scrapen zonder toestemming van de uitgever en deze opnieuw gebruiken is plagiaat. Het is onethisch en in strijd met de richtlijnen van zoekmachines. Geschraapte inhoud kan een negatieve invloed hebben op SEO omdat zoekmachines de voorkeur geven aan originele en unieke inhoud boven gestolen of dubbele inhoud.

Geschraapte inhoud wordt zo genoemd omdat het van de originele site wordt gekopieerd met behulp van schrapsoftware. De scraping software bezoekt de doelpagina en crawlt deze om de inhoud eruit te halen. Als dat gebeurd is, wordt het opgeslagen in een database, van waaruit het opnieuw wordt gepubliceerd.

Belang van gescrapte inhoud

Geschraapte inhoud heeft geen voordelen voor SEO. Het is een zwarte hoed SEO techniek en schendt Basisbeginselen van Google Zoeken spambeleid. Het is controversieel en wordt als onethisch beschouwd. In bepaalde regio's kan het ook illegaal zijn.

Geschraapte inhoud, zelfs als deze is bewerkt, wordt beschouwd als plagiaat en kan ertoe leiden dat Google je een waarschuwing geeft. handmatige actie straf. Als dat gebeurt, zal Google uw site degraderen en mogelijk zelfs verwijderen van zoekresultatenpagina's.

Sommige sites kunnen ook de code van de website scrapen. In dit geval gebruiken ze het om een valse site te maken die de originele site nabootst als onderdeel van een zoekmachinevergiftiging campagne.

Veel black hat bloggers blijven echter geschraapte inhoud gebruiken om de inhoud en webpagina's op hun sites te vergroten. Met geschraapte inhoud kunnen ze binnen een paar seconden nieuwe inhoud op hun sites publiceren in plaats van de inhoud zelf te maken, wat veel tijd kost om te maken en te publiceren. 

Sommige bloggers en marketeers kunnen echter ethische redenen hebben om een site te scrapen. In dit geval wordt de inhoud gecrawld en geschraapt, maar niet opnieuw gepubliceerd door de uitgever. In plaats daarvan wordt het gebruikt voor andere niet-SEO doeleinden. 

Het is bijvoorbeeld handig voor academisch en marketingonderzoek, prijsvergelijking, SEO-analyse, leadgeneratie, trendmonitoring en concurrentieanalyse.

Hoe contentscrapers werken

Content scrapers gebruiken software genaamd web crawlers of bots om gegevens van websites te halen. Deze tools sturen HTTP-verzoeken naar servers, net zoals een gewone webbrowser dat zou doen.

Zodra de server een HTTP-antwoordcode en inhoud, analyseert de scraper de HTML-code van de webpagina en extraheert de inhoud en elementen die het nodig heeft voordat het deze opslaat in een database of spreadsheet.

Sommige scraperbots zijn ook geavanceerd genoeg om de gegevens in te vullen die een site nodig heeft. Hierdoor krijgen ze toegang tot gated content waarbij bezoekers hun e-mailadres of inloggegevens moeten invoeren voordat ze toegang krijgen tot inhoud.

Andere soorten scrapen

Geschraapte inhoud wordt meestal gebruikt om te verwijzen naar inhoud die van de ene site is geschraapt en op een andere site opnieuw wordt gepubliceerd. Webscrapers kunnen echter ook andere soorten inhoud scrapen voor ethische doeleinden, waaronder: 

1 Contacten

Webscrapers kunnen sites scrapen naar namen, adressen, telefoonnummers en e-mails als onderdeel van een leadgeneratiecampagne. Dit is meestal nuttig voor marketingdoeleinden.

2 Productomschrijvingen

Webscrapers kunnen productbeschrijvingen scrapen als onderdeel van een trefwoordenanalyse of marketingonderzoek naar een product- of e-commercesite. De scrapers kunnen ook recensies en beoordelingen scrapen als onderdeel van het marktonderzoek. 

3 Prijzen

Sommige e-commercesites scrapen prijzen van meerdere sites en gebruiken die dan om hun prijzen aan te passen. Sommige vergelijkingssites kunnen ook prijzen van meerdere sites scrapen en deze presenteren aan bezoekers die prijzen willen vergelijken.

🇳🇱 Nederlands