CONTACT

[How-To] Je eigen website-scraper met Screaming Frog

Door Christian Broekmeulen op 26 maart 2020

Screaming Frog is een handige tool die veel gebruikt wordt door marketeers voor on-page SEO, zoals het ontdekken van foutieve hyperlinks of ontbrekende meta-tags. Maar Screaming Frog biedt meer mogelijkheden.

Een van die mogelijkheden leg ik stap-voor-stap uit in dit artikel: het verzamelen van (specifieke) gegevens uit websitecontent. Als je Screaming Frog slim inzet, kan je hem gebruiken als slimme ‘webscraper‘ voor het geautomatiseerd verzamelen van content op websites. Denk aan artikelnummers of andere data (zoals e-mailadressen of andere gegevens).

In dit voorbeeld maak ik een uitdraai met van alle producten op een webshop en de daarbij behorende artikelnummers. Maar het principe is toepasbaar voor elk type informatie.

Stap 1: Selector kopiëren met Google Chrome

Browse met Google Chrome naar een productpagina en selecteer de content, in dit geval het artikelnummer dat je wilt onttrekken uit de content en klik op je rechtermuisknop en op Inspecteren.

[How-To] Je eigen website-scraper met Screaming Frog

Je ziet nu een hoop HTML code, zorg ervoor dat je de juiste waarde geselecteerd hebt. Klik vervolgens nogmaals op de waarde met je rechtermuisknop en selecteer Copy > Copy Selector.

[How-To] Je eigen website-scraper met Screaming Frog

In ons geval is de selector “product_addtocart_form > div.product-shop.columns.medium-6.large-7 > ul.inline-list.bonus-info.hide-for-small > li > span“, sla deze selector op, deze hebben we later nodig in Screaming Frog.

Stap 2: Screaming Frog instellen

Open Screaming Frog en open het menu Configuration en selecteer Custom > Extraction.

[How-To] Je eigen website-scraper met Screaming Frog

Vul in het eerste veld de gewenste kolom naam in die terug komt in je uitdraai, in ons geval artikelnummer. Selecteer CSSPath in de dropdown en plak de selector uit stap 1 in het veld. Selecteer vervolgens Extract Text om alleen de waarde binnen de selector als tekst te selecteren.

[How-To] Je eigen website-scraper met Screaming Frog

Klik vervolgens op OK om de instellingen op te slaan.

Stap 3: Start Screaming Frog

Nu start je de Screaming Frog crawler zoals je dat normaal zou doen. Als je helemaal naar rechts scrolled in je resultaten zie je de nieuwe kolom die je in de vorige stap toegevoegd hebt. Als er een waarde is gevonden binnen de selector zal deze waarde in deze kolom terecht komen.

[How-To] Je eigen website-scraper met Screaming Frog

Op eenzelfde manier kun je al het denkbare uit de content halen van je website.

Geen waarde? Probeer XPath

Krijg je in geen gevallen de juiste waarde te zien? Probeer dan XPath in plaats van Selector. Selecteer in Stap 1 Copy XPath in plaats van Selector en selecteer in stap 2 XPath in plaats van CSSPath.

Hulp nodig?

Heb je hulp nodig of kan je wel wat assistentie gebruiken bij een specifieke use-case? We’ve got you covered! Neem contact met ons op. Wij kijken er alvast naar uit.

Online marketing bureau

Online marketing uitbesteden

Met onze data-gedreven aanpak en focus op meetbare resultaten zorgen we ervoor dat jouw marketingbudget maximaal rendeert. Of het nu gaat om campagnes, slimme optimalisaties of baanbrekende innovaties met A.I., wij leveren bewezen impact. Kies voor een team dat jouw groeiambities begrijpt en samenwerkt als verlengstuk van jouw organisatie. Samen maken we online succes waar.

Datagedreven online marketing met resultaat

Wij zijn online marketing 'vakidioten', echte 'nerds'. Wij volgen alle ontwikkelingen op de voet. Ontdek wie wij zijn, waar we voor staan en wat ons bijzonder maakt.

Online marketing team
Rooza Online Marketing heet nu dofollow.
Lees hier meer.

Wij zijn dofollow.
Wegwijs in online marketing.

Wij ben jij?

Willemsplein 44-2
6811 KD Arnhem
Parkeren

dofollow BV
KVK 88435016
IBAN NL11 KNAB 0254 8654 61
BTW NL864624189B01