Stellenanzeigen von Unternehmen werden über sogenanntes Crawling von zahlreichen Stellenbörsen und Jobplattformen in den eigenen Datenpool übernommen. Die vermeintlich kostenfreie zusätzliche Reichweite hat allerdings nicht nur Vorteile. Oftmals überwiegen sogar die Nachteile. Sollte Stellenanzeigen-Crawling daher vielleicht sogar verboten werden? (M)eine ganzheitliche Betrachtung.
Was ist Crawling bzw. Scraping?
Beim sogenannten Crawling werden Web-Inhalte indexiert und für eine Sichtbarkeit in einer Suchmaschine aufbereitet. Es geht also vornehmlich um den Fall von SEO (Search Engine Optimization). Diese Vorgehensweise dürfte in der Regel die Website-Betreiber happy stimmen, denn sie wollen ja gefunden werden.
Beim sogenannten Scraping werden nicht komplette Websites indexiert, sondern einzelne Daten von Unterseiten übernommen und in eine eigene Datenhaltung überführt. Auch hier dient der Daten-Abzug dazu, Inhalte weiteren Dritten zugänglich zu machen.
Unabhängig davon, ob man die Übernahme von Stellenanzeigen auf einer Karriereseite oder sonst im Netz als Crawling (Stellenbörsen sind ja sozusagen „Suchmaschinen für Jobs“) oder Scraping bezeichnet, verwende ich im Folgenden einheitlich den Begriff Crawling.
Warum crawlen Stellenbörsen die Stellenanzeigen von Drittseiten?
Große Stellenbörsen crawlen im Netz frei verfügbare bzw. zugängliche Stellenanzeigen fortlaufend automatisiert.
Damit verfolgen Sie insbesondere folgende Zwecke:
- Mehr Jobs in der eigenen Datenbank (Aggregation) – Versprechen wie: „Wir haben ALLE Jobs auf der Plattform“
- Höherer Traffic, damit weiter steigende Sichtbarkeit, was größere Bedeutung im Markt mit sich bringt, und die erzielbaren Preise für Stellenschaltungen nach oben treibt
- Marktanalysen auf Meta-Ebene oder mit Blick auf einzelne Informationen, z.B. Gehälter, Benefits oder Homeoffice-Möglichkeiten
Weshalb ist Stellenanzeigen Crawling nicht immer positiv?
In Zeiten des Fachkräftemangels sollte man meinen, dass jede zusätzliche Reichweite für die eigene Stellenanzeige positiv wirkt und HR-Verantwortlich froh sein können, dass vor allem große Portale die Job-Ad in die eigene Datenbank aufnehmen. Zumal dieser Service kostenfrei ist und keinerlei Aufwand beim Unternehmen, das die Stelle ausgeschrieben hat, verursacht.
Was aber passiert, wenn das Unternehmen die Stellenanzeige bewusst nur für einen kleinen Teil einer Zielgruppe (z.B. auf der eigenen Website) ausschreibt?
Warum Arbeitgeber so denken sollten, fragen Sie?
Naja, weil eine Stellenanzeige auch immer eine Art Schablone sein soll, für eine Selbstselektion durch die Zielgruppe. Und nicht jede Reichweite ist sinnvoll.
Meine aus dem Praxisleitfaden erfolgreiche Personalgewinnung für KMU bekannte Erfolgsformel im Recruiting lautet:
ERFOLG = ATTRAKTIVITÄT x SICHTBARKEIT
ABER: Sichtbarkeit meint nur eine solche bei relevanten Zielgruppen, da durch eine hohe Ausspielung an die falschen (nicht gewollten) Webnutzer eine Menge Aufwand und sogar ein größerer Schaden erzeugt werden kann.
Bei der Maximierung der Sichtbarkeit einer Stellenanzeige sollten immer nur die RELEVANTEN Zielgruppen im Fokus stehen.
Wenn durch Stellenanzeigen Crawling ein Schaden entsteht
Immer wieder habe ich bei meinen Keynotes auf HR-Events Kontakt mit Personalverantwortlichen aus mittelständischen Unternehmen. Allzu häufig, wenn das Thema auf das Crawling bzw. Scraping zu sprechen kommt, erlebe ich große Verärgerung.
Erst letzte Woche war eine Unternehmerin außer sich vor Ärger, weil eine große internationale Stellenbörse ihre Anzeige gecrawlt hatte und daraufhin
- unzählige Anrufe von Personalberatungen eingingen, die ihre kostenpflichtige Unterstützung gepitcht hatten
- eine Vielzahl von Bewerbungen aus dem fernen Ausland eingingen, die völlig ungeeignet waren für den Einsatz auf der besagten Stelle und teilweise nicht annähernd eine passende Qualifikation hatten
- die Bewerbungen kaum mehr professionell abgewickelt werden konnten, was zu einer negativen kununu-Bewertung geführt hatte, die den Mittelständler deutlich „nach unten gezogen“ hat
Sie suchte dann händeringend nach einer Ansprechperson, um ihre Stellen wieder aus dem Netz nehmen zu lassen. Aber wie das so ist im Internet: Große Stellenbörsen bestücken mit den gefundenen Daten oft auch Google for Jobs, indem sie die Daten per Schema Markup weiterverarbeiten und weitergeben.
Zahlreiche Drittseiten bedienen sich spätestens ebenfalls. So schnell wie eine Stellenanzeige via Crawler kopiert, weiterverarbeitet und im Netz weiter verteilt wurde, ist sie nicht mehr einzufangen.
Alte und nicht passende Stellenanzeigen kursieren ewig
Aus eigener Erfahrung weiß ich, dass Crawling auch nicht immer einwandfrei funktioniert. Wie häufig waren Texte wild durcheinandergewürfelt, falsche Logos eingebaut oder gar fremde Stellen dem eigenen Unternehmen zugeordnet. Dazu hatte ich schon einige Mal im Zusammenhang mit der Arbeitgeberbewertungsplattform Glassdoor geschrieben.
Auch bewerben sich immer wieder Menschen auf komplett veraltete und teilweise längst besetzte Stellenanzeigen – sie melden sich mit Fragen per Mail oder gar telefonisch bei den Recruiting-Verantwortlichen, die die Stellen möglicherweise nicht einmal mehr kennen.
Ein Gau für Employer Branding Aktivitäten.
Wieso ist Stellenanzeigen Crawling nicht verboten?
Jetzt stellt sich ernsthaft die Frage, warum das Stellenanzeigen Crawling nicht verboten ist, wenn doch
- Stellenbörsen unerlaubt die Anzeigen an viel größere Zielgruppen ausspielen
- damit die Verantwortlichen kaum mehr „Macht“ über ihre eigenen Stellenanzeigen haben und mit zahlreichen negativen Auswirkungen zu kämpfen haben
- und das alles nur, weil es zum Geschäftsmodell der Job-Plattformen gehört und sie damit Geld verdienen – quasi mit den Werken der HR-Verantwortlichen?
Könnte das Urheberrecht Stellenanzeigen Crawling verbieten?
Das führt zur Frage, ob nicht das Urheberrecht das Kopieren der Anzeigen, deren Weiterverarbeitung, die Übernahme in die eigene Datenbank, die erneute Veröffentlichung und Weitergabe, z.B. an Google for Jobs verhindern müsste.
Vermutlich mangelt es hier allerdings schon an der sogenannten „Schöpfungshöhe“. Laut Wikipedia sollen über die Schöpfungshöhe zum Beispiel Zufallsentstehungen von einem Urheberrecht ausgenommen werden. Die Schöpfungshöhe ist erst dann gegeben, wenn eine dem Schöpfer zuzurechnende Individualität des Werkes gegeben ist.
Und spätestens jetzt ahnen Sie, dass es mit dem Urheberrechtsschutz nicht so weit her ist bei Stellenanzeigen in Deutschland. Das gilt um so mehr, wenn Sie diese über KI-Lösungen erstellen lassen. Damit wird sie vielleicht kreativer, dürften aber erstrecht nicht mehr dem Schutz unterliegen.
Insofern dürfte vom Urheberrecht wenig zu erwarten sein. Zumal man auch argumentieren könnte, dass im Regelfall doch ein Interesse des Unternehmens an einer möglichst weiten Verbreitung der Anzeige bestehen sollte und das Gegenteil eher die Ausnahme darstelle.
Was schützt vor Stellenanzeigen Crawling?
Nun bleibt die Frage offen, wie Sie sich nun vor Stellenanzeigen Crawling schützen können. Stand heute bleiben eher rudimentäre technische Möglichkeiten:
Die sogenannte robot.txt zeigt im Quelltext von Webseiten an, ob Crawler die Inhalte indizieren und verwenden können sollen. Ein „index“ oder ein „noindex“ Befehl erzeugt allerdings keine verbindliche Vorgabe für die Crawler bzw. verhindert den technisch Datenabgriff nicht.
Das gilt übrigens genauso für Google selbst und nicht nur für die Job-Plattformen und Stellenbörsen.
Wenn Sie sich mit Technik auskennen (oder wissen, wie Sie mit ChatGPT prompten müssen), könnten Sie ein paar ausgefeiltere Anti-Scraping-Techniken anwenden, z.B.
- IP-Sperren
- Aufspüren verdächtiger Browser-Aktivitäten
- Verwendung von sog. Captchas, um nur menschlichen Besuchenden Zugriff zu erlauben
Allerdings hilft auch das wenig, wenn Sie dann doch selbst eine kostenpflichtige Schaltung Ihrer Stellenanzeige auf einer Plattform buchen – und diese dann zu Google for Jobs wandern oder von dort ein Crawler die Daten abgreift.
Mein Fazit zum ungewollten Stellenanzeigen Crawling
Es ist und bleibt ein schwieriges Thema. Vielfach profitieren HR-Verantwortliche von dieser Vorgehensweise. Andere erleiden gar einen Schaden. Die meisten mittelständischen Unternehmen oder auch Selbstständigen dürften wenig, bis kein Wissen haben, um technische Maßnahmen so akkurat auszurichten, damit sie die Hoheit über die eigenen Stellenanzeigen behalten.
Tatsächlich ist es eh nahezu unmöglich, Stellenanzeigen Crawling zu verhindern.
Betroffene sind darauf angewiesen, im Falle eines Falles auf den jeweiligen Plattformbetreiber zuzugehen, der die Stelle ungewollt veröffentlicht hat und quasi ein nachträgliches „Opt-Out“ bzw. „Delisting“ vornehmen zu lassen.
Die Krux dabei: viele Anbieter haben kaum mehr klassische Hotlines oder einen menschlichen Service, dem sie diesen Auftrag erteilen können.
Da sitzen die Anbieter am deutlich längeren Hebel – allerdings sind auch diese auf ihr Image bedacht und reagieren vermutlich spätestens, wenn es auf Bewertungsplattformen massenhaft zu Beschwerden kommt.
Ein tatsächliches Verbot ist hingegen nicht in Sicht.
Aber was würden Sie davon halten, wenn es eine entsprechende Petition dazu gäbe …?