Karriere.at mit semantischer Suche oder nicht?

Do, Nov 19, 2009

Stellenbörsen & Networks

Heute las ich vom neuen karriere.at Relaunch, einer wirklich guten Stellenbörse aus Österreich. Mich hat bei diesem Relaunch vor allem neugierig gemacht, dass man nun eine semantische Jobsuche anbietet.

In der Pressemitteilung spricht karriere.at von:

Höhepunkt des Portal-Relaunchs ist die neue semantische Suchtechnologie, die die Job- und Mitarbeitersuche künftig noch einfacher und effizienter macht.

Weiter im Text spricht man aber von:

Die semantische Technologie wird gestützt von einem Thesaurus, der mehr als 10.000 Suchbegriffe aus dem Jobbereich beinhaltet.

Super dachte ich, denn wirkliche Semantik hat bis heute keine Stellenbörse zu bieten. Lediglich Monster könnte meines Wissens mit solch einer Suche aufwarten, da man Trovix, die ziemlich weit auf dem Feld der Semantik sind, karriereateingekauft haben. Für mal eben 72,5 Millionen Dollar. Das eine Integration gar nicht so einfach ist, zeigt, dass die Technik auch bei Monster noch nicht drin ist. Wenn die Jungs von Karriere.at das nun selber in 18 Monaten auf die Beine gestellt haben, dann aber Hut ab.

Zunächst aber eine, wirklich oberflächliche Beschreibung beider Begriffe, für die Leser, die mit dem Begriff  “Semantische Suche” und/oder Thesaurus nichts anfangen können.

Semantische Suche

Die semantische Suche (Semantik) in der Informatik arbeitet mit einer Logik. Sie erlaubt es Suchanfragen zu stellen, die mehrere Vorgaben enthalten und verbindet diese nicht nur, sondern sucht nach logischen Schlussfolgerungen um ein passendes Ergebnis anzuzeigen. Ein ganz simples Beispiel:

Ich suche einen Job im Bereich Vertrieb ohne Außendienst in der Nähe von Köln

Solch eine Suchanfrage müsste bei einer semantischen Suche zu einem Ergebnis führen, indem nicht nur die Wörter “Job” – “Vertrieb” – “Köln” genutzt werden, sondern die Semantik erkennt, dass ich einen Job suche, also logischerweise Stellenanzeigen in Frage kommen. Außerdem stellt sie Beziehungen zu dem Begriff Vertrieb her und verknüpft diese mit allen in Frage kommenden Angeboten, die unter diesen Begriff fallen. Der Begriff Köln wird dann tatsächlich mit dem Wort Nähe in Verbindung gebracht und man wird Ergebnisse die in einem gewissen Umfeld liegen mit einbeziehen.

Hört sich nicht unbedingt spannend an, aber es geht noch viel besser. Stelle man sich bitte vor, man ist Ingenieur und soll in der Wüste Gobi eine Wasserleitung bauen. Jetzt gibt der gute Mann in die Suche ein:

Wie plane und baue ich eine Wasserleitung durch die Wüste von Gobi?

Als Ergebnis würde die semantische Suche Projektbeschreibungen in annähernd ähnlichen Trockengebieten mit gleicher Bodenbeschaffenheit präsentieren. Dazu noch die passenden Baupläne und eine Auswahl von Spezialisten die so etwas schon mal gemacht haben. Das ist Semantik! Und genau solche Lösungen gibt es tatsächlich. Aber zurück zur Stellenbörse.

Thesaurus

Eine systematische Sammlung von Begriffen in einer Datenbank, die man gegenseitig in Relation setzt, nennt man Thesaurus. Man nimmt also einen Begriff und verknüpft diesen in der Datenbank mit passenden bzw. möglichen anderen Begriffen. Ein Oberbegriff wird z.B. mit einer Vielzahl von Unterbegriffen verknüpft, die wiederum untereinander verbunden werden.

Beispiel:

Das Wort Vertrieb, verknüpft man mit den Wörtern:

  • Verkauf
  • Verkäuferin
  • Außendienst
  • Call Center
  • Account Manager

Wenn man nun in die Suche das Wort “Außendienst” eingibt, bekommt man als Ergebnis Anzeigen, die entweder die obigen Begriffe im Text stehen haben, oder in der Verschlagwortung im System mit einem der Begriffe versehen wurde.

Das gleiche kann man nun auch mit Orten machen. Man nimmt einen Oberbegriff und bricht dann runter. Also Bundesland, wird mit Stadt und PLZ verknüpft. Städte wieder mit PLZ usw. Wer nun in die Suche “Bayern” eingibt wird ebenso fündig wie bei der PLZ 80123.

Zurück zu Karriere.at

Thesaurus Datenbankabfragen werden gerne als semantische Suche beschrieben. Deswegen habe ich mich durch die Pressemitteilung von Karriere.at natürlich auf die Seite gestürzt, um zu sehen was man nun bietet.

Ich vermute durch die Referenzierung im Quellcode, dass man für die neue Suche das Thesaurus System Verity K2 genommen hat. Ein System der älteren Generation das, so glaube ich, für e-Commerce Lösungen entwickelt wurde und seit den 90ern schon auf dem Markt ist. Einer der Vorteile ist, dafür bekommt man eher Programmierer die Erfahrung mit der Verity Query Language haben. Solides Handwerkszeug also.

Die Jobsuche – Praxistest

WAS? und WO? kann, bzw. soll man eingeben. Und hier zeigt sich auch die Stärke eines sauber aufgebauten Thesaurus. Wenn ich “Vertrieb” in WAS? und “Oberösterreich” in WO? eingebe, bekomme ich eine saubere Auswahl von Jobs.

Das Problem ist nur, ich kann mich für einen Job am Bankschalter, oder auch als Fertigungsplaner bewerben. Meine Anfrage war sehr allgemein und gleichzeitig ermittelt die Suche passende Begriffe aus dem Text der Stellenanzeige. Beim Fertigungsplaner steht in der Unternehmensbeschreibung, dass man so und so viele Verkaufsbüros  besitzt. Der Job selber hat also nichts mit Verkauf bzw. Vertrieb zu tun. Aber der Thesaurus hat ganze Arbeit geleistet. Er hat die Beziehung von “Vertrieb” zu “Verkaufsbüros” geknüpft.

Eine Schippe drauf

Die beiden separaten Suchfelder für Job und Ort verleiten mich doch nun mal eine etwas gemeinere Frage zu stellen, die meiner Vorstellung von einer semantischen Suche eher näher kommt. Also gebe ich nun in die Spalte für den Jobtitel den Satz: “Account Manager in der Nähe von Linz” ein.

Und hoppla, es erscheinen tatsächlich 37 Jobs. Die haben aber wenig mit einem Account Manager zu tun, geschweige denn mit Vertrieb. Immerhin wurde Linz erkannt und auch zwei Treffer aus dem Umland sind zu verzeichnen, die  allerdings Linz im Text, bzw. in der Adresse des ausschreibenden Unternehmens stehen haben. Eine fällt ganz aus dem Rahmen. Firma und Job als Sachbearbeiter sind in Wien und auch im Text ist nichts mit Linz zu finden. Wohl ein Fehler in der Verschlagwortung. Kann passieren.

Fazit

Die neue Seite ist optisch und von der Usability toll gemacht. Ich mag Karriere.at. Genial der Twitterfeed auf der Startseite. Das bringt auch Follower, zumal kein dumpfes Jobposting dort drüber läuft. Die groß angekündigte semantische Suche ist für mich allerdings keine. Sollte ich da im Dunkeln oder gar völlig falsch liegen, würde ich mich über erhellende Erklärungen freuen.

Die Treffer sind für mich qualitativ nicht von denen einer Freitextsuche zu unterscheiden. Das heißt nicht, dass sie schlecht wären. Im Gegenteil, halte ich mich an die althergebrachte Art und Weise in WAS? den Jobtitel und in WO? eine Stadt bzw. Ort einzugeben, sind die Treffer sehr gut! Aber für mich heißt es, weiter auf die semantische Suche zu warten, so wie ich sie verstehe.

Bookmark den Artikel: Diese Icons verlinken auf Bookmark Dienste bei denen Nutzer neue Inhalte finden und mit anderen teilen können.
  • Tausendreporter
  • Google Bookmarks
  • TwitThis
  • MisterWong
  • Technorati
  • Y!GG
  • Webnews
  • Digg
  • del.icio.us
  • LinkedIn
  • MySpace
  • Infopirat
  • Bloglines
  • YahooBuzz
  • email
, ,

Der Artikel wurde geschrieben von:

- hat 800 Artikel geschrieben auf blogaboutjob Jobs Karriere Recruiting Arbeit.

Ich heiße Thorsten zur Jacobsmühlen bin freier Recruiting Stratege, Social Media und HR-SEO Evangelist, Autor und Blogger. Ich berate Unternehmen im strategischen Aufbau modernster Methoden im Recruiting. Seit über 10 Jahren im e-Recruiting tätig und seit 1994 im Web.Weitere Infos über die Autorenseite

Kontaktiere den Autor

5 Kommentare dazu:

  1. DerFichtl sagt dazu:

    Ich werd da einfach mal kurzfristig und eigenmächtig drauf antworten, da ich für einige angesprochene Punkte direkt verantwortlich bin.
    Zum Beispiel für das k2-Präfix das ganz einfach (und langweilig) karriere.at 2.0 bedeutet und nix mit dem angesprochenen Verity zu tun hat.

    Erstmal Danke für den ausführlichen Artikel und vor allem für die schön verständliche Erklärung von Semantik.

    Ich sehe es auch so das im Bereich der Jobbörsen derzeit noch keine “echten” symantischen Systeme zu finden sind (zumindest hab ich noch keines gefunden).

    Das liegt wohl auch an den angesprochenen Preisen und das die Technik einfach noch relativ ungenau arbeitet. Darum haben wir und damals auch gegen ein fertiges Produkt entschieden und auf eine Eigenentwicklung gesetzt. Was dabei rausgekommen ist würde ich mal “pragmatische Semantik” taufen.

    Wir haben uns die Teile herausgepickt die wir für wichtig halten und auch in vernünftiger Zeit umzusetzen waren. Wie richtig beschrieben ist das Kernstück ein Thesaurus über den wir Begriffe zusammenführen und Relationen abbilden. Beispielsweise ergeben die Suchen nach “Software Entwickler”, “Software Developer” oder “Software Entwicklung” die gleichen Ergebnisse. Zusätzlich dann man damit auch falsche Schreibweisen abfangen wie zum Beispiel den “Assistant”. Die Relationen werden derzeit nur für die “weiteren Suchvorschläge” verwendet da in manchen Berufsgruppen die Verbindung zwischen den Begriffen zu verwirrenden Ergebnissen geführt haben.

    Bei den Orten verwenden wir den Thesaurus damit wir Suchen nach speziellen Regionen machen können; Beispiel: “Linzer Zentralraum” umfasst Linz, Steyr, Raum Linz, Nähe Linz, usw.

    Das wären mal die Hauptpunkte die unsere “semantische Suche” abdeckt, aber wir sind natürlich ständig am Weiterentwickeln und für jedes Feedback dankbar. Die Semantik in allen Ehren, trotzdem muß man grad in unserem Bereich die Kirche im Dorf lassen, wir haben nunmal nur 6 Linux-Jobs im Linzer Zentralraum da kann mir auch die 500.000 EUR Software nicht mehr Jobs heraussuchen.

    Btw. einen Satz in das linke Feld zu schreiben führt wirklich einfach zu einer Volltext-Suche die wir mit der semantischen Suche gekoppelt haben (quasi als Fallback).

    Ich hoffe ich konnte ein wenig Licht ins Dunkel bringen. Schöne Grüße aus Linz.

    DerFichtl (Michael Feichtinger)
    Software Architect bei karriere.at

  2. Thorsten sagt dazu:

    Hallo Fichtl,

    na, da habe ich mit Verity ja daneben gelegen ;-)
    Du hast recht, dass auch die beste Suche nicht mehr Jobs produziert, wenn keine da sind.
    Das verführt übrigens viele Jobbörsen dazu, die Algorithmen zu lasch zu fassen um genügend Treffer aufzuweisen. Den Bewerbern werden dadurch aber oft nicht zutreffende Jobs präsentiert. Passiert das ein paar mal, wird er aussteigen.
    Das ist bei Euch nicht der Fall. Die Suche ist wie gesagt gut getrimmt. Ihr habt da tolle Arbeit geleistet, das steht außer Frage. Mich hat halt die Pressemitteilung neugierig gemacht, in der von “neuer semantischer Suchtechnologie” und “intelligenter Suchtechnologie” gesprochen wird. Und da muss der Verfasser damit rechnen das er beim Wort genommen wird.

    Ich finde den Umgang mit der Begrifflichkeit im Allgemeinen verdammt irreführend. Eine Autovervollständigung macht ja noch lange keine semantische Suche aus, oder? Wie es aussieht nutzt man das Modewort “semantische Suche” für jede Art der Begriffsverarbeitung, die vom starren Wort bzw. der Volltextsuche abweicht.

    Für dich ist das Thema aber anscheinend ebenso fesselnd wie für mich. Kennst du ConWeaver das am Fraunhofer Institut entwickelt wurde? http://www.conweaver.de/ Die arbeitet unter anderem mit Phrasen und “lernt” aus den Zusammenhängen in den Suchergebnissen. Allerdings kannst du recht haben, dass solch eine Lösung richtig teuer werden kann.

  3. HOKL sagt dazu:

    Hallo Thorsten,

    Erstmals Danke für deinen Blog-Beitrag und deine konstruktive Kritik – und natürlich die hervorragende Erklärung zum Thema Semantik (wenn mir das einer vor knapp 2 Jahren so gut erklären hätte können, wären wir mit unserer Entwicklung wahrscheinlich schneller gewesen :)). Hat mich natürlich sehr gefreut, wenn unsere semantische Suche auch außerhalb Österreichs seine Tester findet.

    Gerne möchte ich mich nun auch deiner Kritik stellen.

    Also erstmals ist Semantik nicht gleich Semantik. Manch einer versteht ein Autocomplete schon als Semantik, ein anderer versteht als Semantik, wenn ich nach einer Wohnung in Salzburg Getreidegasse suche, dass mir auch gleich der passende Maler um die Ecke vorgeschlagen wird.

    Wie derFichtl schon gesagt hat, haben wir einen pragmatischen Zugang zum Thema Semantik gewählt. Anfangs hatten wir durch die Semantik probiert, die Mehrzahl der Anzeigen die wir in der Datenbank haben einfach durch den gewählten Suchbegriff richtig reihen zu lassen, also die relevanten ganz vorne, die unrelevanten ganz hinten. Das heißt, mit jedem Suchbegriff wird praktisch die gesamte Datenmenge einfach umgereiht. Da hat’s dann Kritik von den Usern gegeben, die gemeint haben, dass die Suchergebnisse schlecht sind (Klar, dass man auf Seite 23 nichts mehr relevantes findet).

    Also haben wir uns darauf geeinigt, dass man nur mehr eine wesentlich geringere Menge reihen lässt (also die Ergebnisse früher abschneidet). Aber selbst da waren die User nicht wirklich begeistert. Wir haben festgestellt: Sobald ein User eine Anzeige sieht, die – übertrieben formuliert – gerade schon ein minimales Bisschen vom Suchbegriff abweicht, dass er das Suchergebnis als schlecht klassifiert. Deshalb haben wir uns dann entschieden, die Suchergebnisse noch früher abzuschneiden, sodass jetzt ein relativ enger Begriffsbereich semantisch gesucht wird.

    Das heißt nichts anderes als: Wir haben probiert uns dem Thema Semantik auf wissenschaftlich beschriebene Weise zu nähern. Hat der User nicht gewollt. Dann haben wir die Semantik pragmatisch umgestaltet, jetzt gefällt’s den Usern sehr.

    Natürlich arbeiten wir auch bereits schon wieder an Verbesserungen des Systems, etwa wie man den manuell erstellten Thesaurus – der aus meiner Sicht ohnedies bereits 90% der Semantik ausmacht – um statisische Verfahren optimieren kann.

    Ob wir nun eine nach objektiven Kriterien definierte Semantik integriert haben oder nicht sei dahingestellt. Ich würde behaupten, dass für einen bestimmten Domänen-Bereich (bei uns Jobs), keine weitreichendere Semantik notwendig ist. Das gilt natürlich nicht für ein Portal, das Domänen-übergreifend arbeitet, zum Beispiel für eine Suchmaschine. Die muss für verschiedene Bereiche Infos zusammenknüpfen (Beispiel Wohnung und Maler). Da wird’s wesentlich komplizierter.

    Zum Was und Wo-Feld fällt mir natürlich auch noch was ein (war ja klar, dass ich da auch noch was zu sagen habe :)). Aus unserer Statistik wissen wir, dass 95% der User das eingeben, was das Auto-Complete vorschlägt (bei Google ist es glaube ich mittlerweile eine ähnliche Anzahl, wenn ich mich nicht täusche). Das heißt, dass wir mit ganzen Sätzen im Was-Feld gar nicht arbeiten müssen und uns deshalb eine komplexe Satzerkennung ersparen => pragmatisch eben :)

    Hoffe, ich konnte ein bisschen Licht ins Dunkel bringen und freue mich natürlich gerne auf weitere Kritik und Verbesserungsvorschläge sowieso!!

    lg,
    Hofbauer Klaus (HOKL)
    GF karriere.at

  4. Cornel sagt dazu:

    Hallo zusammen

    Um ein DACH über die Diskussion zu spannen, meldet sich nun – nach Deutschland und Österreich – auch noch die Schweiz zu Wort ;-)

    Ich finde Thorsten’s Erläuterungen zur semantischen Suche gelungen und kann Fichtl’s pragmatische Herangehensweise und Klaus’ Kundenorientierung durchaus verstehen. Wir haben es nicht anders gemacht. Da wir schon etliche Jahre an der Entwicklung einer semantischen Jobsuch- und -Matching-Lösung sind, kann ich gerne ergänzen.

    Doch, es gibt sie, die semantische Jobsuche! Da als B2B-Lösung für Personaldienstleister erst neulich lanciert, ist sie nicht nur Euch nicht bekannt. Als ganz kleiner Bruder davon läuft http://www.jobsucher.ch. Vieles, was das Attribut „semantisch“ verdient, ist noch nicht eingebaut. Dennoch liefert jobsucher.ch dank einem einzigen Element aus der vorhandenen Ontologie (Jobtitel) eine signifikant bessere Ausbeute und eine ebenfalls signifikant bessere Präzision.
    Bei der Ausbeute – und das ist insbesondere bei einer Job-Suchmaschine wichtig – bringt die Suche alles, was von der Bedeutung auch erwünscht ist. Wer eine Verkäufer-Stelle sucht, möchte auch Kundenberater-, Aussendienst-, Sales-, Vendeur-, Account Manager-Vakanzen (sowie weitere 54 Synonyme) präsentiert bekommen.
    Betreffend Präzision möchte ich genau das finden, was ich suche, also definitiv keine Verkaufsassistenz-Stellen.

    Was braucht es für ein semantisches Job-Matching?
    Es braucht eine Domänen-Ontologie (mit mehreren Hunderttausend Begriffen, Relationen, Regeln und abgebildetes Expertenwissen) sowie Technologien der statistischen und linguistischen Informationsextraktion und – je nach Business Case – einen Spider.

    Was ist damit möglich?
    Mit dem Spider lassen sich in der Schweiz ca. 40‘000 Vakanzen finden. Nach der Extraktion auf der Basis der Ontologie können wir diese Vakanzen komplett semantisch „interpretieren“, so dass diese nach diversen Kriterien durchsucht oder gar mit einem CV verglichen werden können. Und endlich ist die Suche nach geforderten Ausbildungen, Skills, Berufserfahrungen, Sprachkenntnisse möglich – und das qualitativ hochstehend! Hier kommt nun das Expertenwissen zum Zuge. Bei einer typischen Formulierung in einer Stellenanzeige „Sie haben einen Hochschulabschluss in Wirtschaftswissenschaften oder vergleichbar“ finden wir per dato über 250 mögliche Abschlüsse, die hier einen Treffer ergeben! Ein Bachelor of Arts in Finance & Accounting erkennt die Maschine genauso als Treffer wie ein lic.oec.HSG, ein Executive MBA oder ein Diplom-Kaufmann.
    Zurück zur „einfachen“ Jobtitel-Suche: Nun lassen sich auch semantische Unterschiede zwischen dem Media Markt-Kundenberater und dem Kundenberater einer Privatbank erkennen und die Matchings werden schon ziemlich gut – so dass auch einmal der Profi ganz schön staunen muss…
    Spannend wird’s – und da kitzelt’s mich ganz besonders – wenn wir spätestens anfangs 2. Q. 2010 die Personalberater-Inserate „dechiffrieren“ können und dem User Hinweise geben können, welches Unternehmen wohl dahinter steckt. Wenn es bei der Personalberater-Anzeige „Unser Kunde, ein international erfolgreiches Unternehmen der Konsumgüterbranche am linken Zürichseeufer…“ heisst: „Das könnte Lindt & Sprüngli sein“.

    Wie lässt sich eine semantische Lösung realisieren?
    Ich meine, dass der Königsweg über eine umfangreiche und ausgeklügelte Ontologie führt. Dadurch, dass wir die hinterste und letzte Vakanz bis zum letzten Buchstaben auseinandergenommen und analysiert haben, ist einiges an Wissen zusammengekommen. Dieses Wissen wurde akribisch und über mehrere Jahre gesammelt und aufbereitet, so dass es nun zur Verfügung steht.
    Dass der Schweizer Bund uns mit einem sechsstelligen Frankenbetrag und mehreren hochqualifizierten Forschern unterstützt, hat uns nicht nur sehr geholfen, sondern Vieles überhaupt erst möglich gemacht!

    Und weil uns geholfen wurde, sind wir gerne bereit, das Wissen, die Erfahrung und die Ontologie zu teilen…

    Über eine Fortsetzung dieser Diskussion, evtl. sogar in einem erweiterten Kreis, freue ich mich.

    En Gruess,

    Cornel

  5. HOKL sagt dazu:

    Hallo Cornel,

    Klingt sehr spannend was ihr da alles gemacht habt und noch vor habt. Also ich hätte da natürlich extremes Interesse an einem gemeinsamen Erfahrungsaustausch. Ich gebe dir mal meinen Kontakt (klaus.hofbauer@karriere.at). Dann können wir uns abseits weiter unterhalten. Würd mich sehr freuen!

    lg,
    HOKL

1 Trackback für diesen Artikel

  1. Tweets die Karriere.at mit semantischer Suche | Karriere.at, semantische suche, Thesaurus | blogaboutjob Jobs Karriere Recruiting Arbeit erwähnt -- Topsy.com sagt dazu:

    [...] Dieser Eintrag wurde auf Twitter von T. zur Jacobsmühlen und Alma Mater, B W erwähnt. B W sagte: Reading: http://twitthis.com/dl2axz [...]

Schreibe Deine Meinung