2016-02-09

Textanalys hjälper oss med matchning!

Johanna arbetar med krav för utvecklingen av textanalys.

Vi har tidigare bloggat om vår nya matchningsmotor, som bland annat kommer att kunna matcha kompetenser. Det innebär en förändring för de arbetsgivare som skickar in annonser automatiskt till oss. Idag berättar vi om hur textanalys ska stötta dessa arbetsgivare. Samtidigt som vi skapar nya möjligheter för matchning med användarens egna ord.

Till grund för vårt arbete ligger flera insikter. Två av dessa är

  • Arbetsgivare vill kunna beskriva kompetenser de har behov av.
  • Arbetssökande vill kunna visa vilka kompetenser de ha.


Detta är basen i den kompetensbaserade matchning vi nu strävar mot.

Vår utmaning
Tidigt i vårt arbete med matchningen identifierades ett problem: många arbetsgivare publicerar sina annonser hos oss automatiskt via ett API. Det gör det möjligt att integrera arbetsgivarnas HR-system med Platsbanken. För att en kompetensbaserad matchning ska vara möjlig behöver dessa arbetsgivare kunna skicka in kompetenser till oss. Detta kräver att system byggs om – både våra egna och de system som arbetsgivarna använder.

Eftersom och arbetsgivare behöver tid för att kunna genomföra denna ombyggnation kommer vi under tiden använda ett textanalysverktyg för att automatiskt kunna hitta kompetenser i annonstexten och omvandla dem till matchningsbar data. Vi befinner oss i en tidig fas av detta arbete och har precis börjat lära systemet att identifiera meningar som beskriver en efterfrågad kompetens.

Upplärningen gör vi manuellt genom att markera ord i platsannonserna och ange vilken klass ordet tillhör, till exempel klassen kompetensord. Detta görs på en stor mängd platsannonser och kan sedan användas som träningsexempel för hur systemet ska klassificera ord i nya platsannonser det aldrig har sett förut.

Vår teknik
Vi använder ett ramverk som heter Stanford Named Entity Recognition (NER) för detta. Stanford NER är en implementation av klassificeraren Conditional Random Fields som brukar användas för mönsterigenkänning.

Framöver kommer vi att titta på om vi kan avgöra hur viktiga kompetenserna är. Det vill säga om de är ett krav eller bara meriterande. Vår hypotes är att vi kan lösa detta genom att träna systemet att känna igen meningar som exempelvis "Du ska kunna…" eller "Det är meriterande om…". Med hjälp av andra ramverk som exempelvis Stanford Relation Extraction eller MaltParser, som är svenskt ramverk för dependensgrammatik, hoppas vi därefter kunna koppla fraserna till kompetensorden. 

Vi lär oss kontinuerligt vad systemet och hur snabbt systemet lär sig. Arbetet är påbörjat men kommer fortsätta under våren.

Möjligheterna
Även när arbetsgivarna byggt om sina system ser vi att vi kommer ha stor användning av ett textanalysverktyg och de data vi kan fånga därigenom. Exempelvis skulle tjänsten kunna användas för att hjälpa arbetsgivare och arbetssökande att fylla i sina matchningsprofiler på arbetsformedlingen.se. Med hjälp av textanalys kan vi också få indikationer på hur väl våra taxonomier motsvarar "verkligheten", vilka begrepp används av arbetssökande och arbetsgivare och hur kan vi göra det lättare att hitta rätt bland våra värdeförråd. Det skulle också kunna ge en indikation om hur arbetsmarknadens efterfrågan av olika kompetenser förändras över tid. 

Möjligheterna är många och vi har precis börjat utforska området.

/ Henrik och Johanna


Publicerad i

Kommentarer
Kommentarerna kommer från våra användare och är inte del av det redaktionella innehållet. När du skickar in en kommentar bekräftar du också att du accepterar våra regler för kommentering
  1. Mimmi
    Ser framemot att använda kompetensbaserad matchning.
    2016-02-10
  2. Cecilia
    Å vad intressant! Och praktiskt, man ser ju ofta att kompetensord saknas i ordrar som kommer automatiskt. Det här låter som en rejäl förbättring!
    2016-03-02
  3. Remco
    Jag har fått möjlighet att testa detta verktyg på en av verksamhetsdagarna i höstas. Är mycket imponerad och ser framemot att både vi och våra kunder kan börja använda detta matchningsverktyg! :)
    2016-03-03
  4. Remco
    Jag har fått möjlighet att testa detta verktyg på en av verksamhetsdagarna i höstas. Är mycket imponerad och ser framemot att både vi och våra kunder kan börja använda detta matchningsverktyg! :)
    2016-03-03
Lämna en kommentar
Lämna en kommentar