Relevante zoekresultaten door middel van ranking

Het is bijna traditie in de bibliotheekwereld dat er (eindeloos) wordt getweakt aan allerlei ranking-parameters. Dit is echter een doodlopende weg, daarom heeft de NBC+ een topic rank en een static rank geïntroduceerd.

Topic rank
Topic ranking heeft alles te maken met de functionele/technische integratie van verschillende types objecten in één search engine. De NBC+ beschikt over verschillende soorten objecten zoals boeken, muziek, krantenartikelen, evenementen e.d. De uitdaging is om het ene object niet dominanter te laten zijn dan het andere. Miljoenen krantenartikelen kunnen eenvoudig honderden events overschaduwen.

Dit is opgelost door te denken over objecten alsof ze een relevantie hebben ten opzichte van een onderwerp (de topic rank). Daarmee wordt afgestapt van de traditionele gedachte dat hoe vaker de zoekterm in een object voorkomt, hoe hoger de score (term frequentie) is. Dit geeft een goede basis voor de volgende stap, de static rank.

Met een topic rank ontstaat een ranking met een technische waarheid. De algoritmes vinden een bepaalde relevantie en hebben daarin op een bepaalde manier altijd gelijk. Zo vinden deze algoritmes bij de zoekopdracht “tirza” verschillende groepen resultaten die allemaal even relevant zijn (boek “Tirza” van Grunberg, serie jeugdboeken met Tirza in de hoofdrol, etc). Maar collectiebeheerders willen soms bepaalde resultaten meer onder de aandacht brengen.

Static rank
De oplossing hiervoor is een static rank. Dit is een aparte index met hierin een rank voor elk object. Deze rank wordt statisch bepaald aan de hand van verschillende eigenschappen van het object of simpelweg volgens de wens van de beheerder. Bij het zoeken kan deze ranking worden meegenomen om de resultaten, na de toepassingen van de topic rank, te herwegen.

Statisch maar wel dynamisch
De beheerder kan heel specifiek aan de hand van allerlei mogelijke wensen de ranking doorvoeren. Boeken scoren bijvoorbeeld iets hoger, net als recente objecten en alle Nederlandstalige dingen. Het is ook mogelijk om de hoeveelheid door bibliotheken aangeschafte exemplaren te laten meewegen of eenvoudigweg de bron. Ook de leeftijd (van de doelgroep) kan als rank worden meegenomen.

In de NBC+ is deze static rank voor aangesloten partijen afzonderlijk te configureren. Elke bibliotheek kan er zelf invulling aan geven. In die zin is ook de static rank dynamisch, het kan zonder meer worden aangepast en de resultaten zijn direct zichtbaar.

Deze twee-traps ranking draait nu proef en zal in oktober in productie gaan.

Geef een reactie

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.