Update 2020: Zie voor onze nieuwe aanpak van verrijken de blogserie over de Metadata Library.
De afgelopen maanden hebben verbeteringen in de ErfGeo API en de ErfGeo Verrijkingenservice bij de Digitale Collectie (ontwikkeld door Seecr), ervoor gezorgd dat veel meer erfgoed objecten nu kunnen worden verrijkt met de juiste geografische concepten en coördinaten.
Om deze vooruitgang aan te tonen, zijn steekproeven genomen en beoordeeld. Daaruit blijkt dat ongeveer de helft van de records locatieinformatie bevat. Voor die records met locatieinformatie werd in 67% van de gevallen een match gevonden met de ErfGeo API. Op dit moment levert dat nog in in 4.5% van de gevallen een verkeerde match op.
Relevante aanpassingen die bijdragen aan het verschil t.o.v. de vorige keer:
- Aan de graph van https://api.histograph.io zijn Nederlandstalige landnamen toegevoegd en Nederlandstalige namen van grote steden in het buitenland.
- Vanuit de Digitale Collectie ErfGeo Enrichment service wordt nu exact gezocht op https://api.histograph.io in plaats van ‘fuzzy’.
- De term ‘Nederland’ wordt niet meer als zoekvraag gesteld: te vaak leverde dit het plaatsje Nederland in Overijssel. Bovendien voegt het nauwelijks iets toe (of zou het zelfs misleidend zijn) om de geo-coördinaten van het land Nederland bij het record op te nemen (in elk geval in de context waarmee we nu werken).
- Records die al geo-coördinaten bevatten, worden niet geprobeerd verder te verrijken.
Intussen blijven we zoeken naar manieren om het aantal verkeerde matches nog verder naar beneden te krijgen. Een voorbeeld van locatieaanduidingen die nog niet goed matchen zijn namen van rivieren en meren, zoals “Oosterschelde”, “Grevelingen”, etc., omdat de HistoGraph wel de straatnamen kent die daarmee overeenkomen, maar nog niet de wateren met die naam.