hoi,
ik heb een vraag. wij zijn studenten van het windesheim, en zijn bezig met een schoolopdracht waarbij we een excel/csv (of: een lijst, niet per se een excel / csv) met daarin de producten van gamma, praxis, hornbach.
we willen nu de producten aan elkaar linken, zodat de producten allemaal een groep hebben en op die manier we de 'goedkoopste' eruit kunnen filteren. maar, wij lopen vast.
we hebben ons verdiept in de fuzzy search methode en Levenshtein methode, maar dat is niet betrouwbaar genoeg.
Twee regels uit ons bestand:
- Sencys universele schroef RK TX zwart 4x16mm 30st. - 2.19 euro (PRAXIS)
- universele schroef RK TX zwart 4x16mm 30 stuks Sencys - 2.40 euro (GAMMA)
We hebben onder meer het merk en de prijs er al uitgefilterd, maar alsnog - geen betrouwbaar resultaat.
weet iemand hoe wij het best te werk kunnen gaan? want, we lopen er in vast, een hoofdpijndossier lijkt het wel.
we hebben vooral gekeken maar methodes via PHP, maar misschien moeten we wel in de python-richting zoeken? geen idee.
1.148 views