^ geeft aan dat dit het begin van de tekst is. Dus "het project" voldoet niet aan je eis, "project" wel.
Project dit is letterlijk een tekst die je zoekt.
\s staat voor een witruimte. Dat kan een spatie zijn, maar ook bijvoorbeeld een tab of een "harde spatie"
* het voorgaande (die \s dus) mag 0 of meer keren voorkomen.
: is letterlijk dit teken.
\s* wederom 0 of meer witruimtes
M staat weer letterlijk voor deze letter
\d{5,9} staat voor 5 tot 9 cijfers.
$ dit is het einde van de string. Dus "project : M123456xyz" voldoet niet, vanwege xyz
En als je die cijfers wilde "vangen", dan moet je haakjes gebruiken: (\d{5,9})
?Onbekende gebruiker
09-07-2024 12:08
Ivo, dank je. Ik was ook tot deze code gekomen. Alleen het programma (ScanSys) geeft toch geen resultaat hierop.
Misschien dat in het programma ergens een vinkje verkeerd staat dat de regex niet geactiveerd is om het uit te lezen.
En weet je echt niet hoeveel spaties er om de dubbele punt staan?
?Onbekende gebruiker
10-07-2024 08:49
sorry, dat met de haakjes had ik overheen gelezen. Dat zal het euvel zijn.
Het programma ScanSys scant de PDF en vertaalt dit in tekst en op de PDF is er whitespace maar is niet te zeggen hoeveel.
Bedankt voor de hulp.