Goedemorgen allemaal,

Ik loopt tegen het volgende feit aan.. Wekelijks lees ik een 30-tal CSV bestanden in mijn database. Dit doe ik mbv de tool HeidiSQL.

Maar het zijn CSV die zijn gegenereed met Microsoft Excel. Wanneer ik deze importeer dan lukt dat niet met de Encodering UTF-8. Het importproces wordt dan afgekapt ivm de diakritische tekens.

Nu kom er bij toeval achter dat wanneer ik eerste het CSV bestand open met Google Spreadheets en vervolgens als CSV opsla en vervolgens deze importeer dan is geen vuiltje aan de lucht. Met twee vingers in de neus worden dan de bestanden met diakritsche tekens goed ingelezen..

Hoe ga ik dit nu fixen? Iemand een wild guess?
Ik heb net een goede tip gegeven, iets met ico....nogwat...
Zit standaard in Linux, waarop de meeste servers draaien. Maar werkt ook in Windows via Cygwin.


iconv -f iso-8859-1 -t utf-8 bron/* > doel/*


Controleren kan met:

file -bi filename.txt

(geen idee of het onder Cygwin werkt)

Oh ja, en maak altijd back-ups als je met collaties en encodingen gaat sleutelen.

Reageren