BLOB en PDF-compressie

Overzicht Reageren

Sponsored by: Vacatures door Monsterboard

Ward van der Put
Moderator

Ward van der Put

20/05/2014 11:31:08
Quote Anchor link
In een MySQL-database voor een administratief systeem heb ik een InnoDB-tabel met een BLOB-veld voor documenten. Het merendeel van deze documenten (zo'n 80%) zijn PDF's. De overige documenten zijn typische Office-bestanden uit Word of Excel en incidenteel zit er een geëxporteerde e-mail of een foto bij.

Een aanzienlijk deel van de PDF's blijkt fors te kunnen worden gecomprimeerd, zonder verlies. In Adobe Acrobat Professional kom ik bijvoorbeeld regelmatig op een reductie van 100 kB tot 10 kB. Een universeel compressieformaat zoals ZIP haalt dat niet bij PDF, maar kan toch vele tientallen procenten schelen.

Welke workflow kunnen jullie me hier aanbevelen?

- ROW_FORMAT=COMPRESSED gebruiken en verder altijd de originelen opslaan?

- Een universeel compressieformaat zoals ZIP gebruiken?

- Een dedicated compressie inbouwen voor met name PDF naar PDF?

- Iets anders?
 
PHP hulp

PHP hulp

14/05/2021 02:27:36
 
Ger van Steenderen
Tutorial mod

Ger van Steenderen

20/05/2014 14:10:35
Quote Anchor link
>> Een aanzienlijk deel van de PDF's blijkt fors te kunnen worden gecomprimeerd, zonder verlies. In Adobe Acrobat Professional kom ik bijvoorbeeld regelmatig op een reductie van 100 kB tot 10 kB.

Dat lijkt erop dat het gewoon platte tekst Pdf's zijn, en die zou je dus ook gewoon met een tekst editor kunnen openen. Niet zo'n beste PDF generator.
 
Ward van der Put
Moderator

Ward van der Put

20/05/2014 14:18:58
Quote Anchor link
Het zijn vaak facturen en creditnota's, dus één A4 met een logootje plus tekst. Die worden door een x-aantal partijen op een y-aantal manieren gefabriceerd, die inderdaad kennelijk niet allemaal optimaal zijn.

Snelheid van de oplossing is geen issue (het is overwegend een archief), maar in opslagruimte kan ik dus veel winnen. Suggesties?
 
Ger van Steenderen
Tutorial mod

Ger van Steenderen

20/05/2014 20:19:36
Quote Anchor link
Ik zou een generieke compressie gebruiken.
Dus gewoon ZIP, dat kan iedereen uitpakken.

Ook de door Adobe Pro gegeneerde bestanden kunnen nog lichtelijk verkleind worden, omdat de XREF 'table' niet intern gecomprimeerd kan worden.

De compressie methode is overigens DEFLATE als ik het me goed herinner.
 



Overzicht Reageren

 
 

Om de gebruiksvriendelijkheid van onze website en diensten te optimaliseren maken wij gebruik van cookies. Deze cookies gebruiken wij voor functionaliteiten, analytische gegevens en marketing doeleinden. U vindt meer informatie in onze privacy statement.