Waar codeert md5 op ?

Overzicht Reageren

Sponsored by: Vacatures door Monsterboard

Hans De Ridder

Hans De Ridder

29/07/2017 11:39:54
Quote Anchor link
Ik wil een eenvoudige check doen of er al een zelfde afbeelding is geplaatst.
Blijkbaar gebruikt men daar een vergelijking voor van coderingen, zoals (verouderd) md5 .
Maar waar wordt dan op vergeleken?
Ik dacht altijd dat de bestandsnaam werd gecodeerd.
Nu is de coderingstijd ook afhankelijk van bijv. de grootte van het bestand.
Dus zal er wel op meer gecontroleerd worden....
De geschreven iptc (opgeslagen gegevens in foto) gegevens ook van invloed op die codering?


Code (php)
PHP script in nieuw venster Selecteer het PHP script
1
2
3
4
5
$md5image1 = md5(file_get_contents($image1));
$md5image2 = md5(file_get_contents($image2));
if ($md5image1 == $md5image2) {
....
}
 
PHP hulp

PHP hulp

20/04/2024 01:34:14
 
- Ariën  -
Beheerder

- Ariën -

29/07/2017 11:44:05
Quote Anchor link
Waarom gebruik je geen: http://php.net/md5_file?

Ik weet niet of de hashes met jouw manier van encrypten ook overeenkomen. Als dat niet het geval is, zal er misschien wel naar een deel van het bestand worden gekeken.
 
Thomas van den Heuvel

Thomas van den Heuvel

29/07/2017 11:47:26
Quote Anchor link
De inhoud van het bestand uiteraard. Dit is overigens geen (en)codering/encryprtie (verkeer in beide richtingen - encodering en decodering) maar hashing (eenrichtingsverkeer).

Zie hashen als een papierversnipperaar. Onder deze papierversnipperaar staan allemaal emmers. Afhankelijk van de samenstelling van de te versnipperen content vallen snippers in verschillende emmers. Dit tezamen levert een soort van signatuur op. Dat is je hash. Emmers met snippers zijn niet terug te vertalen naar de oorspronkelijke documenten.

Een kenmerk van hashen (of liever gezegd, van een fatsoenlijk hashingalgoritme) is is dat wanneer je twee nagenoeg identieke bestanden hasht dat dit twee compleet verschillende hashes oplevert. Dit is de reden dat hashing vaak (?) ingezet wordt om te controleren of twee bestanden identiek zijn.

Nogmaals: hashing is niet hetzelfde als encryptie.

- Ariën - op 29/07/2017 11:44:05:
Ik weet niet of de hashes met jouw manier van encrypten ook overeenkomen. Als dat niet het geval is, zal er misschien wel naar een deel van het bestand worden gekeken.

Dat lijkt mij sterk, wat zou dan de maatstaf zijn? Daarnaast: probeer het uit. Weet vrij zeker dat methode van topicstarter en md5_file hetzelfde resultaat opleveren.
Gewijzigd op 29/07/2017 11:50:12 door Thomas van den Heuvel
 
Frank Nietbelangrijk

Frank Nietbelangrijk

29/07/2017 11:51:15
Quote Anchor link
Heeft het geen zin om naast de inhoud-hash ook de bestandsgrootte op te slaan in je database?
Gewijzigd op 29/07/2017 11:51:33 door Frank Nietbelangrijk
 
Hans De Ridder

Hans De Ridder

29/07/2017 12:09:48
Quote Anchor link
Ik zet nu op ingeleverde afbeelding automatisch wat gegevens.
Een nieuwe toe te voegen afbeelding bevat deze info niet.
De bestandsgrootte wijzigt wel met paar honder bytes, met het toevoegen van die info.
Dus zou ik nooit op deze wijze kunnen vergelijken.

De meeste foto's zijn standaard flyer formaat.
Dus daar valt ook niet veel uit te halen.
En dus ook niet op bestandsgrootte.

Dan zal het toch moeten komen van de coordinaten (googlemaps, en al ingebouwd)
Dat geeft de plek aan waar activiteit plaats vindt.
En de datum.
Maar als er dezelfde dag een feest is op een verdieping hoger. Dan is er een klein probleempje, haha.
Maar komt geen bloed uit....
Beetje nadenkend over website....
 
Frank Nietbelangrijk

Frank Nietbelangrijk

29/07/2017 12:22:47
Quote Anchor link
Een alternatief zou kunnen zijn die extra informatie juist UIT die afbeeldingen te slopen en juist wel in je database op te slaan. De afbeelding zonder die extra informatie geeft wellicht een betere vergelijking en daarnaast kun je op veel meer manieren afbeeldingen selecteren. bijvoorbeeld binnen een straal van 2 kilometer van een bepaalde locatie.
 
Hans De Ridder

Hans De Ridder

29/07/2017 12:44:49
Quote Anchor link
De info over de plek, en de datum zijn beschikbaar.
Die worden ook in de foto gezet.(ook bij het inleveren)
Maar bij artiesten zwerven vaak meerdere flyers over dezelfde activiteit.
Zeker wanneer er meerdere artiesten optreden.
Ik kan bij de invoer wel eventueel aangeven welke flyers er voor die activiteit al
beschikbaar zijn. En dan keuze aan lid laten of hij de nieuwe er ook bij wil zetten.
Zit er een bij die hetzelfde is, hoeft die niet ingevoerd te worden.
Nogmaals, komt geen bloed uit...en een keer een dubbele is ook niet zo erg.
Kan ik als het irriteert in admin pagina altijd zelf eruit halen.
Ik gebruik overigens in deze website geen database...
Is experiment met opslag van data in foto's. Met als onderwerp 'artiesten promotie'.
Gewoon voor de hobby...
Werkt tot nu toe heel prettig allemaal.
Maar is wel met paar foto's en gegevens.
Ben benieuwd hoe het gaat met grotere aanvoer data en documenten/foto's.
En hoe het met de snelheid gaat...
Daar komen vast nog wel vragen over.
Voor nu allemaal bedankt voor het meedenken.
Gewijzigd op 29/07/2017 13:00:39 door Hans De Ridder
 



Overzicht Reageren

 
 

Om de gebruiksvriendelijkheid van onze website en diensten te optimaliseren maken wij gebruik van cookies. Deze cookies gebruiken wij voor functionaliteiten, analytische gegevens en marketing doeleinden. U vindt meer informatie in onze privacy statement.