- Moet ik dan in de database voor elke persoon een unieke URL-naam opslaan zoals ID 1 = jan-peter-balkenende? Of wat is hierbij gebruikelijk? En dan in plaats van zoeken op ID 1 zoeken op jan-peter-balkenende?
- Is er een mogelijkheid waarbij de oude URL blijft werken? Die staan nu namelijk op Google. Blijven die zo bruikbaar, of kan ik die dan op één of andere manier verwijzen?
Ikzelf genereer de slug met de titel direct vanuit de database, en voeg die toe aan de URL, waarbij ik ook de ID apart meegeef.
Dan krijg je dus een URL zoals: www.website.nl/nieuws/5/nieuwe-website-geintroduceerd.html
Hierbij kijk verplicht ik de slug overigens niet, en is deze ook niet de sleutel in de URL. Als iemand de slug in de URL aanpast, dan laat ik een redirect uitvoeren naar de juiste slug:
Omdat de slug niet de sleutelrol speelt, kan deze ook uit de URL gelaten worden, en in dat geval redirect ik automatisch naar dezelfde site, maar dan mét de slug.
Ok. Ik moet de slug jan-peter-balkenende dan bij de persoon met ID 1 toevoegen in de database. Maar hoe moet ik dat dan verwerken als ik de ID zelf niet meer wil terugzien in de URL? Dan zou ik de sitestructuur ook moeten wijzigen aangezien de ID dan niet meer in de URL staat, waardoor ik er ook niet meer op kan zoeken? En dan zoeken met de slug?
Ik moet het htaccess nog een beetje onder de knie krijgen, dus probeer het eerst even helder te krijgen hoe en wat.
Ikzelf sla de slug niet apart op, omdat deze toch niet leidend is.
Als je geen ID's in de URL wilt tonen, en dus unieke titels hebt, dan moet je wel de slug opslaan.
Het kwartje begint te vallen denk ik hoe het zou moeten. Ik vind zonder ID er net wat cleaner uitzien, maar zoeken op de slug (met index) is weer net wat langzamer neem ik aan? Met een ID in de URL heb je inderdaad geen probleem bij dubbele titels of wijziging (van naam in dit geval) omdat je altijd op ID matcht. Die slug staat er dan meer voor de sier. Dat heeft ook weer zijn voordeel. En dan kan ik de sitestructuur zo laten als ie is toch als ik alleen &slug=jan-peter-balkenende toevoeg.
Ik had wat rondgezocht omdat mijn interesse was gewekt hoe anderen het doen, maar zie dat NOS de id en titel samenvoegt (en daarna split ofzo?) en dat NU.nl zowel een ID als slug gebruikt. Maar bij VI.nl zie ik geen ID's in de URL, die zoeken dus ook op de slug neem ik aan?
Er zijn verschillende strategieën mogelijk. Bijvoorbeeld eentje waarbij je complete (unieke) URL's opslaat in de database en daar dan de bijbehorende code bijtrekt die op zijn beurt weer de juiste data uit de database trekt. Wat je ook kunt doen is de URL elke keer handmatig on-the-fly ontleden en die dan door dirigeren naar het juiste stuk code om de verdere afhandeling te verzorgen.
Het idee hierbij is (waarschijnlijk) wel altijd de aanwezigheid van één voordeur (single point of entry) in je applicatie. Dit is meestal gewoon index.php. Toegepast op de vorige strategieën vraag je in het eerste geval in index.php de informatie (bijna) rechtstreeks op, en in het tweede geval delegeer je code vanuit index.php verder naar een andere lap code die het request (de pagina aanroep) verder afhandelt.
Op het moment dat ik 'jaar' leeglaat, dus /jaar/categorie/ doe als //xxxx/ dan verspringt xxxx alsware van categorie naar jaar. Niet dat het heel belangrijk is, maar hoort dat zo? Nu kan ik bijvoorbeeld een handeling uitvoeren als jaar niet voorkomt in de array of empty is. Ik heb ze voorlopig namelijk op optioneel gezet als het goed is, al weet ik niet of ik dat zo laat.
Bij pagination en zoekresultaten kan ik het beste gewoon ?a=1&b=2&filter=3&q=blabla laten achter de rewrite? En voor pagina's die bij Google in de zoekresultaten moeten komen de URL rewriten (de canonical)?
Waar ik alleen niet uitkom is hoe ik dit moet toepassen op mijn website. Ik gebruik gedeeltelijk namelijk Wordpress - vanwege het usersysteem - maar voor het aanroepen van de database gegevens etc staat het eigenlijk los van Wordpress. Dit staat nu bij de .htaccess (heb ik niks aan veranderd):
# BEGIN LSCACHE
# END LSCACHE
# BEGIN NON_LSCACHE
# END NON_LSCACHE
# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
</IfModule>
# END WordPress
# Block WordPress xmlrpc.php requests
<Files xmlrpc.php>
order deny,allow
deny from all
allow from 123.123.123.123
</Files>
Ik heb bijvoorbeeld de pagina kalender/index.php?jaar=2019&cat=xxxx die door Wordpress/htaccess wordt herschreven naar kalender/?jaar=2019&cat=xxxx. Maar kan ik die dan weer herschrijven naar kalender/2019/xxxx? Dat krijg ik nog niet voor elkaar hoe dat zou moeten.
Het idee van een single point of entry is mede dat je intern het verkeer verder kunt delegeren. Daarom is het verstandig om zo min mogelijk RewriteRules (wat in wezen applicatielogica (of routing logica, net wat je wilt) is) hiervoor te bakken.
Als je een applicatie X hebt die volgens dit principe werkt kun je gewoon het beste alle verzoeken in eerste instantie naar de voordeur van applicatie X sturen. Vervolgens kun je in de applicatie zelf de URL verder ontleden.
Concreet zou ik dus alles van de vorm /kalender/* doorsturen naar /kalender/index.php. Dit is de enige RewriteRule die je nodig hebt. In /kalender/index.php kun je verder precies programmeren wat er dient te gebeuren. Dit beslis je op grond van de inhoud van de oorspronkelijk aangeroepen URL, die te vinden is onder $_SERVER['REQUEST_URI'].
Jullie zijn behoorlijk wat gevorderder dan ik dus moet het nauwkeurig lezen om het goed te kunnen volgen. Maar voor alle pagina's en ook de kalender heb ik alleen een index.php. Die werd al rewritten door Wordpress/htaccess tot kalender/?jaar=2019&cat=xxxx. Dan heb ik een 'single point of entry' neem ik aan? Van daaruit wordt afhankelijk van de input bepaald wat er moet gebeuren.
Maar dat wil ik dus SEO-vriendelijk maken. Hoe zou ik die in het laatste voorbeeld moeten herschrijven dan?
Een 'single-point-of-entry' kan je vergelijken met de voordeur van een huis. Alles wat naar binnen komt gaat via de voordeur, dus via de index.php. In je .htaccess geef je aan of fysieke directory's en bestanden voorrang krijgen, maar naast dat gaat alles via index.php. Daarvandaan moet je een routeer-script plaatsen die de $_SERVER['REQUEST_URI'] uitleest, en vervolgens het juiste script ophaalt via een include bijvoorbeeld.