Return iets of niks

Door Ozzie PHP op 14-12-2022 12:18

3.733 views

Een method als deze kom je vaak tegen:

<?php

public function getFoo() {
if ($some_condition === true) {
return $this->foo;
}
}

?>
Nu geeft deze functie bijv. altijd een array terug als de conditie waar is. Daarom geef ik een return type aan.

<?php

public function getFoo(): array {
if ($some_condition === true) {
return $this->foo;
}
}

?>
Dat gaat goed zolang er aan de voorwaarde wordt voldaan en een array wordt teruggegeven.

Echter, het kan ook zijn dat er geen array wordt teruggegeven. Ik had verwacht dat er dan impliciet NULL werd teruggegeven. Dus dan zou je denken om het return type als volgt aan te passen:

<?php

public function getFoo(): ?array {
if ($some_condition === true) {
return $this->foo;
}
}

?>
Maar helaas blijkt dit niet te werken. Omdat er niks wordt gereturned, leidt het tot een fatal error. Ik kan natuurlijk expliciet return null toevoegen, maar vroeg me af er wellicht een andere oplossing is.

En dan nog een vraag 2:

Als iets er niet is, denk aan bijvoorbeeld:

- je voert een SELECT query succesvol uit, maar deze levert geen records op
- je haalt een geb.datum op van een user, maar die blijkt leeg / niet te zijn ingevuld
- je haalt een winkelmand op, maar er zitten geen producten in (omdat niks besteld of sessie verlopen)

wat return je dan? Is het dan gebruikelijk om NULL te returnen (als in 'leeg') of false (als in 'mislukt').

Ozzie PHP

16-12-2022 21:36 gewijzigd op 16-12-2022 21:38

Thanks Ad Fundum.

Ik denk dat het inderdaad wel een goede gewoonte is om een leeg identiek datatype te returnen.

Ik heb geen IT-opleiding gevolgd, maar heb van geschoolde programmeurs wel eens vernomen dat het niet 'mooi' is om op meerdere plekken binnen een functie iets te returnen. Daar zit wel wat in denk ik. Ik zou jouw oplossing dan ook eerder zo doen. Kleine nuance.

<?php

function query($sql, $params) : array
{
$data = $this->link->query_params($sql, $params);
if $this->link->last_errno > 0 {
if constraint_error {
$messager->write($this->get_constraint_error());
} else {
$logger->write($this->link->last_error);
}
$data = [];
}
return $data;
}

?>
Nu return je maar 1x en op 1 plek. Persoonlijk vind ik dat prettiger.

Ik ben wel benieuwd. Jij schrijft:

"Op deze manier hoef je jezelf na het aanroepen van $db->query() niet meer druk te maken over eventuele fouten, alleen over de rijen data die er al dan niet uit komen."

Je krijgt dan inderdaad altijd een array terug. Ik kan me zo voorstellen dat je daar direct na ontvangst iets mee gaat doen. Waarschijnlijk gooi je de array door een foreach-loop.

Check je dan van tevoren of er iets in de array zit?

<?php

if (!empty($array)) {

foreach(....

?>
Of laat je die empty() check achterwege en gooi je de lege array direct in de foreach loop?

? Onbekende gebruiker

17-12-2022 09:07

Ozzie PHP op 16/12/2022 21:36:39

Ik heb geen IT-opleiding gevolgd, maar heb van geschoolde programmeurs wel eens vernomen dat het niet 'mooi' is om op meerdere plekken binnen een functie iets te returnen. Daar zit wel wat in denk ik.

Het volgen van een opleiding (of zelfs maar een basisschool) geeft geen garanties. Het belangrijkste is om er zelf over na te blijven denken en open te staan voor onderbouwde nieuwe inzichten. Vaak is het juist om een voordeel om geen IT-opleiding gehad te hebben, omdat je dan beter 'out-of-the-box' kunt redeneren.

Of je nou op 1 plek iets returnt of niet is een kwestie van voorkeur. Het return-statement bestaat niet voor niets, het kan een paar grote if-blokken schelen en de code overzichtelijker maken. Maar in weinig code maakt het weinig verschil.

Ozzie PHP op 16/12/2022 21:36:39

Check je dan van tevoren of er iets in de array zit? [..]
Of laat je die empty() check achterwege en gooi je de lege array direct in de foreach loop?

Wat is het nut om van te voren te checken of een array leeg is? Als er geen data in een array zit wordt een foreach-lus niet uitgevoerd.

Ward van der Put

17-12-2022 09:35

Ozzie PHP op 16/12/2022 17:22:09

Je kunt 2 kanten op. Zoals Ad Fundum zegt, kun je een lege array returnen. Wat mij betreft een mooie en prima oplossing. Je kunt een controle doen met empty() om te zien of er iets in de array zit en vervolgens wel of geen verdere actie ondernemen. Je geeft ook altijd hetzelfde type (in dit voorbeeld een array) terug, en ook dat is netjes en zorgt voor een voorspelbaar resultaat.

Ad zegt ook dat hij hetzelfde doet met strings. Als er geen resultaat is, wordt er een lege string geretourneerd. Naar het eerste voorbeeld:


<?php

public function getFoo(): string
{
    if ($some_condition === true) {
        return $this->foo;
    } else {
        return '';
    }
}

?>

Dat doet hij bijvoorbeeld bij een geboortedatum:

Ad Fundum op 14/12/2022 19:52:28

- geboortedatum
Een string is een string, lege strings betekent geen geboortedatum. Wederom geen NULL-waarden.

Laten we dat eens uitwerken, inclusief low-budget unittest. ;)


<?php

declare(strict_types=1);

class Person
{
    public \DateTimeImmutable $dateOfBirth;
    
    public function getDateOfBirth(): string
    {
        if (isset($this->dateOfBirth)) {
            return $this->dateOfBirth->format('Y-m-d');
        } else {
            return '';
        }
    }
}


//> string(0) ""
$person = new Person();
var_dump($person->getDateOfBirth());

//> string(10) "1980-04-01"
$person->dateOfBirth = new \DateTimeImmutable('1 april 1980');
var_dump($person->getDateOfBirth());

?>

Dat werkt zoals verwacht: als er geen geboortedatum is, komt er een lege string uit. Het lijkt bovendien consistent, want een lege array en een lege string zijn beide empty().

Maar nu introduceren we twee complicaties, die tonen waarom en wanneer deze systematiek in duigen valt:

(a) Stel, we moeten een getAge() toevoegen die de leeftijd in jaren als integer retourneert. Wat retourneer je dan als leeftijd onbekend is? Een lege integer? Of 0 want empty(0) is true?

(b) Stel, we willen getDateOfBirth() herschrijven zodat de methode geen string met de geboortedatum meer retourneert, maar een value object, bijvoorbeeld een DateTime- of DateTimeImmutable-object. Wat retourneer je dan bij een onbekende geboortedatum? Een leeg object?

Met een null in de returns kunnen we het geheel leesbaar, consistent én voorspelbaar houden. En ja, dat is slechts een compromis, maar wel een heel gebruikelijk compromis.

(Terzijde: ik begrijp heel goed waarom Ad een lege string gebruikt voor een ontbrekende geboortedatum. In een grootschalige database wil je namelijk zo min mogelijk nullable kolommen hebben. Bovendien is er een groot verschil tussen "we weten de waarde niet" en "we weten dat de waarde er niet is". Ik wil dat echter lager in het systeem dicht bij de datalaag houden, bijvoorbeeld in een mapper of data access object, en liever niet meeslepen als lege strings in hogere-orde classes in een applicatielaag.)

Ozzie PHP op 16/12/2022 21:36:39

Ik heb geen IT-opleiding gevolgd, maar heb van geschoolde programmeurs wel eens vernomen dat het niet 'mooi' is om op meerdere plekken binnen een functie iets te returnen. Daar zit wel wat in denk ik.

Er zijn inderdaad programmeurs die dat doen, maar die schrijven vanwege die regel soms overbodig complexe én, niet onbelangrijker, inefficiënte code.

Neem dit voorbeeld uit OpenCart. Deze methode controleert of er producten met downloads zijn:


<?php

public function hasDownload()
{
    $download = false;

    foreach ($this->getProducts() as $product) {
        if ($product['download']) {
            $download = true;
            break;
        }
    }

    return $download;
}

?>

Lelijk. Hier wordt de dubbele vuistregel gevolgd: er is maar één return en die return volgt aan het einde na alle operaties. Maar het gevolg daarvan is dat er nodeloos een hulpvariabele wordt geïntroduceerd. En dat er een break nodig is om uit een loop te ontsnappen.

Het kan ook gewoon zo:


<?php

public function hasDownload(): bool
{
    foreach ($this->getProducts() as $product) {
        if ($product['download']) {
            return true;
        }
    }

    return false;
}

?>

Of als je niet vies bent van een eenregelige if zonder else:


<?php

public function hasDownload(): bool
{
    foreach ($this->getProducts() as $product) {
        if ($product['download']) return true;
    }
    return false;
}

?>

Twee returns, maar je kunt veel beter zien wat de methode doet.

En dat brengt ons via een omweg terug bij het begin van dit topic. De return types zijn onder andere ingevoerd omdat je altijd aan de signature van een methode kunt zien wat eruit komt. Je hoeft helemaal niet in de methode te zoeken naar de return. En dus is de regel dat die return altijd voorspelbaar aan het einde staat overbodig geworden.

Ozzie PHP

17-12-2022 16:07 gewijzigd op 17-12-2022 16:08

Hmmm food for thought ... erg interessant.

@Ward

Dus om terug te komen op mijn vraag. Jij returnt dus altijd null als iets er niet is. Vat ik het daarmee correct samen?

Waar Ad Fundum dus een lege array returnt, zou jij gewoon null returnen. En ik neem aan dat je dan voorafgaand aan een foreach loop eerst checkt met is_null?

Ward van der Put

17-12-2022 16:55 gewijzigd op 17-12-2022 16:56

Ik gebruik zelf inderdaad liever array|null of verkort ?array. Return types bieden je nu de kans om expliciet te maken wat voorheen verborgen bleef; benut die kans dan ook.

public function getCaptions(): array|null

zegt meer dan

public function getCaptions(): array

In het eerste geval wordt expliciet gemaakt dat de getter ook een lege waarde kan en mag retourneren. In het tweede geval moet je ernaar raden en het dus voor de zekerheid controleren of in de documentatie duiken (en hopen dat iemand de return later niet verandert).

Voor de vergelijking gebruik ik liever de strikte gelijkheid === null dan de functie is_null(). En dat meestal met een ontkenning: je hebt immers pas bij !== null een array teruggekregen als de return type array|null is.

Tot slot: het is geen goed/beter/best-keuze. Softwarearchitectuur lijkt veel op bouwkundige architectuur. Er kunnen bijvoorbeeld goede redenen zijn om de huiskamer op de eerste verdieping te plaatsen, want dan kun je een auto kwijt onderin je drive-in woning. Er is geen reden om zo'n ontwerp rigoureus af te keuren: het heeft in een bepaalde context absoluut bestaansrecht.

Ozzie PHP

17-12-2022 18:23

Thanks Ward, duidelijk verhaal.

Zelf er ook nog over nadenkend heeft null ook wel iets moois in symantische zin.

Je haalt iets op, het is er niet en dus krijg je null: wat je hebt geprobeerd op te halen is er niet.

De lege array en het direct door een foreach loop gooien, heeft ook wel wat. Maar als ik praktisch denk (en dat zal voor iedere situatie verschillend zijn) dan haal ik bewust iets op om iets mee te doen.

Stel ik wil een dynamische lijst opbouwen, maar de gegevens ontbreken of de lijst is leeg, dan wil ik dat eigenlijk weten zodat ik de lay-out erop kan aanpassen. Zo maar een voorbeeldje. Dan is een controle dus altijd nuttig. Want een 'Top 10 best verkochte producten' met daaronder een lege lijst ziet er ook maar raar uit. Als er geen producten zijn, dan wil je die hele lijst + lay-out niet gaan opbouwen.

? Onbekende gebruiker

18-12-2022 13:59

Ward van der Put op 17/12/2022 09:35:34

Ad zegt ook dat hij hetzelfde doet met strings. Als er geen resultaat is, wordt er een lege string geretourneerd. [..]
Dat werkt zoals verwacht: als er geen geboortedatum is, komt er een lege string uit. Het lijkt bovendien consistent, want een lege array en een lege string zijn beide empty().

Maar nu introduceren we twee complicaties, die tonen waarom en wanneer deze systematiek in duigen valt:

(a) Stel, we moeten een getAge() toevoegen die de leeftijd in jaren als integer retourneert. Wat retourneer je dan als leeftijd onbekend is? Een lege integer? Of 0 want empty(0) is true?

(b) Stel, we willen getDateOfBirth() herschrijven zodat de methode geen string met de geboortedatum meer retourneert, maar een value object, bijvoorbeeld een DateTime- of DateTimeImmutable-object. Wat retourneer je dan bij een onbekende geboortedatum? Een leeg object?

Met een null in de returns kunnen we het geheel leesbaar, consistent én voorspelbaar houden. En ja, dat is slechts een compromis, maar wel een heel gebruikelijk compromis.

(Terzijde: ik begrijp heel goed waarom Ad een lege string gebruikt voor een ontbrekende geboortedatum. In een grootschalige database wil je namelijk zo min mogelijk nullable kolommen hebben. Bovendien is er een groot verschil tussen "we weten de waarde niet" en "we weten dat de waarde er niet is". Ik wil dat echter lager in het systeem dicht bij de datalaag houden, bijvoorbeeld in een mapper of data access object, en liever niet meeslepen als lege strings in hogere-orde classes in een applicatielaag.)

Leuk voorbeeld Ward, en de voorkeur om NULL te vermijden komt inderdaad bij databases vandaan.

Om op de voorbeelden in te gaan:
a.) getAge() kan nooit een tijdsperiode berekenen als 1 (of 2) van de 2 datums onbekend is. Een poging daartoe is een logische fout. Als je dan simpelweg een NULL returnt (of erger, een foute waarde 0), kom je weer op mijn eerste voorbeeld: je moet altijd checken of de returnwaarde NULL is of iets anders. En daar laat PHP het afweten, het is heel makkelijk om die logische fout te laten bestaan in een onverwachte NULL-waarde, want het is voor programmeurs te makkelijk om die NULL te negeren. De functie getAge() moet dus een error genereren. Tenzij programmeurs altijd op NULL checken wanneer dat nodig is.
En zo komen we weer op de implementatie van NULL in PHP. Je zou het kunnen proberen te verbeteren:


<?php
// Naieve methode
class Date1 {
  protected $date = NULL;
  function __construct($date = NULL) { $this->date = $date; }
  function get() : ?string { return $this->date; }
}
$d = new Date1;  // geen datum
$g = $d->get();  // hierna moet dan altijd een if volgen..
if (is_null($g)) { print 'NULL'; }  // wat doe je als er niets is om te printen?
else { print $g; }

// Verbeterde methode
class Date2 {
  protected $date = '';
  function __construct(string $date = NULL) {  // ook zoiets, string = NULL..
    $this->date = $date;
  }
  function get() : string {
    if (is_null($this->date)) {
      trigger_error('Kan geen lege datum returnen');
      return '';
    }
    return $this->date;
  }
}
$d = new Date2;  // geen datum
print $d->get();  // als er iets fout gaat merken we het wel

// Falen kan ook een keuze zijn
// Poging om een Option enum in PHP te maken: 
class Option {
  protected $data, $none = true;
  function __construct($data = NULL) { $this->data = $data; }
  function is_some() : bool { return ! $this->none; }
  function is_none() : bool { return $this->none; }
  function if_let() : array {
    if ($this->none) { return []; }
    $a = [];
    $a[] = $this->s;
    return $a;
  }
}
function None() : Option { return new Option; };
function Some($data) : Option { return new Option($data); }
class Date3 {
  protected $date;
  function __construct(string $date = NULL) {
    // input validatie, stel alleen valide datumstring in of geef een error
    if (is_null($date)) { $this->date = None(); }
    else { $this->date = Some($date); }
  }
  function get() : Option { return $this->date; }
}
$d = new Date3;  // geen datum
foreach ($d->get()->if_let() as $date) {
  print $date;  // er gaat niets fout, we slaan bewust niet bestaande datums over
}
?>

Het subtiele maar belangrijke verschil is dat een programmeur verplicht is na te denken over beide uitkomsten: wel een datum of geen datum. Dit is een manier om de verantwoordelijkheid voor de logische fout te leggen waar die ligt, namelijk buiten de functies zoals getAge().

b.) Het is inderdaad waar dat allerlei functies in PHP rekening houden met de NULL-situatie, en zoals we weten is NULL in PHP niet echt een geheugenpointer naar het adres 0. Maar het is juist het complete vage van NULL, omdat het niet concreet iets zegt, dat er problemen ontstaan omdat het zo simpel over het hoofd is te zien. PHP heeft een bijzonder excentrieke en inconsistente benadering van veel van dit soort concepten. Ik haalde de reparatie op booleaanse logica in PHP 8 aan, maar jij had ook een mooi voorbeeld: empty(0) geeft true. Omdat 0 wordt beschouwd als leeg. Wat is daar de logica van in relatie tot NULL? Ik kan met terugwerkende kracht werkelijk niet begrijpen waarom 0 voor PHP net zo leeg is als NULL. Dat is wat ik noem een ontwerpfout in PHP.

Ozzie PHP

18-12-2022 14:37

Het komt er dus op neer dat er geen ideale oplossing is.

De voor mij meest logische oplossing is om dan toch voor consistentie te gaan. En voor mij houdt dat dat dan in om null te returnen indien iets er niet is. Dan kun je altijd een controle op null uitvoeren.

Wat mij betreft heeft het 2 voordelen.

Eerste voordeel: je voert altijd een controle uit en je weet dus of je wel of niet "iets" hebt. Heb je iets wat je verwacht te krijgen niet, dan kun je je uitvoer daarop aanpassen. Dit in tegenstelling tot bijv. het direct doorlopen van een lege array wat kan leiden tot een lege 'Onze bestsellers Top-10' lijst.

Tweede voordeel: de check is altijd identiek. Je hoeft dus niet te controleren op een lege string, lege array, een afwijkende integer, maar je checkt altijd op null.

Dank jullie beiden voor jullie input. Het is interessant om af en toe even te sparren om zo tot nieuwe inzichten te komen.

? Onbekende gebruiker

19-12-2022 10:17

Ozzie PHP op 18/12/2022 14:37:48

Het komt er dus op neer dat er geen ideale oplossing is.

De voor mij meest logische oplossing is om dan toch voor consistentie te gaan. En voor mij houdt dat dat dan in om null te returnen indien iets er niet is. Dan kun je altijd een controle op null uitvoeren.

Wat mij betreft heeft het 2 voordelen.

Eerste voordeel: je voert altijd een controle uit en je weet dus of je wel of niet "iets" hebt. Heb je iets wat je verwacht te krijgen niet, dan kun je je uitvoer daarop aanpassen. Dit in tegenstelling tot bijv. het direct doorlopen van een lege array wat kan leiden tot een lege 'Onze bestsellers Top-10' lijst.

Tweede voordeel: de check is altijd identiek. Je hoeft dus niet te controleren op een lege string, lege array, een afwijkende integer, maar je checkt altijd op null.

Dank jullie beiden voor jullie input. Het is interessant om af en toe even te sparren om zo tot nieuwe inzichten te komen.

Een lege top 10-lijst zou meerdere checks kunnen hebben, eentje die je gewoon zou kunnen gebruiken is count($rijen_uit_de_database);

De check met is_null() is een veelgebruikte en ook veel vergeten controle. Je moet dan zelf bij elke functie-aanroep bewust zijn van de signature ( ?string of iets anders ). Je geeft al aan dat je daar liever niet te veel bewust van bent door alle checks gelijk te trekken. Dat is niet heel vreemd, ik zou liever ook een consistente manier hebben om te werken. PHP gaat je daarbij in ieder geval niet helpen.
Misschien heb ik een IDE over het hoofd gezien die de gewenste werkwijze wel ondersteunt, maar degene die ik gebruikte (Eclipse PDT) deed dat in ieder geval niet.

Eind dit jaar stop ik geheel met PHP, ook particulier. Debian Linux ondersteunt geen recente PHP versie en ik wil niet afhankelijk zijn van 1 packager voor updates. En alles wat PHP is heb ik inmiddels omgeschreven in Rust.
Rust maakt mij wel elke keer bewust van de keuze om te falen (of niet). Dat gebeurt doordat functies een Option of een Result object returnen, zodat je van de taal een signaal krijgt om iets met dat resultaat te doen en ook alle situaties af te handelen.

Ik heb in deze thread een korte poging gedaan om iets dergelijks op te zetten voor PHP, maar uiteindelijk wint het gemak van is_null(). En zoals Ward al aangaf is dat op zich niet verkeerd, het is ook de context waarin de code moet functioneren die maakt dat het is wat het is.
Maar je zult het me vast niet kwalijk nemen dat ik na 20+ jaar PHP toe ben aan iets anders :-)

Ozzie PHP

19-12-2022 13:28

>> Een lege top 10-lijst zou meerdere checks kunnen hebben, eentje die je gewoon zou kunnen gebruiken is count($rijen_uit_de_database);

Correct ... maar dat is dus inderdaad precies wat ik bedoel. De ene keer zou je dan controleren op een lege array. De andere keer met count, dan weer controle op lege string. Altijd dezelfde controle op null is natuurlijk veel handiger.

>> Maar je zult het me vast niet kwalijk nemen dat ik na 20+ jaar PHP toe ben aan iets anders :-)

Dat mag uiteraard ;-)

Reageren

Inloggen om te reageren