html dom backlink checker
ik ben aan het spelen met simple html dom.
Ik wil graag backlink checker maken.
Eigenlijk heel simpel :
Laad externe pagina in en zoek naar links met image. Daar waar link mijn domein is en image mijn image.
Omdat ik developers graag ook hun eigen manier wil laten behouden, wil ik niet vast pinnen op bijv:
<a href="mijndomein.com/path/to/page" target="_blank"><img src="mijndomein.com/img/logo.png"></a>
Wil ik niet op deze vaste regel zoeken..
Met html dom heb ik enkele voorbeelden opgepakt om links te zoeken, images te zoeken e.d.
Ik kom bijv. wel links tegen waarvan ik weet dat ze een image bevatten, maar staat geen refentie bij het element.
Iemand enig advies of andere oplossing?
Wellicht een regex koning aanwezig? (zou dat een oplossing kunnen zijn?)
Toevoeging op 08/04/2018 22:44:16:
dom dom dom..
werkt wel, maar laat weer niet de href van a zien ...
Gewijzigd op 08/04/2018 22:46:18 door Dennis WhoCares
Vanuit je gevonden img via parent() weer "omhoogklimmen" tot je een tag == "a" tegen komt, en daar dan de href van pakken.
maar m'n parent blijft empty -,-
De image waar ik naar kijk is wel zeker in een link..
Code (php)
1
2
3
4
5
6
7
8
9
10
11
12
2
3
4
5
6
7
8
9
10
11
12
require('htmldom.php');
$html = file_get_html('https://www.mijndomein.com');
// Find all images
$finder = $html->find('a img');
foreach($finder as $index => $element) {
$finder[$index]->clear();
print_r($element);
print_r($element->parent());
}
$html = file_get_html('https://www.mijndomein.com');
// Find all images
$finder = $html->find('a img');
foreach($finder as $index => $element) {
$finder[$index]->clear();
print_r($element);
print_r($element->parent());
}
Parent is altijd leeg.
Ik wil niet alle links, en alle images.
Alleen <a href.......><img src......></a>
En dan kan ik daaruit controlleren of mijn link en image wel daarin staat.
p.s. ik gebruik clear omdat ik als voorbeeld een webshop gebruikt heb, en dat bevat nogal veel links ;-)
Toevoeging op 09/04/2018 11:13:13:
Zonder de () bij parent werkt het wel :)
toppers!
Code (php)
1
2
3
4
5
6
7
8
9
10
11
2
3
4
5
6
7
8
9
10
11
require('htmldom.php');
$html = file_get_html('https://www.mijndomein.com');
$finder = $html->find('a img');
foreach($finder as $index => $element) {
$imgLink = $element->src;
$urlLink = $element->parent->href;
$finder[$index]->clear();
}
$html = file_get_html('https://www.mijndomein.com');
$finder = $html->find('a img');
foreach($finder as $index => $element) {
$imgLink = $element->src;
$urlLink = $element->parent->href;
$finder[$index]->clear();
}
Gewijzigd op 09/04/2018 12:19:51 door Dennis WhoCares