[PHP] Vraag over simple html dom

Overzicht Reageren

Sponsored by: Vacatures door Monsterboard

Java Developer / Overheid / Complexiteit

Functieomschrijving Wil jij als Java Developer een bijdrage leveren aan een veiliger Nederland en je als Java Developer bezig houden met zeer complexe bedrijfskritische applicaties? Lees dan snel verder! Doorontwikkelen bedrijfskritische applicaties; Aanpassingen maken in de bestaande applicatie; Vertalen van jouw visie op continuous integration en continuous delivery; Debuggen van de applicatie; In gesprek gaan met eindgebruikers om verbetervoorstellen op te halen. Functie-eisen Minimaal HBO-werk en denkniveau; Minimaal 5 jaar werkervaring als Java Developer; Je bent minimaal OCP-Java SE 6 gercertificeerd; Je hebt kennis van Webservices en Continuous Integration; Je bent analytisch sterk en zowel klant- als resultaatgericht. Bedrijfsomschrijving Binnen

Bekijk vacature »

PHP er

PHP er

22/02/2020 06:56:49
Quote Anchor link
Hoi allemaal,

Ik probeer via simple html dom de inhoud van een Facebookbericht te scrapen, maar ik kom er niet uit..

Code (php)
PHP script in nieuw venster Selecteer het PHP script
1
2
3
4
5
6
7
8
9
ini_set('user_agent', 'MyBrowser v42.0.4711');    
include 'htmldom/simple_html_dom.php';
                
  
   // DOM opslaan in variabele  

     $html = file_get_html(':https://www.facebook.com/facebookapp/posts/10159137047256729');
     $a = $html->find('div[data-testid=post_message]');
     echo $a->plaintext;


Weet iemand wat ik verkeerd doe?
 
PHP hulp

PHP hulp

16/07/2020 18:58:59
 
- Ariën -
Beheerder

- Ariën -

22/02/2020 09:17:58
Quote Anchor link
Wat is er eigenlijk mis met de API?
 
PHP er

PHP er

22/02/2020 14:15:17
Quote Anchor link
- Ariën - op 22/02/2020 09:17:58:
Wat is er eigenlijk mis met de API?


Daarmee kun je zonder pagetoken met toegang tot de betreffende pagina, geen recensies scrapen van andere Facebookpagina’s. Alleen van je eigen Facebookpagina.
 
- Ariën -
Beheerder

- Ariën -

22/02/2020 14:24:45
Quote Anchor link
Maar waar loop je op vast?
Is het die dubbele punt voor de URL?
Gewijzigd op 22/02/2020 14:30:01 door - Ariën -
 
PHP er

PHP er

22/02/2020 15:18:43
Quote Anchor link
- Ariën - op 22/02/2020 14:24:45:
Maar waar loop je op vast?
Is het die dubbele punt voor de URL?

Jeetje, scherp haha! De dubbele punt is weggehaald, maar krijg eigenlijk nog geen output te zien met deze code :O

Weet jij misschien waarom er geen output te zien is? In de broncode van die pagina, móet die DIV wel bestaan uit de inhoud van het bericht
 
Thomas van den Heuvel

Thomas van den Heuvel

22/02/2020 15:32:24
Quote Anchor link
Maar al die HTML staat in een <!-- commentaarblok -->. Mogelijk wordt dat dan anders behandeld in/maakt het geen onderdeel uit van de DOM? Of misschien moet je een flag aanzetten zodat ie commentaar ook pakt?

Probeer anders het omvattende code-blok eens op te vragen (<code id="u_0_1m">...</code>) en kijk wat ie daarvan retourneert?
 
- Ariën -
Beheerder

- Ariën -

23/02/2020 01:30:33
Quote Anchor link
Kan je iets vinden in een simpele var_dump?
 
PHP er

PHP er

23/02/2020 21:43:52
Quote Anchor link
- Ariën - op 23/02/2020 01:30:33:
Kan je iets vinden in een simpele var_dump?

dan krijg ik helaas een lege output.. :-(
 
- Ariën -
Beheerder

- Ariën -

23/02/2020 21:46:17
Quote Anchor link
En een stapje terug, op $html?
 
Michael -

Michael -

24/02/2020 17:29:21
Quote Anchor link
Ze blokkeren dit bewust. Dit is het resultaat als je gewoon de pagina ophaalt
https://ibb.co/ZB1yZmH

Het bericht wordt pas later ingeladen en zelfs met xpath comment() blijft deze leeg.

Edit Ah plaatjes werken niet meer.... KLIK
Gewijzigd op 24/02/2020 17:29:51 door Michael -
 
- Ariën -
Beheerder

- Ariën -

25/02/2020 22:12:49
Quote Anchor link
Gaat via een AJAX-request dus. Of ze dit bewust als blokkade doen weet ik niet. Maar ik denk dat het toch API werk zal worden, of het idee laten schieten. of proberen het idee bij FB erin te schieten, maar bij die grote partij vrees ik dat je bot gaat vangen.
 



Overzicht Reageren

 
 

Om de gebruiksvriendelijkheid van onze website en diensten te optimaliseren maken wij gebruik van cookies. Deze cookies gebruiken wij voor functionaliteiten, analytische gegevens en marketing doeleinden. U vindt meer informatie in onze privacy statement.