Not pulling all html from page?

FriendsOfPHP / Goutte

Goutte, a simple PHP Web Scraper

MIT License

9.26k stars 1.01k forks source link

$crawler = Goutte::request('GET', $url); $data = $crawler->filter('.cmp-JobDisplay-pagination > .cmp-Pagination > a')->each(function ($node) { return $node->attr('href'); }); dd($data);`

This is working for me.

$url = 'https://www.indeed.com/cmp/Lockheed-Martin/jobs';

$client = new Client();
$crawler = $client->request('GET', $url);

$data = $crawler->filter('.cmp-JobDisplay-pagination > .cmp-Pagination > a')
    ->each(function ($node) {
        return $node->attr('href');
    });

print_r($data);

Output: Array ( [0] => /cmp/Lockheed-Martin/jobs?start=150 [1] => /cmp/Lockheed-Martin/jobs?start=300 [2] => /cmp/Lockheed-Martin/jobs?start=450 [3] => /cmp/Lockheed-Martin/jobs?start=600 [4] => /cmp/Lockheed-Martin/jobs?start=150 )

FriendsOfPHP / Goutte

Not pulling all html from page? #417