-
环境:**PHP 7.4.16 (cli) (built: Apr 28 2021 18:20:46) ( NTS )**
警告:
PHP Deprecated: Array and string offset access syntax with curly braces is deprecated in /mnt/c/Users/twomiao/desktop/phpspider/cor…
-
-
目标页面是通过post分页,并且提交字段有viewstate动态变化,phpspider能否采集?
-
from http://www.zhidaow.com/post/selenium-phantomjs-xpath
sudo pip install selenium
sudo apt-get install PhantomJS
Selenium下载地址:https://pypi.python.org/pypi/selenium#downloads
PhantomJS下载地址:http…
-
phpspider.php 文件的第 2114 行,下载应该使用 $collect_url
$html = requests::$method($collect_url, $params);
否则不会去下载 attached_url
-
用phpspider 写了一个爬小说的的,但是我想在列表也获取内容的时候。遇到了问题。总是拿不到标题。而且方法也是按照官网文档的方式获取的。麻烦那位大佬帮忙看一下哈,或者说我这种方式写错了么。。 请大佬们指点一二。。。
> 报错提示:
```
2018-11-12 14:26:37 [debug] Find list page: https://www.kanshushenzhan.co…
-
文档打开没内容显示了哦
-
我大概看了您的代码, 然后对您的这句:
> 因为知乎需要登录才能获取到关注者页面,所以从chrome登录之后把cookie拷贝下来给curl程序模拟登录。
还是不太明白,所以非常想了解您是怎么做的。
因为我将浏览器的cookie复制后做成数组添加进curl是失败的。
所以请解答, 谢谢O(∩_∩)O
-
在复杂一点的dom结构里面,闭合空标签会被解析成闭合
像这样的空标签经过$phpspider->remove() 类似dom操作之后再获取,会闭合成 。 不确定是不是simpledom的问题,没去跟这个bug。
-
在用回调函数on_list_page去获得列表页数据时候,
$options = array(
'method' => 'get',
'context_data' => $page_views,
);
$phpspider->add_url($content_url, $options);
这个方法不生效, 无法在cont…