wangjunbao / adfiltering-rules

Automatically exported from code.google.com/p/adfiltering-rules
0 stars 0 forks source link

可以合并fanboy规则吗? #53

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
必填项目
1.出现问题的网址:
(如果是多个广告相同的误过滤或未过滤网址,仅需发其
中之一地址)
*

2.请尽可能详细的描述出现问题的位置及现象:
我正在使用Fanboy's Adblock List for Opera 
http://www.fanboy.co.nz/adblock/opera/ 
里面涵盖全球网站过滤规则,很喜欢。只是中国部分比较少��
�所以我把咱们的urlfilter.ini和Custom.css分别复制到Fanboy的urlfilte
r.ini和fanboy-adblocklist-elements-v4.css,发现有部分规则重复了,��
�们的规则可以将两者剔除重复后合并吗?合并后规则更多更�
��面,面向全球而不仅仅是国内网站。

3.使用的本过滤规则版本(Updated):
#984

选填项目
1.发现误过滤/无法过滤时,你还开启了其它哪些具有广告
过滤功能的软件/规则?(如没有可不填)
软件:
规则:

2.还有什么需要补充的吗?

---------------------------------------------------------------------------
小提示
在下面的Labels可以加上标签(都有中文注记),越详细
越好,方便我辨识。注意,不确定的就不要选。务必选择
自己使用的过滤软件,如使用ABP就选OpSys-ABP。

Original issue reported on code.google.com by westmin...@gmail.com on 31 Mar 2013 at 10:21

GoogleCodeExporter commented 9 years ago
开源的就这点有烦恼,这货貌似不开源,要是拿过来,岂不��
�不好?

欢迎发表你的间接。

Original comment by hc5023295 on 31 Mar 2013 at 2:38

GoogleCodeExporter commented 9 years ago
真要合并的话,其实没有技术难度的。

Original comment by hc5023295 on 31 Mar 2013 at 2:38

GoogleCodeExporter commented 9 years ago
fanboy好像是开源的,可是比较低调,比较隐蔽,记得以前查��
�过它托管的网站,
忘记网站名字了。开不开源没关系吧,看看它使用什么 
license,可以二次开发吗?
主要是看中它规则多集大成,以前也有chinese版本的,可惜11��
�之后就没人维护
了。看他们论坛说之后会合并easylist,不知咋搞,不 
知会不会合并easylist-
china。

Original comment by westmin...@gmail.com on 31 Mar 2013 at 2:48

GoogleCodeExporter commented 9 years ago
http://forums.fanboy.co.nz/forums/viewtopic.php?f=5&t=2800&hilit=license
可以二次开发

Original comment by westmin...@gmail.com on 31 Mar 2013 at 2:55

GoogleCodeExporter commented 9 years ago
既然是根据CC开源的,那么基本上可以。之后有时间搞。

Original comment by hc5023295 on 1 Apr 2013 at 1:48

GoogleCodeExporter commented 9 years ago
现在有个问题,有几个方案可以实现该特性:
# 
不定期(两三个月一次甚至更久)手动更新合并,并去除重��
�规则
# 合并一次,去除重复规则
# 每次更新的时候自动合并,但不去除重复规则。

你的看法呢?

Original comment by hc5023295 on 3 Apr 2013 at 2:58

GoogleCodeExporter commented 9 years ago
(以下所指fanboy列表是指fanboy for 
opera的ini和css两个规则文件)
fanboy列表好像没有按网站分类,而是自然排序的,查找起来��
�比较麻烦。
我看他们现在已经使用合并easylist的列表了,按论坛公告说以
后的opera列表是合并easylist列表后的fanboy for
abp列表转换过来的。也就是说归根结底还是easylist列表,只是
他们自己另外增加了一些规则,具体可以看他们的论坛公告��
�而且不知道他们是单纯合并easylist,还是连各种语言版本都��
�并进去。要是合并了各种语言版本,集大成,只要easylist和ea
sylist-china够齐全,那么我们的列表可以说没有用了。
1.要是他们没有合并语言版本,而是加入他们自己额外的列表
,按现在的opera列表使用来看,其中也有不少中文网站规则,
只是没有easylist-china那么多。这样加入我们的列表后重复规则
会增加不少。
2.要是他们合并了语言版本,那么加入我们的列表后会有大量
重复。
所以我建议你联系fanboy协商,可以让我们承担起他现有的china
列表的维护工作(这个列表2011年之后就没人维护了)。这样�
��们单纯只是负责china部分,最好建议他们把现在的fanboy列表�
��的china部分提取剔除出来放到我们维护的china列表里。这是��
�好的合作方案。
可是由于我们的列表是通用的,要转换成各种程序使用的规��
�,不能单纯为opera单独维护一份规则,而我们现在的规则里��
�有不少国际部分。所以我最大的建议就是先把我们现在的规�
��来个大归类,区分出国际部分和中国部分,这样我们只要把
中国部分作为fanboy的china列表就行了。
在没有完成这个工作之前, 
不知能不能写个小程序,把我们的规则和现在fanboy规则合并��
�然后自动去除重复规则呢?要是困难,建议自动更新,简单�
��量合并就行了。
另外,我是使用privoxy做广告过滤的(包含代理功能),内存�
��cpu使用大大优过abp。使用http://freeshell.de/~oesser/scripts/blocklist
-to-privoxy/
这个小脚本将fanboy for opera
的ini规则转换成privoxy规则,可是那个作者没有写将css规则转�
��成privoxy的脚本,不知你能不能写一个呢?privoxy的css类型filt
er使用说明http://www.privoxy.org/user-manual/filter-file.html。可以参考
这个作者的脚本http://andrwe.org/doku.php/scripting/bash/privoxy-blocklist
(这个脚本直接转换easylist,可是uri部分不符合privoxy规则,cs
s部分符合,现在不维护了)。谢谢!

Original comment by westmin...@gmail.com on 6 Apr 2013 at 8:02

GoogleCodeExporter commented 9 years ago
这样相当于增加了privoxy这个程序的规则支持(直接将opera两��
�文件转换就ok),希望考虑实现。

Original comment by westmin...@gmail.com on 6 Apr 2013 at 8:07

GoogleCodeExporter commented 9 years ago
内容略多哈
先来Opera:
合并倒是没问题,去重复暂时没精力去实现,我还得把JavaScri
pt用Python重新编一遍,工作量略大。。。
我的英文恐怕没法很好地与他沟通呢。
做归类倒是简单,我现在本来就标识了每个网站,把所有纯��
�文名的网站给弄出来,然后去除误判即可。
privoxy的支持暂时没时间搞。sh脚本不会,我都使用Py的。我会
说我在你给的网址里没发现和css有关的范例么。。。
待会儿就把去除冗余的ini规则搞上去。css暂时不搞,css去冗��
�脚本有点问题。

不知道你对本项目有没有兴趣?如果可以的话,你考虑也可��
�加入本项目。

Original comment by hc5023295 on 6 Apr 2013 at 1:24

GoogleCodeExporter commented 9 years ago
1.对于程序脚本:
我不懂写程序的,只是能看懂一些简单的源码和脚本而已。
2.对于维护规则:
其实我觉得现在abp上的EasyList+EasyPrivacy+ChinaList规则已经很齐��
�了(我想这也是fanboy合并easylist以及fanboy的china列表无人维护
的原因吧),我们维护自己的规则的必要性不是很大(sorry泼
你冷水了),而且这是最机械和烦心的活儿。我之所以找到��
�里来,就是为了寻找fanboy的中国部分列表,而我又不会写脚�
��将ChinaList转换成fanboy规则。我觉得我们应该把精力放到为各
种程序做规则转换,我们这个项目的最大亮点也在此吧。
3.对于参与项目
我可以帮忙分析如何转换规则,可我不懂写程序实现。
也可以做一些英文双翻工作。

对于oprea:
如果我们不维护自己的规则了,那么可以先直接转换abp的China
List成为opera规则的两个文件,然后附加到fanboy规则里就行了��
�以后有再去实现去除重复,可以写个项目roadmap做下说明。
对于privoxy:
我是最推荐使用这个程序的,不仅能使各个浏览器通用翻墙��
�理(浏览器设置代理http://127.0.0.1:8118,privoxy里设置翻墙代理
如http://127.0.0.1:8086),还能屏蔽广告(uri和类似css的filter),�
��是规则使用正则表达式(domain部分又不使用正则表达式),
比较特殊。最重要的是这个程序的资源占用超级少!firefox装�
��abp臃肿得不成样子,明显减慢载入速度。
http://andrwe.org/doku.php/scripting/bash/privoxy-blocklist
你运行试试这个sh脚本就可以看到转换后的filter规则了,是转
换成正则表达式的,用来查找和改写网页里的element,以实现c
ss屏蔽广告的效果。只要知道了转换原理(相当于算法吧),
我想可以很容易写成python脚本的。

Original comment by westmin...@gmail.com on 6 Apr 2013 at 2:36

GoogleCodeExporter commented 9 years ago
说实话,其实没有泼冷水啦。现在由于时间关系还有精力的��
�移(现在在进行Mozilla本地化志愿),所以对这个项目也有点
想要做些调整。
你说的那个以脚本为重,我之前也确实想过。之后也有可能��
�这样做。

本来,这个是不要求会编程的。帮忙分析转换规则也行,等��
�有时间了,就把脚本完善一下,到时候再联系你(反正通过�
��里,也能用邮件联系到)
正则式其实据说比较耗费速度的。而转换成正则的脚本其实��
�有,但是暂时还不支持Chinalist(没有把某些特殊的叫做“规�
��选项”的东西完全转换了)

需要你的参与的,是分析要怎么转换,还有联系一下Fanboy,��
�者Chinalist,来搞一下,不过这是后话了。

Original comment by hc5023295 on 7 Apr 2013 at 1:53