bigdargon / hostsVN

Hosts block ads of Vietnamese
https://bigdargon.github.io/hostsVN
MIT License
467 stars 133 forks source link

Về hosts dạng domain và góp ý về việc chỉ nên chuyên biệt VN #66

Closed nmhung1985 closed 5 years ago

nmhung1985 commented 5 years ago

Chào bạn, lại thêm 1 nỗ lực chặn quảng cáo cho VN, hình như cũng lâu mà hôm qua mình mới biết. Thấy bạn làm có vẻ khá chuẩn nên xin gửi đôi lời cải tiến, ko phải issue nhưng do ko thấy chỗ để gửi feedback nên đành tạo ở đây vậy.

  1. Loại hosts chỉ có domain, bạn đưa link tải lên thêm các nơi dễ biết một chút (trang chủ, wiki). Mình tình cờ đọc cái issue đầu tiên nên mới thấy link, ko là ko hề biết luôn. Khá nhiều app dùng loại hosts này đấy, như mình trên Samsung Galaxy Note 8 dùng Adhell.

  2. Ko thấy bạn ghi chi tiết, cũng như chưa đủ trình để so, nhưng khi mình add vào app của mình thì báo rằng:

    • bộ lọc nước ngoài sẵn có là 10792 domain
    • bộ lọc của bạn là 10791 domain App tổng hợp và lọc các bộ lọc trùng lặp thì còn 18666.

Về cách dùng bộ lọc thì trước giờ mình thấy bắt nguồn từ logic/tiêu chuẩn của trình chặn quảng cáo nổi tiếng thời đầu là Adblock Plus, thì khi cài app chặn quảng cáo thường có sẵn bộ lọc tiếng Anh, cũng như hiện tại có một số link bộ lọc nổi tiếng toàn cầu để xử lý các trang tiếng Anh. Do đó, thường là khi tạo bộ lọc để chặn các trang của 1 vùng khác/1 ngôn ngữ khác, người ta khuyên chỉ nên tạo bộ lọc bổ sung để dùng với bộ lọc đi kèm app/bộ lọc nổi tiếng toàn cầu, ko nên dùng lại các rule đã có sẵn của các bộ lọc nổi tiếng kia.

Ở đây, với app của mình cho thấy của bạn có khoảng 8000 trong số 10791 domain là ko bị trùng. Vậy cũng là rất ổn, nhưng nếu tối ưu thêm chắc sẽ tốt hơn nữa.

bigdargon commented 5 years ago

Chào bạn @nmhung1985 ! Rất cám ơn bạn đã để tâm và góp ý github của mình! Vì github không hẳn là code nên bạn cứ đăng bài như diễn đàn, khi xong mình sẽ close lại. Vấn đề của bạn mình trả lời như sau:

  1. Loại hosts chỉ có domain, bạn đưa link tải lên thêm các nơi dễ biết một chút (trang chủ, wiki). Mình tình cờ đọc cái issue đầu tiên nên mới thấy link, ko là ko hề biết luôn. Khá nhiều app dùng loại hosts này đấy, như mình trên Samsung Galaxy Note 8 dùng Adhell.

Vì mình tạo hosts này để dùng chung cho cả ios lẫn android, vấn đề hosts chỉ chặn qc vn thì gặp tình huống trớ trêu bên ios là có những apps chỉ cho chọn 1 file cấu hình duy nhất để lọc như Surge hay Shadowrocket. Do đó mình phải gom lại thành 1 file để có thể dùng chung cho mọi hệ điều hành, nhưng mình đã tối ưu không copy vô tội vạ rồi thêm vào!

Mạng nội bộ của mình sử dụng Pihole để làm dns chặn qc, khi mình truy cập dựa trên log chặn mà pihole tạo ra, từ đó mình sắp xếp vào bộ lọc của mình, nghĩa là bộ lọc của mình dựa trên những tên miền mà ở vn truy cập phổ biến. Mục tiêu của mình là dùng tất cả trong 1 để đơn giản k cần thêm nhiều hosts khác để mất thời gian chọn lựa.

Bên ABPVN cũng đã hợp nhất list của mình vào để làm nguồn chặn qc trên android bạn có thể tham khảo https://abpvn.com/android

Phần cấu trúc nội dung hosts mình đã puplic nên bạn sẽ thấy, mình phân loại theo group bao gồm những tên miền có nhiều hơn 4 tên miền, những tên miền vn mà ít tên miền mình nhóm vào 1 chỗ và phía dưới là những tên miền nước ngoài.

nmhung1985 commented 5 years ago

Bạn nói Pihole, rồi lọc từ log Pihole để tạo bộ lọc là biết pro rồi. Nếu vậy thì có cách này chắc là bạn có thể làm được dễ dàng chăng?! (Nãy định viết trong post đầu mà thấy dài quá nên thôi chờ bạn trả lời xem sao).

Đó là tạo duy trì thêm 1 bộ lọc chỉ chuyên biệt chặn web VN. Cái này thực chất cũng như bên Adblock Plus, họ có bộ lọc mặc định là EasyList, vd khi hỗ trợ VN họ duy trì cả 2 link:

Mình thấy bạn tạo nhiều file đồng thời nên chắc thêm 1 cái nữa ko khó phải ko nhỉ? (Sorry nếu mình nói ko đúng. Mình ko biết về code kiếc này nọ, quan sát thì suy ra vậy thôi).

Ps: À mà mình muốn nói chung cho nhiều platform chứ ko riêng gì android. Mình chính vì đang dùng abpvn nên mới biết tới github này. Mình cũng đang dùng script Diversion.ch chặn qc trên router Asus nữa nên càng cần loại bổ sung, do các loại script này thường họ set sẵn một vài bộ lọc nổi tiếng rồi.

bigdargon commented 5 years ago

Về phần tạo bộ lọc qc, sau khi mình tạo hosts chặn qc, có 1 số bạn trên diễn đàn cũng đề xuất làm bộ lọc riêng phát triển cho người Việt. Nhưng mình tìm thấy hiện tại có 2 bộ lọc đã và đang phát triển bộ lọc dạng như bạn nói nên mình tập trung làm files hosts sẽ tốt hơn vì mỗi bên mỗi công việc! 2 bộ lọc mình nhắc đến:

nmhung1985 commented 5 years ago

À, hiểu nhầm rồi, dùng thuật ngữ tiếng Anh là biết ngay mà cứ dùng tiếng Việt hơi lộn xộn :) Ý mình là tương tự như Adblock Plus duy trì 2 loại filters list, thì đề xuất bạn cũng duy trì 2 loại hosts được ko:

bigdargon commented 5 years ago

Mình hiểu ý bạn rồi! Mình sẽ làm thêm 1 hosts chỉ tên miền VN trong đợt update kế tiếp!

nmhung1985 commented 5 years ago

Hoan hô! :D Sợ từ đang nói ko chuẩn nên xin nói lại lần cuối cho chuẩn nhé. Ko chỉ tên miền .vn mà cho cả:

bigdargon commented 5 years ago

Theo mình thì 2 tôn chỉ đầu khi làm hosts riêng ở vn là trang có tên miền .vn và trang viết bằng tiếng việt! Vì nếu có ý thứ 3 như bạn nói thì giống tôn chỉ ban đầu khi mình làm hosts rồi 🤪🤪

nmhung1985 commented 5 years ago

Ừm, chỉ là vài gợi ý, như hồi trước mình thử làm bộ lọc thì vào Alexa check các site được truy cập nhiều nhất từ VN. Mấy trang dân mình vào nhiều như đánh bạc, xem thể thao, xxx thì ko phải .vn nhưng các domain ad nhúng ở mấy trang đó có .vn ko nhỉ?

bigdargon commented 5 years ago

Thường thì ở VN chủ yếu là banner sang trang đánh bạc chứ k nhà qc ở vn dám chạy đánh bạc! Ở VN mấy nhà qc k nhiều lắm, hầu như mình đã chặn sạch rồi :rofl:

bigdargon commented 5 years ago

@nmhung1985 hiện tại đã xong file hosts chỉ tên miền qc ở VN, bạn xem tại đây https://raw.githubusercontent.com/bigdargon/hostsVN/master/extend/hostsVN-only.txt

Còn về hướng dẫn ở trang chủ mình chưa viết, vì mình chưa biết trình bày như thế nào và bên wiki mình viết khá đầy đủ 😆

nmhung1985 commented 5 years ago

Ồ, ngon rồi! :D Nhờ bạn tạo thêm loại domain luôn nhé 👍

Còn viết thì gì đâu, dân IT ko chuyên trình bày thì chỉ cần thêm vài ba dòng :D Ý là hồi đầu tại vì ngẫu nhiên mình đọc issue 1 (là loại closed rồi, bình thường chẳng ai mò vào) thì mới thấy báo là có loại domain.txt, chứ ở wiki hay trang chủ đều ko nhắc tới. Thành ra chỉ đơn giản thêm mục "Các loại file khác" rồi list từng cái và mô tả là xong.