bootmortis / iran-hosted-domains

"Iran Hosted Domains" is a comprehensive list of Iranian domains and services that are hosted within the country.
MIT License
829 stars 108 forks source link

افزودن سورس: لیست تحریم #122

Closed mmrabbani closed 9 months ago

mmrabbani commented 1 year ago

هر شرکتی که آمریکا تحریم میکنه، مجبور هست که سایتش را داخل ایران نگه دارد. چون هیچ هاست خارجی به او سرویس نمی‌دهد. حالا میتوان از این موضوع استفاده کرد و از لیست تحریم، هر کدام که مربوط به ایران بود، سایتشان را در لیست قرار داد. لیست شرکت های تحریم شده در همه فرمت ها از جمله csv و xml قابل دانلود است https://ofac.treasury.gov/specially-designated-nationals-list-data-formats-data-schemas

mmrabbani commented 1 year ago

اگه حوصله اتوماتیک کردن استخراج از لیست رو ندارید، من لیست رو بررسی کردم و ۱۸۰ تا دامین جدید داخلش وجود داره. میتونید همین لیست رو اضافه کنید. طبیعتا این لیست هر روز تغییرات زیادی نداره SDN-new.xlsx

bootmortis commented 1 year ago

ممنون در اولین فرصت اضافه می‌کنم الان وقت ندارم اگر کس دیگه‌ای می‌تونه اضافه کنه خوشحال می‌شم PR بزنه

bootmortis commented 9 months ago

لیست رو بررسی کردم دومین غیر ایرانی زیاد هست حتی تو لیستی که شما هم فرستادید زیاده مثل image

تا روشی دقیق و مشخص برای پیدا کردن دومین‌هایی که مستقیما مربوط به ایران هستن پیدا نشه ایشو رو میبندم

این کدی بود که تا اینجا روش کار کردم:

def sdn() -> Iterable[str]:
    rsp = requests.get(consts.sdn_url)
    rsp.raise_for_status()

    text = rsp.text
    text = text.splitlines()

    urls = []
    for line in text:
        if 'iran' in line.lower():
            urls.extend(re.findall(r'Website (.+?);', line))

    # remove all russia, china, cuba, north korea, syria, venezuela, zimbabwe, belarus domains
    urls = filter(lambda x: not re.search(r'\.(ru|cn|cu|kp|sy|ve|zw|by)', x), urls)

    return list(set(urls))