pyk / rojak

Project Rojak, Yuk gabung diskusi di Slack nya Rojak: http://team.rojak.id/
Other
98 stars 46 forks source link

[rojak-pantau] Pantau tirto.id #150

Closed pyk closed 7 years ago

pyk commented 7 years ago

Ada beberapa topik yang bisa kita pantau dari media ini:

Catatannya:

Untuk raw_content kita harus remove noise berita terkait yang ada di artikelnya misal:

<strong>Reporter :</strong> Arlian Buana            <br>
<strong>Laporan 1 : </strong>Agus Harimurti Yudhoyono Si Peselancar Politik<br><strong>Laporan 2 : </strong><a href="//tirto.id/kejayaan-dan-kejatuhan-mulut-ahok-bYV9" class="link-bold">Kejayaan dan Kejatuhan Mulut Ahok </a><br><strong>Laporan 3 : </strong><a href="//tirto.id/anies-baswedan-akhirnya-benar-benar-turun-gunung-bYWa" class="link-bold">Anies Baswedan Akhirnya Benar-Benar Turun Gunung </a><br><strong>Laporan 4 : </strong><a href="//tirto.id/cuma-ahok-yang-punya-tendensi-berseberangan-bYWc" class="link-bold">"Cuma Ahok yang Punya Tendensi Berseberangan" </a><br>

Solusi paling naive mungkin kita ambil nama reporter/author nya lalu kita temove content setelahnya

Feel free to send PR! 🙇

rawgni commented 7 years ago

@pyk untuk artikel yang tidak ada tanggal nya gimana yah ? contoh: https://tirto.id/anies-baswedan-akhirnya-benar-benar-turun-gunung-bYWa

pyk commented 7 years ago

@rawgni kalau gak ada tanggalnya skip aja mas (otomatis udah ke drop kalau gagal ambil date selector)