Open gengogo5 opened 4 years ago
start_urls
にログインページを設定しているが、できればやりたくない。
パラメータで受け取るstart_urls
はあくまで記事を辿るseedのurlの居場所にしておきたい。
start_urls
の先頭要素にログインURLを挿入すれば、1発目のリクエストはloginフォームに飛ぶはずだが・・・
アクロバティックだが、認証有りフラグをパラメータに持たせてstart_urlsを差し替えるという手段もありそう。
formログインはcrawlspiderでのみ動作確認済み
とりあえずmasterに入れて、ダメだったら直す