VladlenKaraush / web_crawler

0 stars 0 forks source link

Error running crawler script #2

Open VladislavShubnikov opened 5 years ago

VladislavShubnikov commented 5 years ago

После установки Anaconda3 (а нужна ли она? Это должно быть написано в README.md) можно 1) открыть консоль командной строки (Anaconda Prompt) 2) перейти в папку проекта 3) выполнить команду jupyter nbconvert --to python parser.ipynb которая завершится созданием файла 'parser.py' 4) Запустить python-скрпит командой python parser.py 5) В результате получаем сообщение об ошибке: File "parser.py", line 93 avito_soup = BeautifulSoup(avito_real_estate) ^ IndentationError: unexpected indent


и действительно, в этом файле отступы сделаны на 4 символа, а не на 2, что ожидается python-ом:

avito_real_estate = urllib.request.urlopen("https://www.avito.ru/sankt-peterburg/kvartiry/prodam").read()

parse avito with beautiful soup

avito_soup = BeautifulSoup(avito_real_estate)
VladlenKaraush commented 5 years ago

Если запускать команду jupyter nbconvert --to script за место jupyter nbconvert --to python, то отступы переносятся корректно, зафиксировал это в README.md

VladislavShubnikov commented 5 years ago

Проблема с неправильной генерацией py файла не исправилась: в созданном файле явно не правильные отступы, о чем ругается python при выполнении команды "python parser.py": WebCrawler>python parser.py File "parser.py", line 93 avito_soup = BeautifulSoup(avito_real_estate) ^ IndentationError: unexpected indent