Closed SKART1 closed 10 years ago
Отпишись реально ли выполнить и берешься или нет как можно раньше
Получить html в виде xml можно. Вот, например, библиотека HtmlCleaner, как раз парсит html. Очень просто переводит страницу в xml
CleanerProperties props = new CleanerProperties();
// set some properties to non-default values
props.setTranslateSpecialEntities(true);
props.setTransResCharsToNCR(true);
props.setOmitComments(true);
// do parsing
TagNode tagNode = new HtmlCleaner(props).clean(
new URL("http://www.chinadaily.com.cn/")
);
// serialize to xml file
new PrettyXmlSerializer(props).writeToFile(
tagNode, "chinadaily.xml", "utf-8"
);
Но хотелось бы, чтобы в результирующем xml-файле были не все тэги сайта, а только такая информация (что-то типа):
Вид XML ответа
<Response>
<Latitude>59.8944</Latitude>
<Longitude>30.2642</Longitude>
</Response>
Для того, чтобы я мог проще парсить этот самый xml-файл.
В коде широта и долгота в следующем виде:
" Долгота: 8 " Широта: 47
Смотри код комментария
@GimAndMed тебе надо Диме отдать xml - Дима его уже отпарсит
Дома буду только в 19, Дима так до 18 закончить не успеет. как получить всю страницу в xml я написал. Вечером, конечно, сделаю.
Сделал так, что сразу получаю xml, и тут же вытягиваю из него широту и и долготу.
@321SKART123 Я переписала проект под другой сервис определения координат, там больше адресов. скинуть?
Отпишись можешь ли ты получить html страницу в виде строки/xml/вообщем, и скажи @dm-kiselev в каком формате её реально получить чтобы он смог писать парсер
Вот пример запроса: http://geoiptool.com/ru/?IP=80.91.245.98
задание тоже очень важное - т.к. в http://freegeoip.net/ многих адресов нет
Желательно выполнить к сегодняшнему (23.12.2013) вечеру