Closed batya239 closed 12 years ago
Спасиб, мы посмотрим)
done
Что использовали? Commit в студию
boilerpipe и использовали, в первом приближении работает ок
Класс ArticleCleaner - обёрточка для экстрактора из boilerpipe (ArticleExtractor). Работает хорошо, есть маленький тестик на это дело.
Нужен утиль для чистки новостей, который чистит их от html (примеры в базе)