maniekstasz / OfferSeeker

Other
0 stars 0 forks source link

Podstawowa wersja PageProcessora #15

Closed konik32 closed 10 years ago

konik32 commented 10 years ago
  1. Trzy Interfejsy do komunikacji z serwerem:
    • wywoływanie algorytmu
    • obsługa feedbacku od użytkownika
    • zwracanie danych
  2. Wersja powinna umożliwiać ocenę czy coś jest ogłoszeniem czy nie (mniej lub bardziej trafnie) i zwracać je przynajmniej jako html.
bambalooon commented 10 years ago

Moim zdaniem dane nie powinny być zwracane jako HTML - nie o to chodzi w naszym module. Powinniśmy tak jak napisał @bartQH w #6 zwracać wygenerowane ID, wyekstraktowany opis i w przyszłości więcej. Ewentualnie podział naszego serwisu na dwa moduły - wtedy nasz serwis zwraca tylko true/false - które mówi czy dostaliśmy ogłoszenie czy nie. Natomiast nowy serwis zajmie się ekstrakcją danych z ogłoszenia.

konik32 commented 10 years ago

HTML miał być tylko podstawową wersją, żeby coś było. Jeśli uda wam się wyciągnąć opis to super.

konik32 commented 10 years ago

Postarajcie się pisać swoj moduł tak aby działał na wielu wątkach(jak najwięcej singletonów, jeśli się nie uda to dla każdego zapytania twórzcie nowy obiekt). Jeśli się nie uda to trudno, ale miejcie to na uwadze.

bambalooon commented 10 years ago

Oczywiście tak zrobimy, ja już sobie ustawię beany w springu. Będzie też to wzór dla ludzi, którzy ze springiem nie mieli do czynienia.

ghost commented 10 years ago

Podstawowa wersja PageProcessora z testami jest już gotowa. Ewentualnie jakieś poprawnki jeszcze nanieść w kodzie. Pobiera url z adresem strony. Szuka ogłoszenia. Pobiera ogłoszenie. Wywala z niego znaczniki formatujace i zwraca ogłoszenie jako czysty tekst.

Etap II - zapis plików do bazy danych. Zapisywanie ocen od użytkownika.

Etap III - utworzenie preprocessora, który powycina ze słów polskich końcówki (jak zrobiłam/zrobiłem -> zrobił) i ich zliczenie

Etap IV - nauka komputera rozpoznawania