fintech-fab / fintech-fab.ru

Fintech Fab Website - стажировка, обучение, тренинги
4 stars 16 forks source link

Анализ объявлений (риэлторов, продавцов) #20

Closed mikanoz closed 9 years ago

mikanoz commented 10 years ago

Вообще проблема современного интернета не в поиске данных, и не подгрузки ежедневно используемых данных, а проблема, в истинности этих данных и мусоре, и фейках.

Например, человек снимает квартиру, заходит на то же самое авито и видит - тут риэлтор, там риелтор. А где реальные продавцы? Куда все делись? А ведь првоерить средствами программного анализа возможно. Если у человека есть 2 объявление о продаже квартиры и там указано 2 одинаковых телефона - он риэлтер, и он не собственник.

Т.е. задача сводится к поиску контактов и квартир, которые употребляются на одном ресурсе единожды. Собственник будет продавать одну и ту же квартиру , а риэлтер несколько.

Данную систему можно применять и к барыгам автомобилей.

Сразу скажу, идея не моя, только что подсказали мне. :)

Quazar99 commented 10 years ago

Люди сами обращаются к риелторам и это правильно. Нам эту прослойку не пробить. На сайте krisha.kz есть фильтры предложения от собственников квартир.

ailsky commented 10 years ago

Задача условно разбивается на 3 подзадачи

По первой подзадаче - копируем решение https://github.com/fintech-fab/fintech-fab.ru/issues/21 используем данные работаем

по второй подзадаче, необходим веб интерфейс в которую засунуть соответствующие инпуты: что ищем, за какой перид, какая цена, какие-то другие параметры. И самая важная опция "только от владельца" и только првоеренные продавцы

В третьей подзадаче получив параметры с веб формы нужно обработать соответствующим образом. Реализовать 3 функции:

По первым двум функциям все стандартно. По третьей необходимо реализовать систему весов и рейтингов.

1) если человек регулярно что-то продает, значит его товар покупают, значит он надежный. И он должен иметь максимальный рейтинг барыги. Тут стоит оговорится, что это применимо только к уникальным товарам, например автомобиль или квартира, товары которые держаться на складе пачками не годятся, т.к. невозможно будет отследить дату продажи и покупки.

За каждый товар даем Х кол-во баллов, сверяем дату появления товара, с датой продажи (деактивации) Хбаллов/[кол-во дней], чем больше дней висит товар без продажи тем меньше баллов получает человек. Задача в лоб, даем за 1 товар 10 баллов, если человек продает в течении 10 дней он хороший продавец (итоговый бал 1.1>1) , если позже 10 дней плохой (0.9<1) Точно так же умножаем этот рейтинг, если человек продает один товар несколько раз (не может продать), в результате его рейтинг мерчанта будет в геометрической прогрессии уменьшатся.

2) Если человек продает много однотипного товара (5 квартир, например) занчит он должен иметь рейтинг владельца минимальный, так же по системе везов множим индексы со значением ниже единицы за каждый активный однотипный товар 0,9х0,9,х0,9 = 0,729

Далее выводим пользователю продавцов отсортированных по рейтингу, либо владельцев сначала, либо хороших продавцов