Open akhtyamovpavel opened 2 years ago
https://github.com/andreybabynin/sentiment-bot-pulse/blob/main/classes/graphics.py#L78-L90 - я не понял, что здесь происходит. Стоит избавиться от сокращений, чтобы сделать картину более понятной
https://github.com/andreybabynin/sentiment-bot-pulse/blob/main/classes/graphics.py#L91-L92 - аналогично здесь
Логика следующая: в поле mentioned тикеры всех компаний, упоминающихся в одном посте. Например, в посте про Газпром могут быть упомянуты следующие тикеры GAZP, ROSN, NVTK, LKOH. Я ищу связи компаний в постах про Газпром. Конечно, все компании будут связаны с GAZP в первую очередь, поэтому я выкидываю упоминание Газпрома, для того чтобы посмотреть на связи между остальными компаниями. list1.remove(df.at[0, 'ticker']). Дальше я строю все возможные ребра из оставшихся компаний. То есть ROSN NVTK NVTK ROSN ROSN LKOH LKOH ROSN LKOH NVTK NVTK LKOH Пары тикеров являются ключами для словаря dic_graph_edges, значения = количество подобных связей в спарсенных постах. Конечный результат создание DataFrame(columns = ['Ticker', 'Target', 'Weight']) для использования библиотекой networkx.
https://github.com/andreybabynin/sentiment-bot-pulse/blob/main/classes/sentiment.py#L17-L18 - каким образом получаются эти модели? Я не увидел, где создаются модели. Думаю, что стоит указать этот параметр в аргументах запуска - для этого можно заранее подгрузить данные через конфиг
Это предобученные модели из папки models (они обучены на мною размеченном датасете из 3551 комментариев).
Привет!
Посмотрел код - в целом, всё отлично! Но есть некоторые комментарии, которые могут улучшить код:
GraphicsTools
, а не чистоGraphics
- посколькуGraphics
- это чисто "графика", а это - абстрактное понятиеВ остальном - всё отлично! Буду ждать новую версию!