OSLL / code-plagiarism

Program for finding plagiarism in the source code written on Python3, C, C++ based on compare AST metadata.
MIT License
9 stars 1 forks source link

Использование библиотек для взаимодействия с GitHub #171

Open mirrin00 opened 1 year ago

mirrin00 commented 1 year ago

Описание

Замена "сырых" запросов к GitHub через requests на библиотеку PyGithub или её аналог

Artanias commented 1 year ago

Я думал может ещё посмотреть в сторону чего-то асинхронного.

mirrin00 commented 1 year ago

Я думал может ещё посмотреть в сторону чего-то асинхронного.

Есть опасение, что PyGithub может не поддерживать асинхронное выполнение (но надо проверять). Мне не совсем понятен выигрыш от асинхронного выполнения: чтобы сравнить деревья нужны файлы, а чтобы их найти нужны репозитории, и тд. Выглядит как последовательное выполнение, поэтому я не вижу возможности применения асинхронного выполнения.

Но можно посмотреть на pool worker'ов, как общий механизм параллеллизма: каждый worker выполняет какую-то самостоятельную отдельную задачу по типу проверить список репозиториев, проверить репозиторий, построить дерево для одного файла, сравнить два дерева, и тп.