Closed matheusraz closed 5 years ago
@karinegmg Percebi que tem linhas removidas e addicionadas que possuem o mesmo conteúdo, ou seja, a pessoa que modificou o arquivo ela na verdade só mudou aquele trecho de código de lugar. Por enquanto esse tipo de modificação eu to classificando como "Modify", mas não sei a interpretação seria essa, a próxima reunião a gente discute isso com mais calma.
@karinegmg Acabei de subir algumas alterações que fiz e também o código gerando minha classificação automatizada pra tu poderes comparar os resultados como a gente tinha discutido. O filtro que fiz foi usando apenas os teus resultados manuais que haviam alteração em arquivos "Kconfig".
CSV que gerei automated-results.csv
Headers do CSV: | Hash | Author | KC-Tags | MF-Tags |
OBS: KC-Tags que não mudaram tags relevantes para classificação (i.e: Alterou apenas comentários no arquivo), deixei como no-tag-changed
, o mesmo para os MF-Tags (Que por enquanto não estão sendo taggeados)
Tratei para classificar quando apenas a lista de adicionados está preenchida, apenas quando a lista de removidos está preenchida e quando ambas estão preenchidas.
No caso de ambas estarem preenchidas há subcenários que tive que levar em conta, como por exemplo, se uma linha numero "x" foi removida e a linha número "x" foi inserida, isso indica que aquela linha foi modificada. Porém há casos em que há linhas que forem adicionadas/removidas num mesmo arquivo que houve linhas modificadas, e isso altera a contagem de linhas. O tratamento para esses casos específicos também foi feito, porém preciso testar com mais exemplos para ter mais certeza de que está funcionando.