sreznick / citation-checker

0 stars 0 forks source link

Detect closely similar texts #6

Open sreznick opened 3 years ago

V3RGANz commented 2 years ago

baseline solution https://github.com/sreznick/citation-checker/commit/1340586a5c1f2af9b57d491e50d0454db091832c

cosine_sim_texts('Бунт начнется с атеизма', 'революция непременно должна начинать с атеизма', model, tokenizer)
0.8229719400405884
cosine_sim_texts('Бунт начнется с атеизма', 'революция начинается с атеизма', model, tokenizer)
0.9000871777534485
cosine_sim_texts('Бунт начнется с атеизма', 'революция начинается с отказа от бога', model, tokenizer)
0.7878341674804688
cosine_sim_texts('Бунт начнется с атеизма', 'Революции готовят гении, делают романтики, а её плодами пользуются проходимцы', model, tokenizer)
0.5661242008209229