Taraflex / Back2stackoverflow

Userscript for redirect to stackoverflow.com from machine-translated sites
The Unlicense
307 stars 11 forks source link

Удалять из результатов поиска неподдерживаемые зеркала #24

Closed lucidyan closed 4 years ago

lucidyan commented 5 years ago

Часть зеркал не имеет ссылки на первоисточник. Предлагаю удалять такие домены из поисковой выдачи.

Примеры: ~~:ru: askvoprosy.com/voprosy/swagger-ui-emplyeed-in-nginx-by-bunled-jar-it-shows-blank-page https://stackoverflow.com/questions/55830873/swagger-ui-emplyeed-in-nginx-by-bunled-jar-it-shows-blank-page~~ (Решено в https://github.com/Taraflex/Back2stackoverflow/issues/20)

:ru: fliplinux.com/rs232-usb.html

:ru: quanz.ru/questions/298321/chto-takoe-pravilnyy-tip-soderzhimogo-v-formate https://stackoverflow.com/questions/477816/what-is-the-correct-json-content-type

~~:ru: codengineering.ru/q/how-can-i-compare-two-revisions-in-git-in-eclipse-58/ https://stackoverflow.com/questions/1396649/how-can-i-compare-two-revisions-in-git-in-eclipse~~ (Решено в https://github.com/Taraflex/Back2stackoverflow/issues/18)

~~:ru: askdev.ru/q/vhod-v-sistemu-vagrant-kak-root-po-umolchaniyu-37268/ https://stackoverflow.com/questions/25758737/vagrant-login-as-root-by-default~~ (Решено в https://github.com/Taraflex/Back2stackoverflow/issues/17)

~~:us: intellipaat.com/community/3314/what-is-the-difference-between-apache-mahout-and-apache-sparks-mllib https://stackoverflow.com/questions/23511459/what-is-the-difference-between-apache-mahout-and-apache-sparks-mllib~~ (Решено в https://github.com/Taraflex/Back2stackoverflow/issues/36)

:cn: qa.1r1g.com/sf/ask/2205565841/ https://stackoverflow.com/questions/31508083/difference-between-dataframe-dataset-and-rdd-in-spark/

~~:cn: itranslater.com/qa/details/2123113449512240128 https://stackoverflow.com/questions/31508083/difference-between-dataframe-dataset-and-rdd-in-spark/~~ (Решено в https://github.com/Taraflex/Back2stackoverflow/issues/27)


Есть расширения, которые это реализуют

Taraflex commented 5 years ago

Я планировал в будущем использовать гугл транслейт (эмуляция запросов от оф. браузерного расширения) для обратного перевода названий вопросов на en а дальше https://github.com/Taraflex/Back2stackoverflow/blob/master/back2stackoverflow.user.js#L81 Но пока настроения не появилось таким заниматься.

Taraflex commented 5 years ago

Кстати только сейчас заметил содержание футера на quanz.ru 😄😄😄

lucidyan commented 5 years ago

А там у всех копирайты висят :) Особо цинично выглядит футер askvoprosy, спертый со stackexchange, в котором все ссылки неактивны (логотип же - прямая отсылка к ask.ru)

lucidyan commented 5 years ago

Насчет автоперевода, как я понимаю, пользователю будет нужно будет свой токен вставлять в скрипт?

Taraflex commented 5 years ago

Не уверен насчет гугла, но с яндекс переводчиком можно точно работать без токена, пока с одного ip не станешь переводить в промышленных масштабах. Наверняка с гуглом также, ведь браузерное расширение не спрашивает у пользователя токен для работы.

Taraflex commented 5 years ago

askvoprosy.com / codengineering.ru исправлено частично intellipaat.com - вроде как и не копипаста, а реальные ответы. В любом случае оно на EN и не требует перевода

lucidyan commented 5 years ago

@Taraflex я ошибся со ссылками в intellipaat. Пример воровства

Считаю, что переопределять нужно, чтобы пользователь попадал на полноценный сайт, в любом случае. В данном случае видно, что индексация провелась один раз и все ответы протухли. Плюс, на будущее, пригодится, для раннего перенаправления, чтобы

Taraflex commented 5 years ago

@lucidyan На intellipaat.com похоже как на и askdev.ru сворована лишь часть вопросов. И как различать какие нужно перенаправлять, а какие нет - у меня пока идей нет.

Taraflex commented 5 years ago

Кстати насчет fliplinux.com Я перепробовал все переводчики доступные в https://quest-app.appspot.com/home и не смог получить такого же отвратного перевода ни в каком и них. Прямо фантастика. Даже на тех китайских переводах получается более менее находить оригиналы вопросов.

Taraflex commented 5 years ago

https://github.com/Taraflex/Back2stackoverflow/issues/27

lucidyan commented 4 years ago

На intellipaat.com похоже как на и askdev.ru сворована лишь часть вопросов. И как различать какие нужно перенаправлять, а какие нет - у меня пока идей нет.

Как пример, можно использовать API и смотреть ответ: https://api.stackexchange.com/docs/search#order=desc&sort=activity&intitle=how-can-i-compare-two-revisions-in-git-in-eclipse&filter=default&site=stackoverflow&run=true

lucidyan commented 4 years ago

@Taraflex Насколько задача актуальна сейчас именно в постановке удаления из выдачи? Мне кажется, её полностью покрывает https://github.com/Taraflex/Back2stackoverflow/issues/11 и эту можно закрывать.