Closed crysman closed 3 years ago
PS: hledám záměrně na ostrém webu, nikoliv lokálně v *.md a .yml, protože máme nějaké postprocessingové filtry atp. a chtěl jsem ověřit real frontend PPS: teď mě napadlo, že by se ale dala prohledávat lokálně ta zbuilděná verze, čímžto pádem by se s tím dalo pracovat potenciálně i v rámci Travise nebo tak něco
Fajn check, ja pouzivam aspell lokalne v editore, takze kopu odchytim este pred merge. Ale plosna kontrola je fajn napad. Poopravujes to rovno, mozem ti to assignovat?
PS: Nechcem, aby Travis robil automaticke zmeny a ked bude len pustat check, tak ten report tam nikto nenajde.
já to nechcu jako úkol, tu část TODO určitě ne, dal jsem to jako "anyone" - to je práce pro kohokoliv (dobrovolníci, začínající... ideálka podle mě) to otional TODO klidně, to mě baví - lehce jsem to zeditoval Ad Travis: ok, rozumím, souhlasím že auto změny ne - myslel jsem ten report, ale chápu, že je asi těžší se k tomu výstupu dostat pak...
OK, tak jsem to posunul zase, vyhazuje to podstatně méně false-positives. Ukázka:
bohužel, ty věci jako ýroba
vznikají tak, že máme podivný trochu nestandardní zdroják, kde se vyskytují věci jako:
což ten lynx
, který na dump používám, dumpne takto:
zítra to zkusím dumpnout přes elinks
a uvidíme...
první comment aktualizován
PS: bacha na věci, co se tváří jako false-positive, ale ve skutečnosti jsou opravdu špatně, jako třeba Arhenius
- správně je Arrhenius
(dvě r), nebo Antartica
- správně je Antarctica
... odhaduju tak cca 100 chyb online v tuto chvíli (po přidání správných jmen do slovníku). @jankrcal nebo @mukrop mrkni plz na to, a dej vědět, co ještě chybí pro reálné nasazení. Nemyslím jako přímo dávat to jako součást local buildu, spíš nějak rozšířit mezi editory, nebo nevím, prostě, co je next-step, jestli:
a) nic, chyby opravíme jednorázově souhrnně jednou za čas na základě crysmanových reportů
b) chyby bude každý textař odstraňovat postupně sám na "svých" stránkách, lebo se naučí nástroj používat
c) ještě něco jiného
díky #McZ
Chyby jsem upravila.
False positive jsou podle mě následující:
Adapterra Agdata Agora Ahles Ahn Analytics angl anoxia AOPK Artelys ASČR ASEK ASITIS Bacastow Bankwatch Benevity Bereiter Berners Binka BloombergNEF Byrdové Callendar CEE Celine cento Chabada Chappellaz CHP clathrates CORDEX Cryosphere Danišovi DDP Decarbonization deglaciation Delmotte DML DNV DOI DPO Dubroka Edenhofer EEA Eggleston ElectricityMap Energiewende ENTSO env Epica et ETS EUA EUTL EVVO EWF Fornůsková Franciscu Geophys gge ghgprotocol GISTEMP GL Glopolis Hagedorn Hansem Hegerl Heimann Hydrological IEA IFrame IGO Intersucho ISSaR JRC Jule Kalmus Kipfstuhl KlimatickáZměna Knutti Kocelovice Kohnovy Kollárová Kolstad kV kyr Lappeenranta Lenssen Lett LF lifecycle Loa LULUCF MacFarling Marcott Masson Meijer MEMONIA Menne Meure Mikolajice Moldan Monnin MPO Mycu NACE NECP NEFM Nehrbass OTE ourworldindata Pachauri Persin Pierrehumbert PJ pjan PřF přibyde radiative Ralpha RCM Revelle RGGI Riggulsfordovi Rubino Ruedy Rugenstein Satiama Scientifique SCIHUB Scrippsova SDVO SFŽP Siegenthaler SIO Siple Socio Soden Šolomek spoluspalování spoluspaluje SRC SRCCL SROCC Stocker Suessem Supergrid sur SustES Sychra Syokuro TALDICE Talos TES TOTX TYNDP TZB ubyde WAIS WBG wikipedia
Relevantní pro slovník je např. spoluspalování.
@crysman, u několika překlepů se ti nevygenerovalo jejich url (našla jsem přes vyhledávání v celém webu).
Wow, @katkolouchova hustě, ty! :superhero_woman:
Ještě jsem to znovu prošel, ten Tvůj návrh na false-positives, je tam 160 řádků, takže to znamená, že jsme měli 63 unikátních chybných slov v textech. Díky moc za opravu.
A teď k tomu seznamu - debata/otázky:
Callendar
, lebo to vypadá jako překlep, ale když se tak holt někdo jmenuje... co s tím? Pokud bude věta začínat "Callendar is missing the 12th month", bude to věta s chybou, ale spellcheckem to projde... Jakože dilema toho, co má být vlastně ve slovníku... ("Callendar" jsem nepřidal)A teď chyby - podle mě jsou to buď chyby, nikoli false-positives, nebo věci, co by neměly být ve slovníku, a nepřidávám je do něho:
Zbytek (156 slov) přidáno do slovníku i bez kontroly zkratek :warning:
díky
Podle mě je to hotovo. Zavírám.
Máme až 404 překlepů na webu.
TODO anyone:
addWord.sh
)optional TODO (crysman?):
Ukrop
neboWikipedii
INFO/about: dnes jsem si vzpomněl na mnou reportované "nejméně dva překlepy, které jsem neopravil kvůli řasové tísni" a tak mě napadlo se na problém překlepů podívat globálně, a tak to skončilo malým skriptem, který na ostrém webu najde všechna nečeská (dle
aspell
) slova - aktuálně vyhazuje 404 nálezů, z nichž je řada false-positive, ale řada je fakt špatně, namátkou:zazpočítáno, výzkumých, vyvýjet, umožňily
...skript zde: https://github.com/crysman/getAllMisspelledWords
nález zde (updated 2021-01-17 21:46):