LIBCAS / DL4DH

DL4DH – development of tools for effective utilization and mining of data from digital libraries to reinforce digital humanities research
GNU General Public License v3.0
8 stars 2 forks source link

Metodika #34

Closed daliboris closed 1 year ago

daliboris commented 2 years ago

Metodika DL4DH

Návrh osnovy metodiky. (Body dodané 9. 2. jsou zobrazeny tučně.)

Podklady

RIV

Definice druhů výsledků ve formátu .docx

Výsledek „Metodika“ je souhrnem doporučených praktik a postupů schválených, certifikovaných nebo akreditovaných kompetenčně příslušným orgánem veřejné správy … a s jednoznačně vymezenými uživateli tak, aby tito uživatelé měli jistotu, že při jejím dodržení budou získané výsledky průkazné, opakovatelné a že se jich lze dovolat.

Výsledek „Metodika“ realizoval původní výsledky výzkumu a vývoje, které byly uskutečněny autorem nebo týmem, jehož byl autor členem.

… musí být takové schválení/certifikace/akreditace uděleno na základě vypracování dvou nezávislých oponentních posudků …

Příklady metodik

Metodiky od roku 2016, oblast humanitních věd, poskytovatel MK, vyhledáno v RIVu

Úvahy o metodice DL4DH

Ideální čtenář/uživatel metodiky

Co by se čtenáři/uživatelé měli dozvědět

bezovam commented 2 years ago

Pardon, nikdy jsem metodiku nepsala, tak možná moje komentáře půjdou trochu mimo Kramerius+ nasazení+konfigurace - počítá se i s přesným popisem (bod po bodu) toho, jak se má nástroj nainstalovat nebo se bude jednat jen o popis HW a SW, které je nutné mít, aby bylo možné ho používat? I

daliboris commented 2 years ago

Není potřeba se omlouvat, metodika se dělá pro všechny, kdo mají o danou problematiku zájem, pokud možno i pro nováčky. Děkuju za otázku, která mě samotného nenapadla. Takže se pokusím za sebe odpovědět.

Cílem metodiky je, aby její čtenáři/uživatelé mohli postupovat bod po dobu (pokud možno) a dospěli ke stejnému výsledku, tj. např. k fungujícímu Krameriu+.

Na druhou stranu, by metodika mohla být nadčasová, aby se nemusela často měnit. Takže by to mohlo vypadat tak, že v ní bude odkaz na stránky DL4DH, kde by měl být proces instalace a nasazení Krameria+ podrobně popsán. Pokud se bude Kramerius+ opravovat nebo dále vyvíjet, informace o nasazení na jeho stránkách by měly být neustále aktuální, takže metodiku nebude nutné přepisovat.

Přikláním se k posledně zmíněnému řešení, tj. v metodice popsat obecně požadavky na HW a SW, popř. obecné kroky při nasazení + na detaily odkázat na stránky DL4DH. Musíme si pohlídat, aby na stránkách DL4DH informace o nasazení byla k dispozici, a to už v době odevzdávání metodiky.

motyc commented 2 years ago

Borisi, jak jsem již psal do emailu, nepřijde mi šťastné vést diskusi k metodice zde na GitHub. Text nejde přímo komentovat či navrhovat změny, není myslím vhodné míchat to s vývojem nástrojů a navíc si myslím, že psaní a související diskuse by měli probíhat neveřejně.

daliboris commented 2 years ago

Myslím, že aktuální podoba metodiky, které jsem teď dal podobu bodů, se ke komentování na GitHubu hodí. Navíc je to zatím ve velmi obecné rovině, žádné detaily.

Další formu a postup prací na metodice, které by vyhovovala všem, jsem chtěl probrat na čtvrteční schůzce.

Napadají mě zatím tyto možnosti:

Formulace textu:

Výsledný text:

hlageek commented 2 years ago

ad výsledný text: @daliboris cítím mezi řádky preferenci githubu, chápu to, taky by se mi dobře pracovalo ve vlastním editoru, ale myslím, že se k metodice potřebuje vyjadřovat širší skupina lidí, pro kterou by git workflow mohla být zbytečná bariéra. Takže spíš Google Docs. Nebo, to na kolaboraci používám já, kompromis v podobě HackMD.

Jinak bych se také přikláněl k tomu věci provozního charakteru během trvání projektu neřešit na githubu. Něco jiného je pak nějaký finální text, který může žít v repozitáři pro další verzování a věcnější diskuse, než jaké se pojí s přípravou draftu.

motyc commented 2 years ago

Ok, proberme to na nadcházející schůzce. Osobně pro podobnou práci preferuji Google Docs/Drive), kde je možné přímo reagovat atd. GitHub je na některé věci super, ale zrovna na kolektivní psaní a brainstorming mi přijde zbytečně komplikovaný a nepřehledný.

K věcnému hledisku - mám pocit, že návrh struktury se nově posunul více od metodiky směrem k manuálu. Hodně ale záleží, kam ty body začleníme a jak budou popsané. Určitě je podstatné, aby metodika obsahově přenositelná, tj. sice svázaná s nástroji DL4DH, ale aby v principu abstrahovala k obecnějším sdělením. Jedině tak bude uplatnitelná dlouhodoběji.

daliboris commented 2 years ago

návrh struktury se nově posunul více od metodiky směrem k manuálu

Popis naší metodiky v přihlášce DL4DH (alespoň doufám, že jde o platnou formulaci z přihlášky; nemám ji k dispozici, vycházím z Jarmiliných podkladů):

“Metodika bude popisovat, jakým způsobem lze pomocí v projektu vyvíjených nástrojů těžit data z digitálních knihoven. Metodika představí různé možnosti exportu dat a na praktických příkladech uvede způsoby jejich konkrétního využití vědci. - Odborní uživatelé digitálních knihoven, vědečtí pracovníci v oblasti digitálních humanitních věd, vědecké týmy využívající funkcionalitu vyvíjených nástrojů (zástupci z řad archeologů, etnologů, religionistů, historiků).”

V čem vidíš, @motyc, rozdíl mezi metodikem a manuálem?

Existuje několik významů slova metodika (citováno z Akademického slovníku cizích slov).

metodika [-dy-], -y ž <r < ř>

  1. pracovní postup: m. výzkumu
  2. nauka o metodě vyučování: m. češtiny
  3. nauka o metodě vědecké práce

Metodiku vzešlou v rámci DL4DH jsem chápal v prvním významu, čemuž podle mě odpovídá jak definice typu výsledku, tak popis výstupu v přihlášce.

motyc commented 2 years ago

@daliboris manuál chápu jako návod ke konkrétní aplikaci/nástroji (apod.); metodiku chápu jako popis obecnějších principů, kdy nějaký postup vede k určitému cíli, ale nástroje si pro daný účel můžu vybrat víceméně takové, jaké jsou aktuálně nejvhodnější k dispozici. Samozřejmě to trošku zjednodušuji, ale prostě od metodiky bych čekal primárně to, že mi umožní věc pochopit a reprodukovat postup, od manuálu čekám, že budu vědět, jaké tlačítko mám zmáčknout, aby to něco udělalo...

Ten posun myslím směrem od toho, co jsi posílal před týdnem a prezentoval na schůzi. Nicméně jak jsem psal výše. Hodně záleží, jakou formou a do jakého kontextu se ty Tvé nadhozy zapracují. Rozhodně to nechci nějak zatracovat jako špatné!

daliboris commented 2 years ago

aby metodika obsahově přenositelná, tj. sice svázaná s nástroji DL4DH, ale aby v principu abstrahovala k obecnějším sdělením. Jedině tak bude uplatnitelná dlouhodoběji

Neumím si teď moc představit ona obecnější sdělení. Pokud by byla typu "zvolili jsme třívrstvou architekturu kvůli lepšímu výkonu, dlouhodobým úlohám", "replikace databáze Apache Solr", "obohacení textových dat pomocí aktuálních nástrojů poskytovaných infrastrukturou LINDAT/CLARIAH-CZ", "morfologická anotace ve formátu Universal Dependencies, protože..." atp., určitě to tam má své místo, ale přijde mi to na jednu stranu triviální (třívrstvá architektura), závislé na aktuálním řešení Krameria (replikace Apache Solr) a obvyklé (použití nejnovějších trendů typu Univerzal Dependencies).

Proto si myslím, že zvolené řešení, tj. DL4DH, závisí na tom, co máme k dispozici (Krameria, UDPipe) a že pro jiné instituce to v tomhle směru bude použitelné jenom částečně a po nějakou dobu.

Z obecnějších, nadčasovějších věcí mě napadá spíš něco ve stylu best practice v DH, ale nerad bych, aby z metodiky vznikla učebnice DH pro práci s velkými daty, a to z několika důvodů:

zabak commented 2 years ago

Ano, metodika musí být zaměřena na to, jak využít konkrétní nástroje, které dáváme k dispozici. Zobecnění bude spíš na úrovni toho, co všechno ty nástroje umožňuji, k čemu se dají využít.

motyc commented 2 years ago

@daliboris Zkusím to konkretizovat - třeba toto mi typicky přijde jako údaje, které nepatří do metodiky, ale do manuálu k dané aplikaci:

  • Kramerius+ -- nasazení (požadavky na HW a SW), -- konfigurace (interní a externí služby) -- provoz (aktualizace SW, synchronizace dat)

Bude to ale lepší probrat zítra.

daliboris commented 2 years ago

Jestli to tedy chápeme stejně:

Formulace typu Pro vyhledání většího počtu relevantních dokumentů můžete použít hledání podle lemmatu, nejen konkrétního tvaru slova. je na úrovni metodiky, věta Pro vyhledání lemmatu (všech tvarů slova) v dokumentech zaškrtněte volbu 'všechny tvary'. je na úrovni manuálu.

Podle mě by v naší metodice mohlo a mělo být obojí. Samozřejmě tam, kde to bude funkční, a jen do/od určité míry obecnosti i konkrétnosti.

motyc commented 2 years ago

Ano, potvrzuji, chápeme se stejně.