Closed frenzymadness closed 5 years ago
Materiály jsou nekompletní, naobsahují úkoly k procvičení a neprošly jazykovou korekturou.
Možnosti:
Možnosti:
* Mergneme je teď, protože i s nedokonalým obsahem mohou dobře posloužit jako vodítko dalším přispěvatelům a ukázat strukturu materiálů a do issue napíšeme, co je tam špatně a co chybí. * Doladíme je dost rychle na to, abychom je mohli mergnout bez pochybností a netrvalo to měsíc.
Za mňa by som to mergol, pretože myslím, že teraz potrebujeme hlavne to vodítko a to nekompletnosť ani zlá čeština neobmedzujú. Navyše sa posunieme zase o krok dopredu.
Mergla bych to teď, ať něco máme - pak se to bude vylepšovat.
@janpipek @kokes prosím tedy o review a merge. Issue založím v zápětí.
naucse
mi není ochotné vyrenderovat notebook, ale to je asi chyba v něm?
/home/honza/.local/share/virtualenvs/naucse.python.cz-HiwNkkuB/lib/python3.6/site-packages/nbconvert/filters/highlight.py:138: UserWarning: IPython3 lexer unavailable, falling back on Python 3
warn("IPython3 lexer unavailable, falling back on Python 3")
INFO:werkzeug:127.0.0.1 - - [24/Sep/2019 02:04:03] "GET /course/pydata/pydata/pandas/ HTTP/1.1" 500 -
Traceback (most recent call last):
File "/home/honza/.local/share/virtualenvs/naucse.python.cz-HiwNkkuB/lib/python3.6/site-packages/naucse/models.py", line 621, in __getitem__
return self.course._lessons[key]
KeyError: 'pydata/pandas'
Líbí se mi text k notebooku i obsah úvodní lekce (snad se stihne celá) - dává to smysl a dobře to navazuje. K posouzení, jestli to hovoří na dostatečně začátečnickém levelu, bych pozval někoho, kdo má lepší představu o publiku. @veronikks ?
Přidal jsem několik komentářů - někde jsou to gramatické korekce, jinde ale i otázky k úvaze.
Na detailnějších komentářích k notebooku bych vyzkoušel https://www.reviewnb.com/ .
V obecnější rovině bych se trochu zamyslel 1) nad tím, jestli pokémoni jsou ideální datová sada (každý se rád učí na něčem, co je mu "vlastní", pokémoni můžou někomu připadat infantilní - v horším případě přednášejícímu); 2) jestli je vrhnout rovnou do tabulky se stovkami řádků a desítkou sloupců.
Z praktických úvah: Uvažovali jsme o interaktivitě, tedy nedokončeném kódu, který by se teprve doplňoval. Jak to budeme prakticky dělat? A už na této hodině?
Díky.
Líbí se mi text k notebooku i obsah úvodní lekce (snad se stihne celá) - dává to smysl a dobře to navazuje. K posouzení, jestli to hovoří na dostatečně začátečnickém levelu, bych pozval někoho, kdo má lepší představu o publiku. @veronikks ?
Hodně záleží na lektorovi, nicméně já mám tento obsah vyzkoušený na několika workshopech, kde účastníci Jupyter/Pandas v životě neviděli a po tomto úvodu s ním dokázali po zbytek dne pracovat. Také si myslím, že je to zvládnutélné za dvě hodiny, ale nebráním se tomu to zkusit na nějakém mini workshopu (ostatně jako všechny materiály).
Přidal jsem několik komentářů - někde jsou to gramatické korekce, jinde ale i otázky k úvaze.
Díky!
Na detailnějších komentářích k notebooku bych vyzkoušel https://www.reviewnb.com/ .
V obecnější rovině bych se trochu zamyslel 1) nad tím, jestli pokémoni jsou ideální datová sada (každý se rád učí na něčem, co je mu "vlastní", pokémoni můžou někomu připadat infantilní - v horším případě přednášejícímu); 2) jestli je vrhnout rovnou do tabulky se stovkami řádků a desítkou sloupců.
Podle mě to není tolik o Pokémonech, ale o tom, aby tomu každý rozumněl a nemusel se ještě zamýšlet nad významem jednotlivých sloupců. Parametrům jako výška/váha/barva rozumí každý a nemusí nad nimi tolik přemýšlet jako v případě jiných datových sad ve složitějších doménách. Na workshopech je s tím pozitivní zkušenost i s lidmi, kteří o pokémonech nikdy moc neslyšeli.
Velikost je dle mého také akorát. Přeci jen je lepší učit manipulaci s daty reálné velikosti než jim říkat, že to v praxi vypadá jinak.
Z praktických úvah: Uvažovali jsme o interaktivitě, tedy nedokončeném kódu, který by se teprve doplňoval. Jak to budeme prakticky dělat? A už na této hodině?
Ano, už i tato hodina potřebuje nějaké jednoduché úkoly na závěr. Nesnažil bych se jim to ovšem zbytečně moc připravit. Vycházím z toho, že datová analytika je o odpovídání na otázky - a jestli odpověď vyčtež z grafu dle vlastního výběru, z tabulky, kde ji budeš hledat, nebo si vypíšeš jen konkrétní hodnotu, to už je na tobě - takže bych úlohy koncipoval jako slovní s otázkou, na kterou se známýmí technikami budou snažit najít odpověď. Lektor si během práce studentů připraví vlastní řešení a pak jej společně porovnají. Podle mě je lepší ukázat, že lze jeden problém řešit mnoha způsoby dle preferencí a možností každého analytika a výsledkem je nějaká nová informace místo abychom nějakým testem ověřili, že jejich tabulka na konci vypadá správně a obsahuje to, co má.
Zkusím něco vymyslet a přidat.
Díky.
- ...Jen já jsem zrovna s těma Pokémonama měla na pyworkingu problém, protože jsem o nich vůbec nic nevěděla a najednou se začalo operovat s nějakými pokémonímy pojmy - druhy pokémonů, vlastosti, apod. ...
A to je podle mě ta zbytečná (drobná) komplikace navíc. Že mapuješ nové koncepty na něco, co pravděpodobně neznáš. Neříkám, že je to zásadní, ale kdybych to stavěl od nuly, tak bych se tomu určitě vyhnul. Takhle je to spíš k posouzení, jestli má cenu to řešit - vy se spíš tváříte, že ne ;-)
- Stovky řádků a desítky sloupců podle mě ničemu neva.
Myslel jsem to spíš tak, jestli nemít ještě před načítáním CSV nějakou DataFrame (rozměru ~3x10) sestavenou "ručně".
Aha, ručně určitě stojí za to zkusit, aby věděli, co to ten Frame je a jak vypadá, než načtou velkej ze souboru.
- ...Jen já jsem zrovna s těma Pokémonama měla na pyworkingu problém, protože jsem o nich vůbec nic nevěděla a najednou se začalo operovat s nějakými pokémonímy pojmy - druhy pokémonů, vlastosti, apod. ...
A to je podle mě ta zbytečná (drobná) komplikace navíc. Že mapuješ nové koncepty na něco, co pravděpodobně neznáš. Neříkám, že je to zásadní, ale kdybych to stavěl od nuly, tak bych se tomu určitě vyhnul. Takhle je to spíš k posouzení, jestli má cenu to řešit - vy se spíš tváříte, že ne ;-)
Na workshopu by možná stálo za zvážení to vyměnit, i když by tím příšel o spoustu barevných obrázků, ale tady bych to opravdu nechal. V té lekci nepůjdeme tak daleko, abych se musel vyznat ve vlastnostech pokémonů jiných, než které mají i lidé (váha, výška, barva) a v dalších lekcích budou už zase jiné datasety.
- Stovky řádků a desítky sloupců podle mě ničemu neva.
Myslel jsem to spíš tak, jestli nemít ještě před načítáním CSV nějakou DataFrame (rozměru ~3x10) sestavenou "ručně".
Tady je třeba pamatovat na wow efekt, protože jinak je celé lekce celkem nuda. Když načtu tabulku a hned si s ní začnu hrát, bude to super mocná zbraň za málo peněz a to se bude líbit každému. V dalších lekcích může být dataset klidně vytvořen manuálně, což i pomůže tam, kde budeme potřebovat nějakou speciální charakteristiku.
K posouzení, jestli to hovoří na dostatečně začátečnickém levelu, bych pozval někoho, kdo má lepší představu o publiku. @veronikks ?
@frenzymadness má se začátečnickým publikem větší zkušenosti než já :) Ale mně mně se to líbí, přijde mi to srozumitelné a do dvou hodin akorát.
Tady bych to opravdu nechal. V té lekci nepůjdeme tak daleko, abych se musel vyznat ve vlastnostech pokémonů jiných, než které mají i lidé (váha, výška, barva) a v dalších lekcích budou už zase jiné datasety.
Souhlas. Já také Pokémony neznám a shodou okolností jsme je měli (od jiného lektora) na PyLadies datové hodině taky - a probém to pro mě nebyl.
Myslel jsem to spíš tak, jestli nemít ještě před načítáním CSV nějakou DataFrame (rozměru ~3x10) sestavenou "ručně".
Tady je třeba pamatovat na wow efekt, protože jinak je celé lekce celkem nuda. Když načtu tabulku a hned si s ní začnu hrát, bude to super mocná zbraň za málo peněz a to se bude líbit každému.
S wow efektem souhlasím, ale je pravda, že mi tam trochu chybí zmínka o tom, co je DataFrame a co Series a jak je vytvořit - ale pokud to bude v další hodině a toto má být takový "teaser", tak asi ok. Ale být by to tam podle mě mělo.
K interaktivitě a úkolům: Máme dvě možnosti:
Z následujících důvodů se přihláním k možnosti č. 2:
Souhlas. Já také Pokémony neznám a shodou okolností jsme je měli (od jiného lektora) na PyLadies datové hodině taky - a probém to pro mě nebyl.
Ok, tak v pohodě asi.
K interaktivitě a úkolům: Máme dvě možnosti:
- Interaktivní buňky, které ověřují správnost vypracování zadání. Použito na workshopu Data trinity
- Textové zadání bez ověření odpovědi s možností nabídnout skrytou odpověď pro kontrolu nebo live vypracování lektorem na lekci během práce účastníků (na začátečnickém kurzu používáme první možnost, na workshopech je více času, tak si to klidně spíchnu).
Z následujících důvodů se přihláním k možnosti č. 2:
- Pokládat otázky a hledat cestu k odpovědi mi příjde více analytické než připravit mustr na vyplnění a kontrolovat zda je výsledek správný a ve správném tvaru.
- Textové zadání a textová odpověď je snazší na přípravu a může obsahovat i více možností řešení (cesty, jak se k odpovědi dostat).
- Neriskujeme, že test bude příliš konkrétní nebo příliš obecný.
- Nemusíme nic implementovat (i když něco takového už možná existuje) a řešit, jak to naroubovat na naučse, doručit účastníkům a vysvětlovat, co tam magie dělá a znamená a odkud se bere. Skrýt textovou odpověď nebude tak složité a vystačí si s HTML/CSS přímo v notebooku.
- K odpovědi na danou otázku může existovat mnoho cest a účastník si bude moci vybrat, zda odpověď vyčte z grafu, seznamu či tabulky. Pokud my použijeme něco jiného, bude stačit to jen v hlavě porovnat nebo najít rozdíl mezi tabulkami/obrázky.
- Co když bude cílem úkolu zpracovat graf? Kontrola nějakým testem asi nebude nejsnazší a bude klást překážky kreativitě.
- Cílem úkolu také může být něco nekonkrétního jako např.: najdi chybný sloupec v datech atp., což se nebude snadno kontrolovat.
- Pokud nebude každý úkol nutně implementační, což v případě textového zadání a odpovědi být nemusí, můžeme jich mít více a proložit jimi hodinu. Např.: "Podívej se na výpis z předchozí buňky, je tam ještě něco špatně?"
Ono to není tak černobílé a hlavně binární. A asi to tady hned nevyřešíme. Pojďme uzavřít ticket a tímhle se zabývat separátně.
Všechny změny sloučeny do čtyř původních commitů, pro nedořešené otázky máme issues #7 a #8 .
Obsahuj i commity z #1 , takže zajímavé jsou jen čtyři poslední.
Jsou to převážně recyklované materiály z předchozích workshopů. Určitě potřebují jazykovou korekturu a případné doplnění toho, co považujeme za důležité zmínit, ale jako nástřel struktury budoucí tvorby to poslouží dobře.