OpenDevUFCG / IssueAi

O Issue Ai cria um espaço de visibilidade para os projetos open source de Computação@UFCG.
https://issueai.opendevufcg.org/
MIT License
31 stars 55 forks source link

Repositório para tutoriais e conteúdos sobre Ciência de Dados #29

Closed JuanBarros2 closed 5 years ago

JuanBarros2 commented 5 years ago

Tem algum tempo que eu havia comentado com @juliobguedes sobre como o conteúdo de data science é espalhado e de difícil acesso em alguns casos. Sempre é uma dor de cabeça encontrar tutoriais sobre visualização de dados, utilização de algumas ferramentas de análise e predição de modelos e sempre foi um tema muito querido por nós dois. Chegamos até a criar uma ideia de blog para desenvolver esses conteúdos, mas acabamos deixando na gaveta por um tempo por falta de uma plataforma que ajudasse a expor esse conteúdo. Além disso, seria difícil manter o repositório só os dois, pois não teriamos tempo suficiente pra dedicar toda semana a um post. Daí lembrei da ideia e pensei que poderia ajudar também no Tamburetei. Acredito que existam outras pessoas que também possam compartilhar tutoriais e assuntos importantes sobre visualização, análise, scrapping... Pensei em convidar essas pessoas para ajudar a manter um blog mais robusto contendo esses diversos assuntos da ciência de dados. Poderíamos ter contribuições de outros interessados tbm (@FannyVieira :smile: ).

JuanBarros2 commented 5 years ago

Para isso, precisariamos apenas dessa plataforma em forma de blog que ajudasse a expor o conteúdo. Pensamos em usar alguma framework que já crie a interface, mas no fim, pareceu uma ideia melhor criar o blog na mão mesmo tendo em vista que já temos um certo dominio de web e não parece uma tarefa tão complexa. Além disso, parece ser melhor para tornar a ferramenta mais flexível para diversos formatos de post.

JoseRenan commented 5 years ago

Talvez ao invés de blogs completos, poderiam ser notebooks explicativos no Tamburetei, como Nazareno fazia nas aulas de CDD, ele criava um repo com várias pastas de conteúdos, tipo, regressão linear e dentro dele, criava uns notebooks auto explicativos ou até em forma de post de blog mesmo, pra pessoa ver, aprender e se quiser, até explorar

JoseRenan commented 5 years ago

Só que desse jeito, não fica num site, tem de procurar nas pastas do @OpenDevUFCG/tamburetei :thinking: só se tivesse um jeito de deixar os sources no tamburetei e hostear no github pages de outro projeto, ou só criar outro projeto e linkar no tamburetei como subrepositório

JuanBarros2 commented 5 years ago

É, seria uma ótima fazer isso. Pois ajuda a divulgar um conteúdo, mas mostra o código fonte num formato mais "formal". Gostei da abordagem :+1:

thayannevls commented 5 years ago

Eu tava pensando esses dias da organização ter um blog colaborativo... Os posts seriam com .md dando a liberdade para qualquer pessoa contribuir para o blog por meio de pull requests, e o blog poderia se dividir em categorias, Data Science, Frontend etc.

Se for possível implementá-lo do zero seria ótimo. Se for alguma ferramenta que gera automaticamente eu não veria problema também.

JuanBarros2 commented 5 years ago

Talvez ao invés de blogs completos, poderiam ser notebooks explicativos no Tamburetei, como Nazareno fazia nas aulas de CDD, ele criava um repo com várias pastas de conteúdos, tipo, regressão linear e dentro dele, criava uns notebooks auto explicativos ou até em forma de post de blog mesmo, pra pessoa ver, aprender e se quiser, até explorar

Além de ser mais flexível para pessoas conseguirem contribuir sem precisar saber como funciona a plataforma.

thayannevls commented 5 years ago

No caso ele poderia ser separado por pastas da mesma maneira que @JoseRenan sugeriu, mas também teria a opção de você ver por um site 👀

juliobguedes commented 5 years ago

Só que desse jeito, não fica num site, tem de procurar nas pastas do @OpenDevUFCG/tamburetei 🤔 só se tivesse um jeito de deixar os sources no tamburetei e hostear no github pages de outro projeto, ou só criar outro projeto e linkar no tamburetei como subrepositório

Exato, @JoseRenan. A ideia é realmente por manter o código unificado, e também que a pessoa que escreve o post tenha a liberdade de agir como um "instrutor" para o leitor. Muitas vezes, quando estamos implementando algo para uma disciplina, temos apenas conhecimento teórico visto em sala sobre o assunto, e na hora de praticar as coisas podem se complicar. Algumas vezes também temos boas ideias para implementações mas é difícil, custoso ou até mesmo demorado aprender sozinho. É uma oportunidade incrível de, quem escreve, ter seu domínio fortalecido e, quem lê, aprender coisas novas e ter abertura para implementar suas próprias ideias.

JoseRenan commented 5 years ago

Acho que isso é uma issue pro @OpenDevUFCG/tamburetei, posso mover pra lá?

JuanBarros2 commented 5 years ago

Acho que consigo convencer algumas pessoas a vincular os labs/conteúdos gerados nas disciplinas nesses posts MD.

juliobguedes commented 5 years ago

Acho que isso é uma issue pro @OpenDevUFCG/tamburetei, posso mover pra lá?

Lê meu comentário. Creio que não caiba dentro do tamburetei por justamente não ser exclusivamente ajuda para labs e atividades de disciplinas.

JoseRenan commented 5 years ago

Sobre a ideia de subrepositórios que falei, nesse repo o cara coloca o tema do hugo, dando git clone dentro do projeto git dele, aí quando ele faz isso, fica uma pasta referenciando o github do tema do hugo

fanny commented 5 years ago

Tem algum tempo que eu havia comentado com @juliobguedes sobre como o conteúdo de data science é espalhado e de difícil acesso em alguns casos. Sempre é uma dor de cabeça encontrar tutoriais sobre visualização de dados, utilização de algumas ferramentas de análise e predição de modelos e sempre foi um tema muito querido por nós dois. Chegamos até a criar uma ideia de blog para desenvolver esses conteúdos, mas acabamos deixando na gaveta por um tempo por falta de uma plataforma que ajudasse a expor esse conteúdo. Além disso, seria difícil manter o repositório só os dois, pois não teriamos tempo suficiente pra dedicar toda semana a um post. Daí lembrei da ideia e pensei que poderia ajudar também no Tamburetei. Acredito que existam outras pessoas que também possam compartilhar tutoriais e assuntos importantes sobre visualização, análise, scrapping... Pensei em convidar essas pessoas para ajudar a manter um blog mais robusto contendo esses diversos assuntos da ciência de dados. Poderíamos ter contribuições de outros interessados tbm (@FannyVieira ).

Ameii, vamos sim

Acho que consigo convencer algumas pessoas a vincular os labs/conteúdos gerados nas disciplinas nesses posts MD.

Acho o md melhor também porque mais gente conhece, acaba sendo mais simples pra quem quer começar a contribuir.

juliobguedes commented 5 years ago

Sobre a ideia de subrepositórios que falei, nesse repo o cara coloca o tema do hugo, dando git clone dentro do projeto git dele, aí quando ele faz isso, fica uma pasta referenciando o github do tema do hugo

Comentei sobre usar hugo e fazer posts em .md com @JuanBarros2 mais cedo. Creio que nós, da UFCG, temos muito domínio em desenvolvimento mas pouco espaço e/ou tempo para implementar algo robusto. Implementar o blog nós mesmos eh uma boa forma de criar portfólio e iniciar participação no open source de forma significativa.

thayannevls commented 5 years ago

Bem, se for um blog como entendi, acho que não encaixa muito no Tamburetei, poderia ser algo separado. Eu diria que até um blog da OpenDevUFCG mesmo.

fanny commented 5 years ago

Sobre a ideia de subrepositórios que falei, nesse repo o cara coloca o tema do hugo, dando git clone dentro do projeto git dele, aí quando ele faz isso, fica uma pasta referenciando o github do tema do hugo

O hugo e o jekyll são uma alternativa, thayanne tava comentando comigo, que o jekyll tem mais temas gratuitos, o bom é que os dois não são complicados de configurar.

juliobguedes commented 5 years ago

Bem, se for um blog como entendi, acho que não encaixa muito no Tamburetei, poderia ser algo separado. Eu diria que até um blog da OpenDevUFCG mesmo.

Isso, a ideia que conversei com Juan é essa.

JuanBarros2 commented 5 years ago

Bem, se for um blog como entendi, acho que não encaixa muito no Tamburetei, poderia ser algo separado. Eu diria que até um blog da OpenDevUFCG mesmo.

Eu pensei sobre o escopo do blog e acho que não devíamos misturar com outros assuntos de computação. Ciencia de dados é um nicho específico mas muito abrangente.

thayannevls commented 5 years ago

Eu pensei sobre o escopo do blog e acho que não devíamos misturar com outros assuntos de computação. Ciencia de dados é um nicho específico mas muito abrangente.

O blog poderia ter tópicos/seções. Um deles sendo Ciência de Dados.

thayannevls commented 5 years ago

Comentei sobre usar hugo e fazer posts em .md com @JuanBarros2 mais cedo. Creio que nós, da UFCG, temos muito domínio em desenvolvimento mas pouco espaço e/ou tempo para implementar algo robusto. Implementar o blog nós mesmos eh uma boa forma de criar portfólio e iniciar participação no open source de forma significativa.

Bem se vocês tiverem afim de iniciar esse projeto e botar pra frente acho que por mim tudo bem. Talvez iniciar com uma ferramenta automática(como Jekyll dito por @FannyVieira ou um Hugo) poderia ser um teste e vocês começarem a adicionar alguns posts. Depois implementar do zero o blog

JuanBarros2 commented 5 years ago

Eu pensei sobre o escopo do blog e acho que não devíamos misturar com outros assuntos de computação. Ciencia de dados é um nicho específico mas muito abrangente.

O blog poderia ter tópicos/seções. Um deles sendo Ciência de Dados.

É mas teriamos que ter uma quantidade muito maior de mantedores para dar conta de outras áreas, pode não ser problema, mas pra mim ainda faz mais sentido deixar separado o escopo.

thayannevls commented 5 years ago

É mas teriamos que ter uma quantidade muito maior de mantedores para dar conta de outras áreas, pode não ser problema, mas pra mim ainda faz mais sentido deixar separado o escopo.

Eu acharia legal se fosse um blog que tivesse possibilidade de crescer no futuro e aceitar contribuidores de outras áreas. Tem muitos blogs que possuem Categorias Principais, no caso a única que se teria agora seria Ciência de Dados. Porém tendo a possibilidade de ter outras áreas depois ;p

thayannevls commented 5 years ago

Nesse caso, @thayannevls, um blog open source seria um blog onde as pessoas podem postar de boa? tipo um medium open dev UFCG? só que os posts seriam via PR

Isso, acho simples e prático.

JuanBarros2 commented 5 years ago

É mas teriamos que ter uma quantidade muito maior de mantedores para dar conta de outras áreas, pode não ser problema, mas pra mim ainda faz mais sentido deixar separado o escopo.

Eu acharia legal se fosse um blog que tivesse possibilidade de crescer no futuro e aceitar contribuidores de outras áreas. Tem muitos blogs que possuem Categorias Principais, no caso a única que se teria agora seria Ciência de Dados. Porém tendo a possibilidade de ter outras áreas depois ;p

O que a gente podia fazer, por enquanto, era se preocupar mais com o conteúdo mesmo. Acho que esses MDs seriam uma boa por deixar o conteúdo menos burocrático. Sobre a ferramenta, acho que seria uma nova discussão mais aprofundada sobre isso. Talvez em outra issue...

thayannevls commented 5 years ago

Certo, então vocês podiam começar só com MDs por enquanto talvez?

juliobguedes commented 5 years ago

Nesse caso, @thayannevls, um blog open source seria um blog onde as pessoas podem postar de boa? tipo um medium open dev UFCG? só que os posts seriam via PR

Isso, acho simples e prático.

Sim, exatamente isso.

Eu pensei sobre o escopo do blog e acho que não devíamos misturar com outros assuntos de computação. Ciencia de dados é um nicho específico mas muito abrangente.

O blog poderia ter tópicos/seções. Um deles sendo Ciência de Dados.

É mas teriamos que ter uma quantidade muito maior de mantedores para dar conta de outras áreas, pode não ser problema, mas pra mim ainda faz mais sentido deixar separado o escopo.

Entretanto, o problema que Juan levantou é algo extremamente relevante. Criar todo um sistema de tags ou seccionamento para o blog é toda uma nova etapa de desenvolvimento, quando finalmente formos migrar de um blog estático (Hugo e Jekyll) para um feito por nós, e não vale a pena toda essa etapa de desenvolvimento para deixar as outras seções inutilizadas

thayannevls commented 5 years ago

Alguns temas do Hugo e Jekyll já conseguem separar por temas e tags pelo cabeçalho do markdown, inclusive fazer filtragem. Por isso sugeri de usar um desses no início e se preocupar com a plataforma depois

thayannevls commented 5 years ago

Bem to insistindo nisso porque também tava me interessando em escrever alguns blogs, não sendo Ciência de Dados, talvez um blog da comunidade ajudaria os dois casos e não precisasse criar dois repositórios separados kkkk

thayannevls commented 5 years ago

Mas se vocês quiserem focar em algo pra Ciência de Dados e depois a gente vê isso, de boas

JoseRenan commented 5 years ago

Entretanto, o problema que Juan levantou é algo extremamente relevante. Criar todo um sistema de tags ou seccionamento para o blog é toda uma nova etapa de desenvolvimento, quando finalmente formos migrar de um blog estático (Hugo e Jekyll) para um feito por nós, e não vale a pena toda essa etapa de desenvolvimento para deixar as outras seções inutilizadas

mas daqui que chegasse nesse ponto, a gente já saberia se teria posts em outras áreas tb kkkkkkkkkk a gente só precisa divulgar como: blog pra patotinha de CC, se nn tiver post de outras áreas, quando (se houver necessidade) for implementar um nosso nn coloca tags

juliobguedes commented 5 years ago

No meu ponto de vista, é mais interessante ter algo conciso, conhecido e consolidado, antes de estar abrangendo outras áreas. Assim como em empresas, expandir deixa o todo muito mais frágil, mas começar já expandido pode ser ainda pior.

Bem to insistindo nisso porque também tava me interessando em escrever alguns blogs, não sendo Ciência de Dados, talvez um blog da comunidade ajudaria os dois casos e não precisasse criar dois repositórios separados kkkk

Também tenho interesse em escrever sobre ferramentas e tópicos gerais, mas concordo com @JuanBarros2 quanto a manter isolado por enquanto.

JuanBarros2 commented 5 years ago

Para mim, faz sentido começar com MDs pq são mais flexíveis e ainda estamos numa fase muito experimental. Precisamos de formas simples de produzir e rápidas de expor. Acho que o objetivo era mais tapar esse buraco que vemos em ciência de dados. Claro que existem outras deficiências em outras áreas mas mesmo tagueando conteúdo, ainda temos que CD é uma área vasta demais para ter tantas subtags.

thayannevls commented 5 years ago

Pera, então seria algo mais como notebooks e tutoriais?

JoseRenan commented 5 years ago

Entretanto, o problema que Juan levantou é algo extremamente relevante. Criar todo um sistema de tags ou seccionamento para o blog é toda uma nova etapa de desenvolvimento, quando finalmente formos migrar de um blog estático (Hugo e Jekyll) para um feito por nós, e não vale a pena toda essa etapa de desenvolvimento para deixar as outras seções inutilizadas

Ainda sobre isso, se pegar o material do tamburetei e socar num blog, tipo, ao invés de vc colocar código raw no tamburetei, vc colocar código explicado num MD, já vira a ideia do blog genérico que foi citada, com áreas de programação básica, de EDA/LEDA, de Data Science e etc

JuanBarros2 commented 5 years ago

Pera, então seria algo mais como notebooks e tutoriais?

Tudo que fosse visto como lacuna ou conteúdo importante acho que seria válido. Exemplo: Diferenças entre R e Python na prática, Tutoriais de como usar uma ferramenta específica, Exemplos de visualizações com um mesmo dado...

JoseRenan commented 5 years ago

Nn sei se foge muito do escopo, só joguei kkkkkkkkkkkkkkkkk

JuanBarros2 commented 5 years ago

Para concluir, coloquem um :+1: para finalizar a discussão: Fica acordado a criação de um blog (inicialmente com ferramentas simples) para exibição de conteúdo unicamente relacionado a CD e os MDs poderiam ser disponibilizados no tamburetei.

thayannevls commented 5 years ago

No Tamburetei? Essa parte não peguei 🤔 não entendi cm seria tbm

JuanBarros2 commented 5 years ago

Os RMDs poderiam ficar numa pasta dedicada a cadeira específica. Tipo uma de CDP. É uma implementação aí ficaria na pasta de cdp

JuanBarros2 commented 5 years ago

Eu vou fechar por enquanto por questões de prioridade mas vou deixar ela "de molho" para mais tarde.