Open Pakillo opened 7 years ago
@Pakillo @ibartomeus Gracias por la lista de ideas. Yo me ofrezco a preparar algo (o a colaborar para preparar algo) de Publicación de Datos (data papers), Repositorios (con sus metadatos), etc. Quizá para el siguiente número sea precipitado, pero para el próximo quizá si.
Genial, gracias @ajpelu. Quizás antes que los data papers con metadatos podriamos hablar de como compartir codigo y datos de papers empiricos (algo cada vez más solicitado por las revistas). Hablamos
Hola! Si os parece relevante, yo también puedo hablar de estadística circular, que es un poco en lo que he estado profundizando estos años, y cómo hacerla y representarla en R. Como a Antonio, para el primer número me viene fatal, más bien para finales del año. Pero vamos, como es un tema un poco lateral, si os viene bien colocar otra gente antes, también lo entiendo. Saludos tropicales, Irene
No, yo creo que hay que ser diversos y específicos en los temas, o sea que estadística circular me parece un ejemplo de nota super relevante. Poca gente lo conoce y se puede hacer un resumen fácilmente. Cuando lo tengas, mandalo, que será guapo! Recuerda que la estructura habría de ser "el problema: analizar datos circulares + la solución: estadística circular + enlace o citas a recursos más relevantes".
Estupendo que te parezca interesante el tema, @ibartomeus ! Entonces, voy preparando la nota siguiendo el esquema indicado e intento mandarla lo antes posible. Yo funciono mejor con plazos, así que también, si queréis incluir la estadística circular en el cronograma de las notas para la revista, pues contad conmigo!
Irene
Pues si quieres un plazo, lo pongo rápido: para antes de verano? :D
Finales de julio cuenta como antes del verano, jeje?
Compro finales de julio! Gracias.
Adjudicado!! :D
Hola a todos,
Quizás sea demasiado básico pero un tema que me parece relevante es el (mal) uso que a menudo se realiza del análisis de la varianza y el ajuste de los parámetros del modelo en los modelos lineales. Especialmente los estudiantes de doctorado cuando están comenzado a aprender estadística tienen problemas para distinguir la diferencia entre al función anova de R y la función summary. Es además muy común ver artículos publicados en los que simplemente se muestra el ajuste de los parámetros del modelo sin reportar varianzas explicadas o R^2. Creo que podría ser un tema a tratar y con un deadline amplio me ofrezco a liderar aunque la colaboración es bienvenida. No sé si daría también para entrar a hablar sobre el abuso (en mi opinión) de los términos ANOVA, MANOVA etc. que hace que muchos investigadores no entiendan bien el procedimiento de ajuste y reporte de resultados basados en modelos lineales. Es común que los estudiantes pregunten en clase por qué aplicamos la función anova de R si estamos ajustando un GLM sólo por poneros un ejemplo.
Un saludo!!
Y por animar un poco a más gente también quería comentaros que los temas sobre modelos mixtos y AIC también me interesan y me parecen super relevantes. Me ofrezco a colaborar aunque no sé si me animaría a liderarlos. Creo que para modelos mixtos y/o AIC sería una idea genial tantear a Luis Cayuela que tiene un curso estupendo sobre el tema. No sé si Luis es miembro del grupo pero si la sección en Ecosistemas sigue pa'lante y no surgen voluntarios puede escribirle si os parece buena idea.
Saludos again!!
Hola @CarlosLaraR !
Muchas gracias por la aportación. Totalmente de acuerdo en que todos esos temas serían super-útiles y muy bien recibidos. Adelante! Abro issues para cada uno. Cuál es tu "deadline amplio"?? :smile:
Si te ofreces a liderarlo, lo bueno de esto es que será muy fácil que la gente colabore y haga aportaciones o comentarios. Así que ánimo. Y gracias otra vez!
Me parece un tema super importante, Fichado! Una opción para orientarlo de forma simple (pero muy importante, y que no se hace siempre bien) sería ¿como presentar los resultados de modelos lineales? Totalmente de acuerdo que se ven muchos papers que dan p-valores y F's si dar nada más! Esperamos tu primer borrador :)
@Pakillo que rapido eres contestando, me ganaste 🗡
es que andaba por aqui :)
¡¡Me subo al carro pues y me ofrezoc a liderar la nota "Ajuste, interpretación y presentación de modelso lineales". Creo que para finales de primavera podría ser un buen deadline. ¿Podemos fijar finales de mayo? No sé cuando saldría el número de ecosistemas. Si viniera bien adelantarlo un poco podríamos hacer un esfuerzo. ¡¡Son sólo dos páginas!! ;)
Saludos,
Carlos
Mayo, va perfecto.
que guay! :-)
Hola! Esta iniciativa me parece muy necesaria! más aún sabiendo que Ecosistemas tiene un gran público en América Latina y allí en muchos casos l@s estudiantes están todavía más perdidos. Yo estoy particularmente interesada y soy usuaria habitual de la selección de modelos con índices de Akaike, usualmente, utilizando modelos mixtos. Podría colaborar en ambas notas, aunque creo que me sentiría más cómoda en la de selección de modelos. Creo que Luis cayuela es un gran fichaje para este tema como decía CarlosLaraR. Podemos tantearla a ver qué opina. Como hay muchas iniciativas "adelantadas" yo ofrezco un deadline a largo plazo.... antes de la próxima vuelta al cole (septiembre 2017).
Genial, gracias @gemaescribano ! Te apuntamos :)
Buenas a todos,
todos sabemos que la estadística mola y es necesario su buen uso para una ciencia de calidad. Sin embargo, y siguiendo la sugerencia del hilo, es necesario tocar otros temas. Siguiendo la idea de ciencia reproducible, tal vez no es mala idea hablar algo de programas de edición de textos tipo Latex, que permiten ciencia reproducible a un nivel más profundo que los editores de texto tradicionales. Además, va muy bien para escribir ecuaciones y hay revistas que ya tienen sus templates para que no tengas que preocuparte de formatos etc. Yo lo he usado en algunos grupos de trabajo y va genial (aunque como todo, hay que aprender a usarlo y escribir un comando para poner cursiva es algo poco amistoso). Aunque sea para dar a conocer su existencia creo que podría estar bien.
Nos vemos
Hola,
escribiendo la nota sobre modelos lineales se me ocurrió que otra nota interesante podría ser sobre representaciones gráficas basadas en boxplot y barplot. Podría estar bien comentar los pros y contras de ambas opciones y dar código de R para hacer ambos tipos de gráficos.
Muy buena idea @CarlosLaraR! Lo abro como nuevo issue y a ver si alguien se anima. O quieres repetir ya? :)
@saizhugo Gracias por la sugerencia! Te animas a escribir algo sobre esto? Te refieres a LaTeX únicamente? O estabas pensando incluir Rmarkdown y similares?
@Pakillo buen intento. Jaja. No me lo he pasado nada mal con esta nota...PERO vamos a esperar un tiempo a ver si algún otro miembro del grupo se anima...que seguro hay algún experto por ahí!! ;)
A mí no me importa escribir algo sobre el tema (no sé cómo va el tema fechas y demás pero si avisáis con tiempo lo puedo hacer). Controlo más de LaTeX que de los otros pero me puedo informar. También tendría que pensar un poco cómo enfocarla (ventajas/inconvenientes, tutorial etc). Cualquier consejo es bienvenido.
Genial @saizhugo. Te apuntamos para una futura nota sobre LaTeX, con fecha de submission alrededor de finales de 2017?
Hola a todos. Bueno, lo primero presentarme: Me llamo Fer y soy un lurker de vuestro grupo xD No soy un ecologo terrestre, ya que ahora mismo hago mi tesis doctoral con 'foraging success' de elefantes marinos en los mares del Sur, pero he hecho cosillas con aves terrestres primero en España, y con micromamones (lemmings y esas vainas) en el artico noruego. Digamos que soy un ecologo terrestre que queria ir a la antartida ja ja ja.
Bueno, al lio. Llevo un tiempo dandole vueltas a pasar algunas rutinas y analisis sencillos en R para hacer un documento de introduccion, en castellano.
Mi problema esta en como traducir algunas palabras del anglocabron. Es cierto que todo el mundo que use R sabe lo que es un data.frame, o un script, pero a la hora de traducirlas al castellano no encuentro unanimidad (he mirado algunas publicaciones online de introducciones y tenemos desde las que llaman a las cosas por su nombre en ingles a las que utilizan otros nombres). En nombre de la reproducibilidad y de la consistencia en el estilo, si decimos matriz, vector, lista, deberiamos utilizar su equivalente en castellano para data.frame? Me he encontrado expresiones como hoja de datos, tabla de datos o marco de datos. Con script parecido, no hay una traduccion inequivoca y unica. No se hasta que punto esto es un problema, limitado a cuatro palabras de R, o mas general, englobando palabras tecnicas propias de analisis. Me viene a la mente raster, que es (obviamente) un 'mapa de bits' o como se le quiera llamar (tampoco hay un nombre unico, segun la wikipedia) pero tambien es una funcion de R, bastante utilizada.Suena muy diferente "para la representacion espacial .... haremos un raster con la funcion raster()" que "para la representacion espacial .... haremos un mapa de bits con la funcion raster()". Creo que es diferente mantener un acronimo del ingles y desplegarlo en castellano, como se suele hacer (lm -> Modelo lineal) a utilizar tambien la expansion del acronimo en ingles, algo que no suele leerse (lm -> Linear model) a mantener una palabra inglesa que puede ser traducida.
La pregunta que os formulo es si seria interesante crear una suerte de glosario R? No tiene que ser una nota para ecosistemas, pero si un documento accesible.... como unas recomendaciones a la hora de escribir sobre R, del mismo modo que hay recomendaciones a seguir sobre el uso de la asignacion <- vs el simbolo =, como escribir los nombres de las variables etc...
Igual estoy haciendo una montañita de arena de un par de granos, pero bueno... que pensais?
Saludos
Fer
Hola @farcego,
uf, lo de crear palabras en castellano para los nuevos conceptos que aparecen primero en inglés, o no hacerlo, es todo un frente... siguiendo con tu ejemplo, yo no he usado nunca la palabra "mapa de bits" y sí "raster", desde que empecé en 2003 a trabajar con GIS (o SIG, jaja), jamás... Si te animas a hacer un glosario, pues bienvenido sea! seguro que le sacamos todos partido :-)
Otra cosa, respecto guías de estilo en R, hay. Los de google sacaron una hace unos años: https://google.github.io/styleguide/Rguide.xml
y Hadley Wickham la modificó un poco: http://adv-r.had.co.nz/Style.html (personalmente soy muy fan de este hombre)
Si quieres hacer una nota explicando que es importante que la escritura de código sea clara y se sigan unas normas de manera que las PERSONAS (que no las máquinas) puedan entender facilmente el código de otros programadores, pues adelante!
saludos, Sara
Gracias por tu respuesta @SaraVarela , yo no soy demasiado ' fan' de las guias, en tanto en cuanto hay docenas, bueno, el tema es que no hay en castellano y quizas si seria un tema ... si alguien lo ve interesantre... no se nada de 'ggplot' 'dplyr' , o cocacolaplyrs... y asimilados... en parte bien desarrolllados por H wickman (buen trabajo para crear un lenguaje paralelo y sacarle negocio en business), no es nada personal, yo trabajo en emacs, e intento mantenerme al margen de su negocio, claro.., aunque a veces sude para escribir unas funciones, yo creo en el codigo puro, y mi pastor, es... bueno, si, todo el mundo conoce a ""Ignacius" xD Mi idea no es hacer una nota sino una suerte de glosario para que tengamos palabras unequivocas. No estaba pensando es que el codigo siquiera, ni en una estructura, sino la comunicacion humana con el codigo Total, mañana e creara un nuevo wrapper para los 'data.frames' y ya se perdio todo, pasaremos de tablas, a tibbles, y mañana.. a ... que? yo preguntaba sobre uniformidad, y como tu, yo nunca he escrito mapa de bits.... y si raster, y quizas sea el pero ejemplo, pero seguro que como yo , tu dices matriz de datos, no matrix de datos
Ahora, tan de moda com esta el famoso tidyverse.... que cojo..... como llamamamos a unos datso en esos formatos demoniacos?
perdona mis excesos... pero bueno, asi creo, remarco un pco mas lo que yo decia.... Yo no uso tibbles, pero si me gstaria que alguien me dijera que son....
Coprdiales saludos de Fer
A mi personalmente no me importa usar anglicismos, pero si te animas a hacer un glosario, seguro que tienes el respaldo de ecoinf. Yo sugiero que si quieres que tenga uso, sigas un proceso participativo, por ejemplo, desarrollandoalo un primer borrador (casi digo draft
) consensuado entre nosotros en un repo dedicado a ello. Luego pasando el borrador a R-hispano con un tiempo para hacer comentarios y finalmente difundiendon el consenso via R-hispano.
PS: Lo de terrestre es un legado historico, ecologos marinos, fluviales o lo que sea son siempre bienvenidos!
Buenas. Yo antes de empezar a trabajar en esto preguntaría primero en la lista de correo de R hispano https://stat.ethz.ch/mailman/listinfo/r-help-es. Si hay algo hecho ya, es muy probable que ahí lo conozcan
Perdón por no contestar hasta ahora. Sí, me comprometo a preparar una nota sobre Latex para finales de este año. Que vaya bien.
Buenos días,
acabo de terminar la primera versión de la nota para la revista Ecosistemas. Al final no me he centrado sólo en Latex sino que he escrito sobre los procesadores de texto basados en comandos. Me ha quedado un poco larga (1200 palabras, aunque no tiene ninguna figura ni tabla) y está escrita como si fuera un post de un blog (no sé si esto es bueno o malo). Cualquier comentario es bienvenido.
No he podido crear una carpeta donde subir los archivos (creo que solo pueden los administradores) así que subo los archivos por aquí y si alguien puede agruparlos en una carpeta, sería genial. Está escrito en RMarkdown y mi idea sería poner el archivo .rmd como apéndice para quien quiera puede ver cómo funcionan este tipo de programas.
¡Espero vuestros comentarios!
p.d. También he incluido el archivo .doc por si a algún perezoso no le apetece aprender RMarkdown
Gracias Hugo, en cuanto pille un hueco subo el texto y pido feedback!
Hola a todos, como ya hablé con @Pakillo y @ibartomeus creo que estaría bien escribir una nota, tipo 10 reglas para usar GitHub. Tenía algunas cosas escritas en Latex, pero como he visto que tenéis un template en Rmarkdown y está la nota de @saizhugo del Markup, pues me animado a usarlo (es mi primera vez).
Espero que os parezca bien. Y si aceptáis la idea, me gustaría saber si tenéis algún deadline que os venga bien, o puedo columpiarme, jeje.
Por cierto he visto las notas de @saizhugo y de @CarlosLaraR y me han encantado. Me he hecho superfan de las notas de ecosistemas!!!
Salud
Fichado para las "10 reglas" y como deadline si lo tienes para finales de Junio seria ideal. Que te parece?
jaja @galeanojav gracias por el cumplido me viene bien para subir el ánimo y aumentar mi ego.. suena genial la nota de las 10 reglas!!!
@ibartomeus junio me parece perfecto. De todas formas si lo tengo antes te aviso. Gracias
Hola compañer@s!
Resulta que estos meses he estado limpiado una base de datos descargada de GBIF (un error by the way) y creo que podría ser fácil escribir una nota en la que se describan algunos filtros básicos utilizando principalmente el paquete CoordinateCleaner (añadiría alguno caso adicoinal). Se podría añadir además el proceso de automatización de descarga de datos desde GBIF con el paquete rgbif. La nota puede partir de una descarga de datos de un conjunto de especies de GBIF y luego se limpian y se hace un mapita con el aspecto de los datos antes y después del filtrado y limpieza. El nombre de la nota podría ser algo así como: "Descarga y limpieza de datos procedentes de bases de datos de biodiversidad".
Podría animarme a escribirla rápido ya que estoy trabajando con ello ahora mismo.
un saludos!!
Estupendo, pero ojo no te pises con esta: https://www.revistaecosistemas.net/index.php/ecosistemas/article/view/1416
Quizás basandote en cómo automatizar la limpieza de datos? coordenadas, pero también nombres científicos. Taxize hace eso con nombres científicos y un poco de regexp hace maravillas.
Cierto Nacho. Lo centramos entonces en la limpieza de datos. Yo siempre he limpiado los nombres científico a pelo con mi propio código. Pero creo que es mejor usar una herramienta como Taxise. La puedo incluir yo sin problemas pero si alguien se anima con una co-autoria metiendo la parte de especies por mi genial.
Pues ya puedes abrir un nuevo issue del tema con etiquetas "en preparation" y "help wanted". Si realmente quieres ayuda, envía un email a la lista para que la gente lo vea. Gracias!
issue abierto pero no he podido añadir las etiquetas "en preparation" y "help wanted".
Hola! Hace poco descubrí Jupyter. No sé cuanto se está usando en ecología pero me parece una herramienta útil especialmente para Datos suplementarios o incluso para enseñar R. ¿Sería de interés?
Hola @gretacv , yo uso bastante Jupyter. La gente que programamos en python , casi lo usamos por defecto. Y como dices, está muy bien para dar clases de programación. Se puede usar markdown, para escribir parte de las notas y luego la parte de programación. Me parece interesante, la verdad.
Si y ahora también se puede usar R, he encontrado algunas dificultades usando rgdal, pero si la nota no entra en análisis espaciales podría ser sencillo.
No he usado Jupiter, pero he usado otras interfaces tipo Rstudio. Crees que da para una nota? Que ideas cubririas?
Hola Ignasi, Se me ha ocurrido al leer la nota sobre paquetes. A veces el código igual no da para crear un paquete pero poner el script utilizado incluyendo los outputs y comentarios de markdown puede ayudar a clarificar el proceso de análisis. Personalmente utilicé un notebook para dar una clase y era más cómodo ir ejecutando celdas que ir ejecutando código en Rstudio. También es una manera de compartir código ya ejecutado y eso puede ser útil cuando en algunas clases hay problemas de logística y no todos los alumnos pueden seguir la clase con un ordenador. La estructura de la nota sería:
No sé si esto es suficiente para una nota. La idea me ha venido porque hace un año desconocía esta posibilidad y personalmente me ha resultado útil.
Vale, me parece bien. Quizás estaría bien incluir algo de python como dice @galeanojav y ser general en cuanto a qué recursos hay disponibles para crear documentos interactivos en general. Mira la nota de @saizhugo para no solaparse. https://github.com/ecoinfAEET/Notas_Ecosistemas/tree/master/markup Por mi adelante, añade un issue y yo le pongo las etiquetas "en preparation" y "help wanted" (si quieres help).
Vamos haciendo una lista de posibles temas a tratar en esas notas? Se pueden proponer temas que nos gustaría ver o, aún mejor, apuntarse para escribir alguno.
Cómo publicar datos y código (repositorios etc)
p-values
AIC
Modelos mixtos
SEM
Estadística Circular (#2)
Manejo de metadatos (EML, etc)