ecoinfAEET / Notas_Ecosistemas

Notas ecoinformáticas para la revista Ecosistemas
9 stars 15 forks source link

Ajuste, interpretación y presentación de modelos lineales #4

Closed Pakillo closed 6 years ago

Pakillo commented 7 years ago

Ver https://github.com/ecoinfAEET/Notas_Ecosistemas/issues/1#issuecomment-279989013 by @CarlosLaraR

Submission tentativa para finales de Mayo.

CarlosLaraR commented 7 years ago

Por cierto, fijaros que coincidencia que acabo de recibir de Luis Cayuela este link que tiene muy buena pinta

Una lectura muy interesante y recomendable...

https://fivethirtyeight.com/features/science-isnt-broken/

CarlosLaraR commented 7 years ago

@Pakillo acabo de caer en la cuenta que igual hubiera sido mejor subir aquí el borrador?

Pakillo commented 7 years ago

No problem! Va bien así :) Vamos a darle publicidad para que la gente se anime a revisar no? Gracias por la contribución!

CarlosLaraR commented 7 years ago

¡Claro! Vosotros que sabéis mejor los plazos para el nuevo número recomendar un deadline para participar.

El lunes, 22 de mayo de 2017, Francisco Rodriguez-Sanchez < notifications@github.com> escribió:

No problem! Va bien así :) Vamos a darle publicidad para que la gente se anime a revisar no? Gracias por la contribución!

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub https://github.com/ecoinfAEET/Notas_Ecosistemas/issues/4#issuecomment-303186497, or mute the thread https://github.com/notifications/unsubscribe-auth/AYmP7Nc10_kE4g70qBn5gpr5ZyQF2nuOks5r8dfOgaJpZM4MBn_L .

--

Carlos Lara Romero - PhD

Postdoctoral Research Fellow

Mediterranean Institute of Advanced Studies (CSIC-UIB). E-07190 Esporles, Mallorca, SPAIN

http://lararomero.weebly.com/

https://scholar.google.es/citations?user=DcKsIEMAAAAJ&hl=en

orcid.org/0000-0003-0962-0567

ngmedina commented 7 years ago

Hola, El artículo está muy claro, solamente he econtrado una pequeña errata en la linea 98, donde dice "esto nos óbice" debería decir "esto no es óbice"

ajpelu commented 7 years ago

@CarlosLaraR gracias por el aporte. Me parece sencillo e interasante al mismo tiempo. He leído rápidamente la nota y tengo dos sugerencias de forma, mas que de contenido.

Pues nada más, muchas gracias por tu aporte.

CarlosLaraR commented 7 years ago

@ajpelu tienes toda la razón. Se me escapo ese =. Quitaré la "ñ" también. Había pensado escribir el código en inglés pero como la nota es en castellano y Ecosistema lo lee sobre todo gente de latino américa...

Si el estilo de escritura de código en R del link que propones es el que nos gustaría adoptar en las notas podría ser buena idea que estuviera visible en alguna sección del repositorio (o en su defecto hacer una sección con el estilo a seguir).

Saludos

Pakillo commented 7 years ago

Hola,

Coincido con Antonio en lo del código. He subido mi revisión como documento Word (https://github.com/ecoinfAEET/Notas_Ecosistemas/blob/master/interpretacion-modelos-lineales/linear%20models%20&%20p-values_FRS.docx?raw=true).

Yo lo veo muy bien. Mi mayor sugerencia es incluir el output del código (el boxplot, el summary del lm) pues creo que ayudaría mucho a interpretar el texto. Y así no es todo texto en el paper final también... Se agradece alguna figurita o tabla, creo

Gracias y a ver si recibimos más comentarios!

Pakillo commented 7 years ago

@CarlosLaraR Llevas razón. He actualizado el README del repo especificando las normas de estilo que debe seguir el código (de R en este caso)

CarlosLaraR commented 7 years ago

Al hilo de lo que comentas sobre el output del código estuve tentado de hacerlo pero si lo incluía se alargaba aún más la nota que ya ha quedado un poquito larga. Pero si no veis problema me parece bien... ummm... ahora que lo pienso yo creo que lo que pretende @Pakillo es que use Rmarkdown para escribir la nota! ;)

SaraVarela commented 7 years ago

Hola Carlos,

me acabo de leer la nota, muy chula! mi pequeña aportación es un edit para la primera frase, para hacerla un poco más directa:

El uso del contraste de hipótesis como herramienta de inferencia estadística está siendo cuestionado en los últimos años (Nuzzo, 2014; Reinhart, 2015).

y coincido con Paco en que estaría guay que pusieses el boxplot, una imagen vale más que mil palabras! y en que mejor "parámetros" que "estimadores".

abrazos desde Berlín, Sara

ajpelu commented 7 years ago

Hola de nuevo @CarlosLaraR et al.

viendo los comentarios de @Pakillo he recordado que existe un pkg que permite producir los resultados de análisis de una forma mas atractiva. Se trata del paquete broom que tiene dos funciones muy interesantes. Una de ellas es tidy y la otra glance. No se si la conocéis. Tiene unas vignettes muy ilustrativas. Quizá en el código de esta nota se puedan utilizar.

Seguimos.

Buen día

ibartomeus commented 7 years ago

Yo personalmente no complicaria la nota introduciondo paquetes comopo broom, por que la gente se desvia del tema central.

Añado algún comentario más:

linea 49: "Si nos fijamos en los coeficientes del modelo..." Quizas estaria bien señalar que los coefficientes del modelo r los llama "estimates". En la lina que dice Paco de mostrar el output de la función.

Linea 54: Yo espècificaria que esto sale de sumar el intercept con el effect size, para asegurarnos que nadie se pierde.

linea 62: en un cometraio de codigo puedes explicar por que usas el seed. Otra cosa, en el ejemplo el primero da una media de 3.15 y el segundo de 3.30. Ya se que esto es azar, y las dos deberias dar ~3.2 pero crea confusión. Podrias elegir una seed que de valores más cercanos, para asegurar que el effecto es debido a la n, y no a la estocasticidad?

linea 93: Yo acararia que aquí el effect size se mantiene similar y pondria los valores.

Parrafo 144: Yo diria explicitamente que cuando das resultados de un modelo hay que dar siempre los coeficientes y su error, y no basta con la F y la p solo.

Todo esto son recomendaciones solo, Good job!!

CarlosLaraR commented 7 years ago

@ibartomeus ¿Sobre qué versión haces los comentarios? Las líneas que mencionas creo que No coinciden ni con la versión original ni con la que mandó @Pakillo

ibartomeus commented 7 years ago

Es la version de Paco (abirto el word en mi Mac)... Si no encuentras alguna, dimelo.

CarlosLaraR commented 7 years ago

@ibartomeus copia el texto de la línea 93 y 144... en mi windows nisiquera hay línea 144 en la versión de Paco

ibartomeus commented 7 years ago

93:Principalmente porque el valor p nos indica la probabilidad de que la diferencia observada entre grupos sea producto del azar, pero no aporta información sobre la magnitud del cambio en el tamaño que la adición de fertilizante provoca (el tamaño del efecto, o size effect en inglés).

144 es el ultimo parrafo: "Con este breve ejemplo hemos querido mostrar que la representación gráfica de las distribuciones de los datos y la esti..."

Pakillo commented 7 years ago

jajaj qué bueno :D Estas cosas no pasarían con Rmarkdown ;-)

Pakillo commented 7 years ago

Ya está subida la versión revisada https://github.com/ecoinfAEET/Notas_Ecosistemas/blob/master/interpretacion-modelos-lineales/linear%20models%20&%20p-values_V2.docx?raw=true

Gracias Carlos!

CarlosLaraR commented 7 years ago

Hola,

Sobre la nueva versión. He tratado de incluir todos vuestras sugerencias. He marcado en rojo los principales cambios por si alguno quiere echarles un vistazo. Los principales cambios son:

  1. Ahora se muestra la salida (simplificada) de la función summary y anova y los boxplots
  2. He cambiado la semilla para que las medias entre ambos grupos en el caso 1 y 2 sean más parecidas. He tenido que aumentar más el tamaño de muestra para que en el segundo caso el pvalor baje de 0.05 (buen punto Nacho).

Por cierto, echarle un ojo al comentario que he puesto para explicar la función seed.set. No estoy del todo convencido de que vaya a funcionar.

Gracias

ibartomeus commented 7 years ago

Perfecto, pues dejamos una semana para que repose, y cuando quieras puedes enviarlo a Ecosistemas como nota ecoinformatica. Gracias Carlos!

Pakillo commented 7 years ago

@CarlosLaraR Ya le echado un vistazo rápido a la v2 y subido mis cambios. Por mí todo bien, sólo he sugerido cambiar 2-3 palabras. Y quitar el comentario repetitivo de R relacionando el numero de estrellitas con el valor de p. Por lo demás, por mí adelante :)

saizhugo commented 7 years ago

Acabo de leer la versión revisada y por mi parte adelante. Como comentario decir que con la sobreescritura de varias personas algunos errores de formato pueden ocurrir (por ejemplo, en la línea 115 de la corrección de Pakillo p no está en cursiva mientras que Carlos lo ha puesto en cursiva siempre). Métele un buen repaso de formato antes de mandarlo, Carlos.

Por otra parte, como comentario general creo que en agradecimientos, a menos que sea un reconocimiento muy destacable, en vez de poner un carro de nombres es más fácil poner algo como 'Gracias al grupo de ecoinformática de la AEET por sus comentarios sobre esta nota' o algo así. ¿qué os parece?

Pakillo commented 7 years ago

Gracias Hugo! Sí, hay que estar pendiente del formato. Respecto a los agradecimientos, a mí personalmente me gusta que se nombre a las personas que han contribuido significativamente (a discreción del autor), más que un difuso 'grupo de ecoinformática'. Creo que eso cuadra bien con la tendencia actual en ciencia de mencionar explícitamente las contribuciones de cada uno (mayor transparencia, accountability, incentivos, y reconocimiento). Y hasta ahora no son más de 3-4 nombres...

gemaescribano commented 7 years ago

buenas,

Enhorabuena a @CarlosLaraR y el resto de revisores/colaboradores, creo que la nota es sencilla, directa y aclaratoria. Por comentar algo, pensando en lectores poco familiarizados con R ó con lenguajes de programación en general algunas sugerencias (aunque tal vez sean obviedades... pero just in case, como me ha han surgido cuando lo leía os lo comento).

Los números de línea son del archivo: linear models & p-values_V2_FRS.docx

Línea #26: se obvia que "200" corresponde a la n ó número de casos que la función "rnorm" genera. A lo mejor se puede explicar diciendo: la función rnorm genera una distribución normal de 200 casos, con media 3 y desviación típica 1.

Línea #28 : no se explica lo que se hace aquí; sugerencia: la función "gl" sirve para generar niveles de factores, en este caso: 2 niveles, con 200 replicas, para una n final del vector de 400 casos.

Línea # 120: tal vez cambiaría variación por "varianza"

Líneas #152, #153, #154, ver comentarios para líneas #26 y #28.

Línea #138, yo añadiría después "porcentaje de varianza explicada" (PctExp) ya que esas siglas no está explicadas y no son generales.

Thats' all! Congrats again!

CarlosLaraR commented 7 years ago

@gemaescribano gracias por los comentarios. He incorporado tus sugerencias. He modificado un poco los comentarios para hacerlos un poco más cortos y que no fueran más extensos de una línea. Creo que con esta revisión podemos dar por concluido el proceso y hoy subiré la versión final.

ibartomeus commented 7 years ago

Genial!

On Wed, May 31, 2017 at 12:44 PM Carlos Lara Romero < notifications@github.com> wrote:

@gemaescribano https://github.com/gemaescribano gracias por los comentarios. He incorporado tus sugerencias. He modificado un poco los comentarios para hacerlos un poco más cortos y que no fueran más extensos de una línea. Creo que con esta revisión podemos dar por concluido el proceso y hoy subiré la versión final.

— You are receiving this because you were mentioned.

Reply to this email directly, view it on GitHub https://github.com/ecoinfAEET/Notas_Ecosistemas/issues/4#issuecomment-305154168, or mute the thread https://github.com/notifications/unsubscribe-auth/AB8IgvziUFaXqfZpGHBFcPyZHjIIJUEcks5r_USDgaJpZM4MBn_L .

-- -- Ignasi Bartomeus PhD www.bartomeuslab.com @ibartomeus Skype: nachobartomeus

Dpto. Ecología Integrativa Estación Biológica de Doñana (EBD-CSIC) Avda. Américo Vespucio s/n Isla de la Cartuja 41092, Sevilla (Spain)

CarlosLaraR commented 7 years ago

Hola chicos,

He subido la versión que he enviado a Ecosistemas.

https://github.com/ecoinfAEET/Notas_Ecosistemas/blob/master/interpretacion-modelos-lineales/linear%20models%20%26%20p-values_V3.docx

Gracias por vuestra colaboración creo que quedo muy chula. ¡Ahora que pase el siguiente!