FranciscoAscue / Rgenomics

Genomics with R
https://franciscoascue.github.io/Rgenomics/
1 stars 0 forks source link

Rgenomics/modulo6 #2

Open utterances-bot opened 11 months ago

utterances-bot commented 11 months ago

Genomics web - Introducción a R

https://franciscoascue.github.io/Rgenomics/modulo6.html

FranciscoAscue commented 11 months ago
### Variables basicas

x <- 5
suma <- x + 1
y <- FALSE
z <- "A"

## vectores

v <- c(2,4,1,5,7)
j <- c("b","c","a","z","r")

## matriz
matriz <- matrix(c(1,2,3,2,2,2,4,5,6,7,8,8,8,8,9,0),nrow = 4, ncol = 4)
matriz[,2]

## Dataframe

df <- data.frame(Numeros = v, Letras = j)
df[3,2]
df$Letras[1]

### Funciones basicas

suma <- sum(j)
max(v)
min(v)
length(j)

unique(matriz)
sort(v)

## dataframes

colnames(df) <- c("Numero","Letra")
rownames(df) <- c("uno","dos","tres","cuatro","cinco")

## Datos de prueba en R
library(help="datasets")

# para descarga
download.file("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv","data.csv")

## read.delim()
datos <- read.table("data.csv", sep = ",", header = TRUE)
datas <- read.csv("data.csv")

## plots 

plot(CO2$uptake,CO2$conc)

## tabla de frecuencias

table(CO2$conc)
table(mtcars$gear)

## convertir a numero 

var1 <- c("1","2","3","7","8")
var1 <- as.numeric(var1)

## Editar datos

esoph$alcgp <- gsub("day","dia",esoph$alcgp) 

## juntar datos

sleep$juntar <- paste(sleep$group,sleep$ID,sep = "-")

### funciones estadisticas
#media
mean(sleep$extra)

#varianza
var(sleep$extra)

# Correlación Pearson 

heatmap(cor(mtcars))

### Instalación de paquetes en R 

install.packages("dplyr")
library(dplyr)

datos <- mtcars

## filtramos filas
nuevos_datos <- datos %>% filter(cyl > 6)

## filtramos columnas
nuevos_datos2 <- datos %>% select(cyl,hp)

## crear columnas
nuevos_datos3 <- datos %>% mutate(nueva = hp*2)

## Resumir datos

nuevos_datos4 <- datos %>% group_by(cyl,hp) %>%
  summarise(Conteo = n() )

## ordenar filas 

nuevos_datos5 <- datos %>% arrange(cyl,hp)

## Crear plots con ggplot2

install.packages("ggplot2")
library(dplyr)
library(ggplot2)

ggplot(data = datos, aes(x = hp, y = cyl, color = carb)) +
  geom_point()+ facet_wrap(~gear)

# Personalizar el gráfico de dispersión.
ggplot(data = datos, aes(x = hp, y = cyl, color = carb)) +
  geom_point() +
  labs(title = "Relación entre hp y cyl",
       x = "Caballos de Fuerza",
       y = "Cilindros",
       color = "Carburadores"
       )

ggplot(data = datos, aes(y = cyl)) +
  geom_histogram() + facet_wrap(~gear)

ggplot(data = datos, aes(y = drat)) + 
  geom_boxplot()  + facet_wrap(~gear)
LuisBarcenaF commented 11 months ago

Gracias Francisco, sera de mucha ayuda!

juanhuarachi commented 11 months ago

Excelente, buen aporte¡¡¡

FranciscoAscue commented 11 months ago

Ejemplo

Francisco Ascue

boxplot

FranciscoAscue commented 11 months ago

Desafio 1

A partir de los datos csv:

datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")

Utilizar las bibiliotecas:

library(dplyr)
library(ggplot2)

Para:

Fecha Entrega: 01/11/2023

LuisBarcenaF commented 11 months ago

Juana Iris Silva Molina Luren Nieves Sevilla Castañeda Luis Fernando Bárcena Flores

##Filtro de index = 5

datos <- read.csv("data.csv") nuevos_datos <- datos %>% select(Index) %>% filter(Index == 5)

##ggplot >> Crear un gráfico boxplot

ggplot(data = datos, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + labs(title = "Diagrama de Cajas de Mujeres y Varones")

image

sofiss16 commented 11 months ago

Buenas tardes Profesor:

Una consulta. Cómo puedo hacer para cuando vuelva a abrir el Proyecto aparezca la ventana de Plot con la imagen ya trabajada en anterior sesión. Es decir que cuando guarde el Proyecto para trabajarlo posteriormente también guarde al mismo tiempo la imagen sin necesidad de darle clic en RUN hasta que se actualice la imagen? Cómo puedo guardar las Imágenes en general? Gracias

erick8147 commented 11 months ago

-Carbajal Cueva Erick Antony

Grafica de caja

17MARIALUISA commented 11 months ago

INTEGRANTES

-María Luisa Florez Aroni -Kelly Katherine Marreros Liñan -Eliot Kelly Huanca Cóndor

Rplot Rplot01

DATOS

datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")

LIBRERIAS

library(dplyr) library(ggplot2)

FILTRO

DATOS_FILTRADOS <- filter(datos, Index==5)

GRÁFICO

ggplot(data = DATOS_FILTRADOS, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + guides(fill = guide_legend(title = "Genero"))

iinestoar commented 11 months ago

-Andrea Carríon Elguera -Maribel Vargas Camacho -Rosa Paredes Alhua -Inés Carolina Torres Arias

Rplot

sofiss16 commented 11 months ago

Integrantes: Rosalyn Acuña Carmen Medina

nuevos_datos %>% filter(Index == 5)

nuevos_datos %>% ggplot()

ggplot(data = nuevos_datos, aes(x = Genero, y = Peso, color = Genero)) + geom_boxplot()+ geom_jitter() + labs (title = "Diagrama Box")

Gráfico1

DeyaniraFigueroa commented 11 months ago

Integrantes: -Esther Suca -Deyanira Figueroa

Link: https://drive.google.com/file/d/1BuzGUHJmgbQ5t-R1yJj9skQFMZDiyh98/view?usp=sharing https://drive.google.com/file/d/1tl9eDw-kAbDOfpGye3WD7xH98JFDf--3/view?usp=sharing

base de datos

datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv") library(dplyr) library(ggplot2)

Filtro Index = 5

datos_index5 <- datos %>% filter(Index == 5)

ggplot(data = datos_index5, aes(y = Altura, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(title = "Diagrama de Cajas de Mujeres y Varones con Index 5")

ggplot(data = datos_index5, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(title = "Diagrama de Cajas de Mujeres y Varones con Index 5")

sujelyyumpo commented 11 months ago

Integrantes: Yeimmy Shugelly Yumpo Moreno Carina Rosario Mantari Torpoco

base de datos:

datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv") library(dplyr) library(ggplot2) DATOS_FILTRADOS <- filter(datos, Index==5) View(DATOS_FILTRADOS)

BoxPlot

ggplot(data = DATOS_FILTRADOS, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + guides(fill = guide_legend(title = "Genero")) + labs(title = "Diagrama de Cajas de Mujeres y Varones")

Rplot01

jhuarachi14 commented 11 months ago

Integrante: Juan Pablo Huarachi Valencia ##base de datos datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv") library(dplyr) library(ggplot2)

##Filtro Index = 5#### datos_index5 <- datos %>% filter(Index == 5)

ggplot(data = datos_index5, aes(y = Altura, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(x='Género', y='Altura (cm)', title = "Altura de Mujeres y Varones con Index 5")

ggplot(data = datos_index5, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(x='Género', y='Peso (kg)', title = "Peso de Mujeres y Varones con Index 5")

Graficas_Genomica

FranciscoAscue commented 9 months ago

Clase Grupo 3 - Introducción a R

### instalacion de paquetes:

install.packages("dplyr")
library(dplyr) ## posit Rstudio 
install.packages("BiocManager")
library(BiocManager)
BiocManager::install("ggplot2")
library(ggplot2)

### FUnciones propias

## dplyr - Manejo de datos - editar - modificar y filtrar

### CASOS de USO

## Filtrar Filas 

datos <- mtcars

filaCyl6 <- datos %>% filter(cyl == 6)
write.csv(filaCyl6,"filascyl.csv")

### seleccionar columnas

columnas <- datos %>% select(hp,mpg,disp)

## crear nuevas columnas

nuevacolumna <- datos %>% mutate(nuevaColumna = hp/cyl)

## * multiplicar
## / dividir

## agrupamiento (group_by) - conteo (summarize)

conteo <- datos %>% group_by(cyl,hp) %>% 
  summarize(Conteo = n() )  

## Ordenar Filas arrange

orden <- datos %>% arrange(cyl)

## ggplot2 - graficos - mapas - boxplot

library(ggplot2)

ggplot(data = datos, aes(x = cyl, y = hp, fill = hp)) +
  geom_point() + theme_linedraw()
Carmesi1 commented 9 months ago

Instalar paquetes

install.packages("dplyr") install.packages("ggplot2")

library(dplyr) library(ggplot2)

Leer los datos

datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")

Filtrar el subconjunto de datos donde el índice es igual a 5

datos_filtr <- subset(datos, Index == 5)

Boxplot

ggplot(data = datos_filtr, aes(y = Altura, x = Genero, color=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(x='Género', y='Altura (cm)', title = "Altura de individuos con índice 5")

ggplot(data = datos_filtr, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(x='Género', y='Peso (kg)', title = "Peso de individuos con índice 5")

Rplot1

Rplot2

YurikoMurilloDomen commented 9 months ago

*Grupo Alexander Huaman Mera Yuriko Murillo Domen

Datos

datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")

Librerias

library(dplyr) library(ggplot2)

Filtro

DATOS_FILTRADOS <- filter(datos, Index==5)

Gráfico

ggplot(data = DATOS_FILTRADOS, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + guides(fill = guide_legend(title = "Genero"))

albertino127 commented 9 months ago

Integrantes del grupo:

SCRIP DESAFÍO 1

1.- PRIMERA PARTE: SELECCIÓN DE SUBCONJUNTO DE DATOS CON Index 5 install.packages("dplyr") library(dplyr)

install.packages("BiocManager") library(BiocManager)

BiocManager::install("ggplot2") library(ggplot2)

FILTRAR DATOS

datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv") datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")

Filtrar filas con Index 5

datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")

filaIndex5 <- datos %>% filter(Index == 5)

2.- SEGUNDA PARTE: GRÁFICO CON ggplot library(ggplot2)

ggplot(data = datos, aes(x=Genero, y=Peso, fill=Genero)) + geom_boxplot() + labs(title = "Diagrama de Cajas y Bigotes de Femeninos y Masculinos")

Seleccion de Subconjunto de datos con Index 5

Parte 2 Grafico con ggplot

FranciscoAscue commented 7 months ago

#### Variables en R / Atomicos 

y <- 5 
x <- "ACGACGATCGACGATCG"
z <- TRUE ## boolean

#### Estructuras de datos en R

  ### vectores y listas 

  vector <- c(1,2,"a",4,5,6) ## homogeneos 
  lista <- list(1,2,"a",4,5,6) ## heterogeneo 

  lista[3][[1]]
  ### matrix and Dataframes

  matriz <- matrix(1:100, 10 , 10) ## homogeneos 
  df <- data.frame(Columna1 = 1:4, Columna2 = c('a','b','c','d') )  ## heterogeneo
  str(df)
  ### como recuperar un dato de una tabla
  matriz[3,4]
  df$Columna2

  unzip("iris.zip")
  datos <- read.table("iris.csv", sep = ",", header = FALSE )
  write.csv(matriz, "matriz.csv")

  ### instalar paquetes

  excel <- read_xlsx('Financials Sample Data.xlsx')

  #install.packages("BiocManager")

  BiocManager::install("ggplot2")
  library(devtools)
  install_github()
  install_bitbucket()

  #### funciones basicas en R

  library(help = "datasets")

  mean(iris$Sepal.Length)
  median(iris$Sepal.Length)
  var(iris$Sepal.Length)
  cov(iris$Sepal.Length, iris$Sepal.Width)
  sd(iris$Sepal.Length)
  summary(iris$Sepal.Length)
  boxplot(iris$Sepal.Length)

#### Plots Basicos en R
  heatmap( cor(iris[,-5]) )
  plot(iris$Sepal.Length, iris$Sepal.Width)
  hist(iris$Petal.Length)
  pie( table(iris$Species) )

#### Manipulacion de datos y plots con GGPLOT2

### dplyr - Manipulacion de datos 

  #install.packages("dplyr")
  library(dplyr)

  ### filtrar filas 
  mtcars %>% filter(cyl == 6, vs == 0)
    ### <, > , ==, <= , >=

  ### seleccionar columnas 

  mtcars %>% select(cyl,wt,qsec)

  ### incorporar nueva columna 

  mtcars %>% mutate(NUEVACOlUMna = mpg/hp )

  ###  ordenar tabla 

  mtcars %>% arrange(desc(hp),wt)

  ### agrupamiento { categorias }

  mtcars %>% group_by(cyl,vs) %>% summarise(Conteo = n())

### ggplot2   
  #install.packages("ggplot2")
  library(ggplot2)
  ggplot(data = mtcars, aes(x = disp , y = hp , color = cyl )) + 
    geom_point()

  ggplot(data = mtcars, aes(x = cyl , fill = as.character(cyl) )) + 
    geom_histogram() + labs(fill = "Cilindros", 
                            x = "Cilindros", y = "Frecuencia", title = "PLOT") 
FranciscoAscue commented 2 months ago

Codigo Clases 26/07/24

library(help="datasets")

x <- FALSE
y <- 12
a <- list(1,2,"a",4,TRUE)

b <- matrix( 1:20 , ncol = 4, nrow = 5 )
m <- matrix( 1:40 , 8, 5 )

m[4,] # Acceder a los datos de una matriz

z <- c(1,6,4,4,5)
d <- c("a","a","b","b","a")
f <- c(1,6,2,1,0)

tabla <- data.frame(Numero = z , Letra= d, Boleanos = f)
tabla2 <- tabla[,-2]

### Algunas mas complejas 

datos <- c(20,21,12,41,59)

length(datos)

sum(datos)/length(datos)

# convertimos en una solución mas global
# funciones

PROmEDIO <- function(x){
  pmd <- sum(x)/length(x)
  return(pmd)
}

PROmEDIO(c(50,21,22,11,19))

### Paquetes
### sensity case 

#install.packages("dplyr")
#### manejo, limpieza, modificación de datos

library(dplyr)

datos <- as.data.frame(DNase)
datos$Run <- as.numeric(datos$Run) #convertir numérico

### Filtrar filas 

corrida1_2_3 <- datos %>% filter(Run < 8, density < 1)
corrida123 <- datos %>% filter(Run %in% c(1,2,3))

### seleccionar columnas 

columna13 <- datos %>% select(Run,density)

### Crear columnas
nuevo_datos <- datos %>% mutate(producto = conc * density)

### Group by - summarise

tabla_frecuencia <- datos %>% group_by(Run) %>% 
  summarise(Conteo = n() )

### Ordenar  (arrange)

datos %>% arrange(desc(conc)) ## menor a mayor
datos %>% arrange(conc) ## mayor a menor

## | pipe - %>%  

install.packages("tidyverse")