Open utterances-bot opened 11 months ago
### Variables basicas
x <- 5
suma <- x + 1
y <- FALSE
z <- "A"
## vectores
v <- c(2,4,1,5,7)
j <- c("b","c","a","z","r")
## matriz
matriz <- matrix(c(1,2,3,2,2,2,4,5,6,7,8,8,8,8,9,0),nrow = 4, ncol = 4)
matriz[,2]
## Dataframe
df <- data.frame(Numeros = v, Letras = j)
df[3,2]
df$Letras[1]
### Funciones basicas
suma <- sum(j)
max(v)
min(v)
length(j)
unique(matriz)
sort(v)
## dataframes
colnames(df) <- c("Numero","Letra")
rownames(df) <- c("uno","dos","tres","cuatro","cinco")
## Datos de prueba en R
library(help="datasets")
# para descarga
download.file("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv","data.csv")
## read.delim()
datos <- read.table("data.csv", sep = ",", header = TRUE)
datas <- read.csv("data.csv")
## plots
plot(CO2$uptake,CO2$conc)
## tabla de frecuencias
table(CO2$conc)
table(mtcars$gear)
## convertir a numero
var1 <- c("1","2","3","7","8")
var1 <- as.numeric(var1)
## Editar datos
esoph$alcgp <- gsub("day","dia",esoph$alcgp)
## juntar datos
sleep$juntar <- paste(sleep$group,sleep$ID,sep = "-")
### funciones estadisticas
#media
mean(sleep$extra)
#varianza
var(sleep$extra)
# Correlación Pearson
heatmap(cor(mtcars))
### Instalación de paquetes en R
install.packages("dplyr")
library(dplyr)
datos <- mtcars
## filtramos filas
nuevos_datos <- datos %>% filter(cyl > 6)
## filtramos columnas
nuevos_datos2 <- datos %>% select(cyl,hp)
## crear columnas
nuevos_datos3 <- datos %>% mutate(nueva = hp*2)
## Resumir datos
nuevos_datos4 <- datos %>% group_by(cyl,hp) %>%
summarise(Conteo = n() )
## ordenar filas
nuevos_datos5 <- datos %>% arrange(cyl,hp)
## Crear plots con ggplot2
install.packages("ggplot2")
library(dplyr)
library(ggplot2)
ggplot(data = datos, aes(x = hp, y = cyl, color = carb)) +
geom_point()+ facet_wrap(~gear)
# Personalizar el gráfico de dispersión.
ggplot(data = datos, aes(x = hp, y = cyl, color = carb)) +
geom_point() +
labs(title = "Relación entre hp y cyl",
x = "Caballos de Fuerza",
y = "Cilindros",
color = "Carburadores"
)
ggplot(data = datos, aes(y = cyl)) +
geom_histogram() + facet_wrap(~gear)
ggplot(data = datos, aes(y = drat)) +
geom_boxplot() + facet_wrap(~gear)
Gracias Francisco, sera de mucha ayuda!
Excelente, buen aporte¡¡¡
Francisco Ascue
A partir de los datos csv:
datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")
Utilizar las bibiliotecas:
library(dplyr)
library(ggplot2)
Para:
geom_boxplot()
)Fecha Entrega: 01/11/2023
Juana Iris Silva Molina Luren Nieves Sevilla Castañeda Luis Fernando Bárcena Flores
##Filtro de index = 5
datos <- read.csv("data.csv") nuevos_datos <- datos %>% select(Index) %>% filter(Index == 5)
##ggplot >> Crear un gráfico boxplot
ggplot(data = datos, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + labs(title = "Diagrama de Cajas de Mujeres y Varones")
Buenas tardes Profesor:
Una consulta. Cómo puedo hacer para cuando vuelva a abrir el Proyecto aparezca la ventana de Plot con la imagen ya trabajada en anterior sesión. Es decir que cuando guarde el Proyecto para trabajarlo posteriormente también guarde al mismo tiempo la imagen sin necesidad de darle clic en RUN hasta que se actualice la imagen? Cómo puedo guardar las Imágenes en general? Gracias
-Carbajal Cueva Erick Antony
-María Luisa Florez Aroni -Kelly Katherine Marreros Liñan -Eliot Kelly Huanca Cóndor
datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")
library(dplyr) library(ggplot2)
DATOS_FILTRADOS <- filter(datos, Index==5)
ggplot(data = DATOS_FILTRADOS, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + guides(fill = guide_legend(title = "Genero"))
-Andrea Carríon Elguera -Maribel Vargas Camacho -Rosa Paredes Alhua -Inés Carolina Torres Arias
Integrantes: Rosalyn Acuña Carmen Medina
nuevos_datos %>% filter(Index == 5)
nuevos_datos %>% ggplot()
ggplot(data = nuevos_datos, aes(x = Genero, y = Peso, color = Genero)) + geom_boxplot()+ geom_jitter() + labs (title = "Diagrama Box")
Integrantes: -Esther Suca -Deyanira Figueroa
Link: https://drive.google.com/file/d/1BuzGUHJmgbQ5t-R1yJj9skQFMZDiyh98/view?usp=sharing https://drive.google.com/file/d/1tl9eDw-kAbDOfpGye3WD7xH98JFDf--3/view?usp=sharing
datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv") library(dplyr) library(ggplot2)
datos_index5 <- datos %>% filter(Index == 5)
ggplot(data = datos_index5, aes(y = Altura, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(title = "Diagrama de Cajas de Mujeres y Varones con Index 5")
ggplot(data = datos_index5, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(title = "Diagrama de Cajas de Mujeres y Varones con Index 5")
Integrantes: Yeimmy Shugelly Yumpo Moreno Carina Rosario Mantari Torpoco
datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv") library(dplyr) library(ggplot2) DATOS_FILTRADOS <- filter(datos, Index==5) View(DATOS_FILTRADOS)
ggplot(data = DATOS_FILTRADOS, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + guides(fill = guide_legend(title = "Genero")) + labs(title = "Diagrama de Cajas de Mujeres y Varones")
Integrante: Juan Pablo Huarachi Valencia ##base de datos datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv") library(dplyr) library(ggplot2)
##Filtro Index = 5#### datos_index5 <- datos %>% filter(Index == 5)
ggplot(data = datos_index5, aes(y = Altura, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(x='Género', y='Altura (cm)', title = "Altura de Mujeres y Varones con Index 5")
ggplot(data = datos_index5, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(x='Género', y='Peso (kg)', title = "Peso de Mujeres y Varones con Index 5")
### instalacion de paquetes:
install.packages("dplyr")
library(dplyr) ## posit Rstudio
install.packages("BiocManager")
library(BiocManager)
BiocManager::install("ggplot2")
library(ggplot2)
### FUnciones propias
## dplyr - Manejo de datos - editar - modificar y filtrar
### CASOS de USO
## Filtrar Filas
datos <- mtcars
filaCyl6 <- datos %>% filter(cyl == 6)
write.csv(filaCyl6,"filascyl.csv")
### seleccionar columnas
columnas <- datos %>% select(hp,mpg,disp)
## crear nuevas columnas
nuevacolumna <- datos %>% mutate(nuevaColumna = hp/cyl)
## * multiplicar
## / dividir
## agrupamiento (group_by) - conteo (summarize)
conteo <- datos %>% group_by(cyl,hp) %>%
summarize(Conteo = n() )
## Ordenar Filas arrange
orden <- datos %>% arrange(cyl)
## ggplot2 - graficos - mapas - boxplot
library(ggplot2)
ggplot(data = datos, aes(x = cyl, y = hp, fill = hp)) +
geom_point() + theme_linedraw()
install.packages("dplyr") install.packages("ggplot2")
library(dplyr) library(ggplot2)
datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")
datos_filtr <- subset(datos, Index == 5)
ggplot(data = datos_filtr, aes(y = Altura, x = Genero, color=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(x='Género', y='Altura (cm)', title = "Altura de individuos con índice 5")
ggplot(data = datos_filtr, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + theme_bw ()+ labs(x='Género', y='Peso (kg)', title = "Peso de individuos con índice 5")
*Grupo Alexander Huaman Mera Yuriko Murillo Domen
datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")
library(dplyr) library(ggplot2)
DATOS_FILTRADOS <- filter(datos, Index==5)
ggplot(data = DATOS_FILTRADOS, aes(y = Peso, x = Genero, fill=Genero)) + geom_boxplot() + geom_jitter() + guides(fill = guide_legend(title = "Genero"))
Integrantes del grupo:
SCRIP DESAFÍO 1
1.- PRIMERA PARTE: SELECCIÓN DE SUBCONJUNTO DE DATOS CON Index 5 install.packages("dplyr") library(dplyr)
install.packages("BiocManager") library(BiocManager)
BiocManager::install("ggplot2") library(ggplot2)
datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv") datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")
datos <- read.csv("https://raw.githubusercontent.com/FranciscoAscue/Rgenomics/master/data.csv")
filaIndex5 <- datos %>% filter(Index == 5)
2.- SEGUNDA PARTE: GRÁFICO CON ggplot library(ggplot2)
ggplot(data = datos, aes(x=Genero, y=Peso, fill=Genero)) + geom_boxplot() + labs(title = "Diagrama de Cajas y Bigotes de Femeninos y Masculinos")
#### Variables en R / Atomicos
y <- 5
x <- "ACGACGATCGACGATCG"
z <- TRUE ## boolean
#### Estructuras de datos en R
### vectores y listas
vector <- c(1,2,"a",4,5,6) ## homogeneos
lista <- list(1,2,"a",4,5,6) ## heterogeneo
lista[3][[1]]
### matrix and Dataframes
matriz <- matrix(1:100, 10 , 10) ## homogeneos
df <- data.frame(Columna1 = 1:4, Columna2 = c('a','b','c','d') ) ## heterogeneo
str(df)
### como recuperar un dato de una tabla
matriz[3,4]
df$Columna2
unzip("iris.zip")
datos <- read.table("iris.csv", sep = ",", header = FALSE )
write.csv(matriz, "matriz.csv")
### instalar paquetes
excel <- read_xlsx('Financials Sample Data.xlsx')
#install.packages("BiocManager")
BiocManager::install("ggplot2")
library(devtools)
install_github()
install_bitbucket()
#### funciones basicas en R
library(help = "datasets")
mean(iris$Sepal.Length)
median(iris$Sepal.Length)
var(iris$Sepal.Length)
cov(iris$Sepal.Length, iris$Sepal.Width)
sd(iris$Sepal.Length)
summary(iris$Sepal.Length)
boxplot(iris$Sepal.Length)
#### Plots Basicos en R
heatmap( cor(iris[,-5]) )
plot(iris$Sepal.Length, iris$Sepal.Width)
hist(iris$Petal.Length)
pie( table(iris$Species) )
#### Manipulacion de datos y plots con GGPLOT2
### dplyr - Manipulacion de datos
#install.packages("dplyr")
library(dplyr)
### filtrar filas
mtcars %>% filter(cyl == 6, vs == 0)
### <, > , ==, <= , >=
### seleccionar columnas
mtcars %>% select(cyl,wt,qsec)
### incorporar nueva columna
mtcars %>% mutate(NUEVACOlUMna = mpg/hp )
### ordenar tabla
mtcars %>% arrange(desc(hp),wt)
### agrupamiento { categorias }
mtcars %>% group_by(cyl,vs) %>% summarise(Conteo = n())
### ggplot2
#install.packages("ggplot2")
library(ggplot2)
ggplot(data = mtcars, aes(x = disp , y = hp , color = cyl )) +
geom_point()
ggplot(data = mtcars, aes(x = cyl , fill = as.character(cyl) )) +
geom_histogram() + labs(fill = "Cilindros",
x = "Cilindros", y = "Frecuencia", title = "PLOT")
library(help="datasets")
x <- FALSE
y <- 12
a <- list(1,2,"a",4,TRUE)
b <- matrix( 1:20 , ncol = 4, nrow = 5 )
m <- matrix( 1:40 , 8, 5 )
m[4,] # Acceder a los datos de una matriz
z <- c(1,6,4,4,5)
d <- c("a","a","b","b","a")
f <- c(1,6,2,1,0)
tabla <- data.frame(Numero = z , Letra= d, Boleanos = f)
tabla2 <- tabla[,-2]
### Algunas mas complejas
datos <- c(20,21,12,41,59)
length(datos)
sum(datos)/length(datos)
# convertimos en una solución mas global
# funciones
PROmEDIO <- function(x){
pmd <- sum(x)/length(x)
return(pmd)
}
PROmEDIO(c(50,21,22,11,19))
### Paquetes
### sensity case
#install.packages("dplyr")
#### manejo, limpieza, modificación de datos
library(dplyr)
datos <- as.data.frame(DNase)
datos$Run <- as.numeric(datos$Run) #convertir numérico
### Filtrar filas
corrida1_2_3 <- datos %>% filter(Run < 8, density < 1)
corrida123 <- datos %>% filter(Run %in% c(1,2,3))
### seleccionar columnas
columna13 <- datos %>% select(Run,density)
### Crear columnas
nuevo_datos <- datos %>% mutate(producto = conc * density)
### Group by - summarise
tabla_frecuencia <- datos %>% group_by(Run) %>%
summarise(Conteo = n() )
### Ordenar (arrange)
datos %>% arrange(desc(conc)) ## menor a mayor
datos %>% arrange(conc) ## mayor a menor
## | pipe - %>%
install.packages("tidyverse")
Genomics web - Introducción a R
https://franciscoascue.github.io/Rgenomics/modulo6.html