micresh / data-analytics-2019-KubSTU

0 stars 2 forks source link

LR-2 #9

Open micresh opened 5 years ago

micresh commented 5 years ago

https://github.com/micresh/data-analytics-2019-KubSTU/blob/master/lr2/lr2-rlab-ready.pdf

arheor commented 4 years ago

library("psych")# описательные статистики library("lmtest") # тестирование гипотез в линейных моделях library("ggplot2")# графики library("dplyr") # манипуляции с данными library("MASS") # подгонка распределений library("sjPlot")

  1. Загрузить набор данных для своего варианта, ознакомиться с его содержимым. data <- read.csv("C://R/train.csv", header = TRUE, sep = ",")
  2. Построить график корреляционного поля для каждого фактора. qplot(data=data, Age, Fare) ggplot() + geom_point(aes(x=data$Age, y=data$Fare), size = 2) + theme_bw(base_size = 18) + xlab("Возраст") + ylab("Плата") + labs(title = "Корреляционное поле")
  3. Построить уравнение парной линейной регрессии для каждого фактора. model <- lm(data=data, Age~Fare) model$coefficients
  4. Проверить значимость каждого из полученных уравнений регрессии. Показать уравнения регрессии с заданным в варианте доверительным интервалом на графиках. summary(model) qplot(data = data, data$Age, data$Fare) + stat_smooth(method="lm", level = 0.95) + theme_bw(base_size = 18)
  5. Построить прогнозы по каждому из уравнений парной регрессии для заданных в варианте значений факторов. nd <- data.frame(Fare=c(20,40)) predict(model, nd)
  6. Построить уравнение множественной линейной регрессии и получить корреляционную матрицу. survived <- data$Survived pclass <- data$Pclass age <- data$Age fare <- data$Fare model <- lm(data = data, age~fare+survived+pclass) model$coefficients newData <- data.frame(age, fare, survived, pclass) sjp.corr(newData)
  7. Построить прогноз по уравнению множественной регрессии для заданных в варианте значений факторов summary(model) nd <- data.frame(fare=7, survived=0, pclass=3) predict(model, nd)