micresh / data-analytics-2019-KubSTU

0 stars 2 forks source link

LR2 #10

Open micresh opened 5 years ago

micresh commented 5 years ago

https://github.com/micresh/data-analytics-2019-KubSTU/blob/master/lr2/lr2-rlab-ready.pdf

NataliaVl commented 5 years ago

`library("psych")# описательные статистики library("lmtest") # тестирование гипотез в линейных моделях library("ggplot2")# графики library("dplyr") # манипуляции с данными library("stats")

Загрузить набор данных для своего варианта

train <- read.csv("D:/Учёба/1 семестр маг/Анализ/lr2/train.csv", header = TRUE, sep = ",")

Просмотр полученных данных

View(train)

2.Построить график корреляционного поля

qplot(data = train, train$X48df886f9, train$target)

Настройка внешнего вида графика

ggplot() + geom_point(aes(x=train$X48df886f9, y=train$target), size = 2) + theme_bw(base_size =18) + xlab("Фактор X48df886f9") + ylab("target") + labs(title = "Корреляционное поле")

3. построить ур-ие регрессии

model <- lm(data=train, X48df886f9~target) model$coefficients

таким образом мы нашли коэффициенты ур-ия и можем составить ур-ие парной линейной регрессии

ур-ие регрессии: F = 1.1791 + 4.817*target

4 Проверить значимость каждого из полученных уравнений регрессии. Показать уравнения регрессии с заданным в варианте доверительным интервалом на графиках

qplot(data = train, train$X48df886f9, train$target) + stat_smooth(method="lm", level = 0.95) + theme_bw(base_size = 18) summary(model)

F-statistic: 0.4627 on 1 and 4457 DF, p-value: 0.4964

уравнение регрессии получилось значимым?

5. Построить прогнозы по каждому из уравнений парной регресcии

nd <- data.frame(train$X48df886f9 = c(40,60))

Строим прогноз функцией  predict :

predict(model,nd)

6.Построить уравнение множественной линейной регрессии и получить корреляционную матрицу

install.packages("GGally", "sjPlot") library("GGally") train1 <- train[,2:7] model2 <- lm(data=train1, X48df886f9~target+ train1$X0deb4b6a8 + train1$X34b15f335 + train1$a8cb14b00 + train1$X2f0771a37) model2$coefficients

таким образом мы нашли коэффициенты ур-ия и можем составить ур-ие МНОЖЕСТВЕННОЙ линейной регрессии

получим корреляционную матрицу

ggpairs(train1) cor(train1)

7.Построить прогноз по уравнению множественной регрессии для заданных в варианте значений факторов

nd2 <- data.frame(Agriculture=0.5,Catholic=0.5, Education=20) predict(model2,nd2)

`