R語言逐步回歸、方差anova分析電影市場調(diào)查問卷數(shù)據(jù)可視化
全文鏈接:http://tecdat.cn/?p=30680
原文出處:拓端數(shù)據(jù)部落公眾號
這是一份有關(guān)消費者對電影市場看法及建議的調(diào)查報告,我們采取了問卷調(diào)查法,其中發(fā)放問卷256份,回收有效問卷200份。
我們對數(shù)據(jù)進行了基本分析,比如:相關(guān)性。還有基本圖形、回歸方差分析。最后模型比較。

讀入數(shù)據(jù)
head(data)

數(shù)據(jù)的描述
str(data)
數(shù)據(jù)一共有200個樣本,25個屬性。具體屬性和取值及其含義如下:

數(shù)據(jù)展示
繪制各個變量的餅圖可以看到基本人口信息的各個取值的所占的百分比。


數(shù)據(jù)特性總結(jié)
基本統(tǒng)計量


數(shù)據(jù)準備
數(shù)據(jù)的清理
#數(shù)據(jù)清理
對缺失值(NA)的處理data=na.omit(data)
?
#變量篩選
?colnames(data)
?data=data[, -which(colnames(data) %in% c("填寫時間","是否星標(biāo)","提交后隨機碼" , "是否已
數(shù)據(jù)分析
基本數(shù)據(jù)分析,比如:相關(guān)性。還有基本圖形、回歸方差分析。 最后模型比較。
數(shù)據(jù)檢驗
相關(guān)性
查看您對中國電影產(chǎn)業(yè)的發(fā)展建議和請問您看電影的主要目的是什么變量之間是否具有相關(guān)關(guān)系

檢驗的結(jié)果是,由于P =0.016<0.05,因此在0.05的顯署性水平下,拒絕原假設(shè),認為兩者之間具有相關(guān)關(guān)系。
下面進行方差分析
m1<-aov(Q12.您一般通過什么途徑購買電影票~Q9.請問您看電影的主要目的是什么,data=datacor)

?由于p值大于0.05,從這個結(jié)果可以看出看電影的不同目下購買電影股票的差別不顯著。

?由于p值小于0.05,從這個結(jié)果可以看出看電影的不同目下購買電影股票的差別不顯著。
回歸分析

從回歸模型的結(jié)果來看,可以看到接受電影票價格區(qū)間對被調(diào)查對象考慮的電影外在因素有比較大的影響,p值小于0.05,因此該變量對被調(diào)查者選擇去看電影有顯著的影響 。其次被調(diào)查者的年齡也有較明顯的影響,可以年齡和被調(diào)查者去看電影有較大的負相關(guān)關(guān)系,因此可以認為年齡大的人會傾向于考慮的看電影各種外在因素。
plot(model)

從回歸模型的殘差結(jié)果圖來看,殘差比較均勻地分布在0線周圍,和qq圖周圍,說明殘差隨機服從正態(tài)分布,因此,回歸模型具有較好的效果。
模型的比較和討論
模型篩選與比較,使用逐步回歸進行模型篩選最優(yōu)模型,然后和傳統(tǒng)的回歸模型進行比較。 刪去不顯著的變量.

進行變量刪減后的回歸模型,我們得到最優(yōu)變量是被調(diào)查者接受的電影票價格區(qū)間,p值小于0.05,說明該變量對被調(diào)查者考慮的外在因素有顯著的影響。


最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言混合效應(yīng)邏輯回歸Logistic模型分析肺癌
6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)
7.R語言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機森林算法預(yù)測心臟病
8.python用線性回歸預(yù)測股票價格
9.R語言用邏輯回歸、決策樹和隨機森林對信貸數(shù)據(jù)集進行分類預(yù)測