最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

R語(yǔ)言基于逐步多元回歸模型的天貓商品流行度預(yù)測(cè)

2023-07-13 23:29 作者:拓端tecdat  | 我要投稿

全文鏈接:https://tecdat.cn/?p=33212

原文出處:拓端數(shù)據(jù)部落公眾號(hào)

本文通過(guò)利用回歸模型對(duì)天貓商品流行度進(jìn)行了研究,確定了決定天貓商品流行度的重要因素。并講述、論證了預(yù)測(cè)天貓商品流行度是天貓商品交易的至關(guān)重要的環(huán)節(jié)。通過(guò)對(duì)天貓商品流行度預(yù)測(cè)技術(shù)的發(fā)展和探討,深度剖析了天貓商品流行度預(yù)測(cè)這個(gè)研究課題。

一、 天貓商品流行度預(yù)測(cè)發(fā)展簡(jiǎn)介

本文使用的數(shù)據(jù)集為天貓商品數(shù)據(jù)集。 它包含562個(gè)商品的屬性數(shù)據(jù)。每個(gè)商品包括4個(gè)屬性,具體的4個(gè)屬性如下:

該數(shù)據(jù)集有以下一些變量:

列名?描述?Item_id[ 1 , 8133507]為整數(shù),表示唯一項(xiàng)(備注:兩個(gè)以上商家同時(shí)提供的 A產(chǎn)品記錄在多個(gè)不同ID的行中。例如,流行的手機(jī)如iPhone 6。)。?Title一個(gè)包含多個(gè)關(guān)鍵字的?字符串,由' ' ?分隔。通過(guò)NLP系統(tǒng)從原始標(biāo)題中提取單詞。Pict_url在線鏈接到對(duì)應(yīng)圖片的URL ?。Category?字符串' x-y ',其中? ' x '表示其父類,' y '表示其余類。Brand_id字符串為' b1 '、' b89366 ',表示商品的品牌。Seller_id字符串' s1 ',' s86799 ',表示出售該物品的賣方。

對(duì)數(shù)據(jù)進(jìn)行概覽

summary(data)

刪除缺失值

datanew=na.omit(data)

主要思路

為了準(zhǔn)確的估計(jì)流行度,了解天貓商品流行度的一般規(guī)律,更好為天貓商品投資方提供參考意見(jiàn),本文從天貓商品流行度和天貓商品相關(guān)屬性出發(fā),采用多元回歸分析方法,建立了線性回歸模型,得出了天貓商品流行度變動(dòng)的影響因素. 具體分析步驟:

1.關(guān)系分析

2.選擇多項(xiàng)式回歸模型

2.1變量選取

通過(guò)向前向后逐步迭代回歸模型篩選出顯著性較強(qiáng)的變量進(jìn)行回歸建模。

2.2顯著性檢驗(yàn)

根據(jù)F值和p值統(tǒng)計(jì)量來(lái)判斷模型是否具有顯著的統(tǒng)計(jì)意義。

2.3擬合預(yù)測(cè)

使用得到的模型對(duì)實(shí)際數(shù)據(jù)進(jìn)行擬合和預(yù)測(cè)。

3.擬合不同的模型。查看模型效果,包括對(duì)數(shù)回歸模型,迭代回歸模型。

4.分析得出結(jié)論

得出各個(gè)自變量之間的關(guān)系,以及它們對(duì)因變量的影響及其意義。? ?

流行度

查看每個(gè)類別的出現(xiàn)頻率作為流行度,通過(guò)直方圖查看每個(gè)類別出現(xiàn)的頻率:

hist(datanew$category)

對(duì)每個(gè)類別出現(xiàn)的頻數(shù)的多少進(jìn)行排序:

order(table(dataneg = T)datanew$pop=?? order(

然后將出現(xiàn)最多的流行度排序?yàn)?,然后根據(jù)類比的出現(xiàn)頻數(shù)遞增。流行度越大,則出現(xiàn)越少。

建立多元線性:imdb

嘗試通過(guò)最直觀的解釋建立模型:

進(jìn)行多元線性模型并進(jìn)行分析

設(shè)置dummy 變量 : 從全變量模型可以看出大部分變量無(wú)法估計(jì)出其參數(shù),說(shuō)明部分變量不適合用來(lái)預(yù)測(cè)流行度,因此對(duì)其中的部分變量進(jìn)行刪減后。得到篩選后的回歸模型。

篩選變量

顯示回歸結(jié)果:

模型比較

js

**取對(duì)數(shù)后的結(jié)果** ?summary(lmmod2)顯示回歸結(jié)果

回歸結(jié)果

plot(datanew$category

回歸結(jié)果分析

從輸出結(jié)果可以看出, 流行度和類別和品牌圖片地址 有顯著相關(guān)關(guān)系 ,可以看到他們的回歸系p數(shù)在顯著性水平0.05下均顯著不為零。進(jìn)一步地剩余方差的估計(jì)值,f統(tǒng)計(jì)量的估計(jì)值對(duì)應(yīng)的p值< 2.2e-16說(shuō)明,回歸方程是顯著的??蓻Q系數(shù)R,修正的可決系數(shù)R為 0.1左右說(shuō)明方程的擬合效果一般,還有部分的流行度被其他變量所解釋。

回歸結(jié)果

置信區(qū)間與預(yù)測(cè)區(qū)間:

置信區(qū)間是給定自變量值后,由回歸方程得到的的預(yù)測(cè)值(實(shí)際上是的平均值)的置信區(qū)間;預(yù)測(cè)區(qū)間是實(shí)際值的置信區(qū)間,在這里稱為預(yù)測(cè)區(qū)間。預(yù)測(cè)區(qū)間要比置信區(qū)間稍大,命令與顯示結(jié)果如下:

head(predict(lm))

head(predict(lmmod

殘差分析:

殘差分析可以對(duì)回歸模型的假設(shè)條件即隨機(jī)誤差項(xiàng)是否獨(dú)立同分布進(jìn)行檢驗(yàn),同時(shí)還可以找出離群點(diǎn)。命令語(yǔ)句為plot(lm.1),顯示結(jié)果如下

par(mfrow=c(2,2)) ?plot(lmmod2)

左上圖是擬合值與殘差的散點(diǎn)圖,從圖上可以發(fā)現(xiàn),除去第2個(gè)離群點(diǎn)外,所有點(diǎn)基本上是隨機(jī)地分散在縱坐標(biāo)值為-1和+1的兩條平行線之間,這說(shuō)明隨機(jī)誤差項(xiàng)具有同方差性;左下圖是擬合值與殘差的標(biāo)準(zhǔn)差的散點(diǎn)圖,其意義與上面類似;右上圖表明隨機(jī)誤差項(xiàng)是服從正態(tài)分布的,其原因是正態(tài)Q-Q圖近似地可以看成一條直線;右下圖的CooK距離圖進(jìn)一步證實(shí)第2個(gè)觀測(cè)值是一個(gè)離群點(diǎn),它對(duì)回歸方程的影響是比較大的,要根據(jù)具體問(wèn)題,討論出現(xiàn)這一觀測(cè)值的實(shí)際背景。

逐步回歸優(yōu)化

使用逐步回歸法建立“最優(yōu)”的回歸方程

stepmod=step

summary(stepmod)查看模型參數(shù)與結(jié)果

上面用“逐步向前向后回歸法”,通過(guò)軟件分析建立“最優(yōu)”回歸方程。向后回歸法就是建立包含全部因子的回歸方程,通過(guò)回歸系數(shù)的檢驗(yàn),從回歸方程中逐個(gè)剔除不顯著的因子,直到留在方程中的因子都是顯著的。

總結(jié)

從分析結(jié)果可以看出, 流行度和類別和品牌圖片地址有顯著相關(guān)關(guān)系 ,因此可以認(rèn)為在天貓購(gòu)物時(shí),用戶會(huì)比較關(guān)注商品的品牌因素,因?yàn)樘熵埗际钦飞啼?,?gòu)買的用戶會(huì)比較關(guān)注商品的品牌是否為正品等。同時(shí),由于天貓的商品質(zhì)量有一定的保證,因此用戶也會(huì)關(guān)注該商品的圖片,同一個(gè)商品可能會(huì)因?yàn)閳D片不同而造成不同的流行度。圖片好看的商品會(huì)有更好的流行度。

?最受歡迎的見(jiàn)解

1.R語(yǔ)言多元Logistic邏輯回歸 應(yīng)用案例

2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語(yǔ)言泊松Poisson回歸模型分析案例

5.R語(yǔ)言混合效應(yīng)邏輯回歸Logistic模型分析肺癌

6.r語(yǔ)言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)

7.R語(yǔ)言邏輯回歸、Naive Bayes貝葉斯、決策樹(shù)、隨機(jī)森林算法預(yù)測(cè)心臟病

8.python用線性回歸預(yù)測(cè)股票價(jià)格

9.R語(yǔ)言用邏輯回歸、決策樹(shù)和隨機(jī)森林對(duì)信貸數(shù)據(jù)集進(jìn)行分類預(yù)測(cè)


R語(yǔ)言基于逐步多元回歸模型的天貓商品流行度預(yù)測(cè)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
南漳县| 河津市| 九龙城区| 兴安县| 安阳县| 衡南县| 普格县| 中方县| 三亚市| 安宁市| 望都县| 曲阜市| 龙泉市| 苏尼特右旗| 阆中市| 乌什县| 旬邑县| 石嘴山市| 聂荣县| 凤山市| 林周县| 福海县| 阳东县| 凤阳县| 嘉峪关市| 隆昌县| 连平县| 桐乡市| 克拉玛依市| 蒲城县| 墨脱县| 鲁甸县| 六盘水市| 永善县| 永仁县| 海口市| 衡水市| 泾阳县| 察隅县| 龙口市| 永平县|