最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

MATLAB改進模糊C均值聚類FCM在電子商務(wù)信用評價應(yīng)用:分析淘寶網(wǎng)店鋪數(shù)據(jù)

2023-06-15 23:26 作者:拓端tecdat  | 我要投稿

全文鏈接:http://tecdat.cn/?p=32794

原文出處:拓端數(shù)據(jù)部落公眾號

近年來電子商務(wù)發(fā)展迅速,隨之而來的信用問題給消費者帶來諸多困擾,造成電子商務(wù)網(wǎng)上各種交易問題產(chǎn)生的原因是多方面的,但總的來說是缺乏有效的信用評價體系。目前各電子商務(wù)網(wǎng)站雖然都建立了信用評價體系,但是各網(wǎng)站提出的信用評價系統(tǒng)、流程以及指標體系大體相同并已經(jīng)使用多年,并沒有根據(jù)電子商務(wù)的現(xiàn)實發(fā)展而進行創(chuàng)新優(yōu)化,也沒有根據(jù)評價用戶實際需求進行更精準的設(shè)計。

本文以淘寶網(wǎng)為例,幫助客戶改進了指標體系,并通過模糊C均值聚類對賣家基于新的指標體系進行信用分類。

聚類算法是一種常用的數(shù)據(jù)分析和模式識別方法,用于將數(shù)據(jù)集劃分為若干個相似的子集,每個子集稱為一個簇。模糊聚類算法是一種基于模糊理論的聚類方法,具有較好的魯棒性和靈活性,因此在許多領(lǐng)域得到了廣泛的應(yīng)用。

傳統(tǒng)的模糊C均值聚類算法

模糊C均值聚類算法是最早和最常用的模糊聚類算法之一。該算法通過最小化目標函數(shù)來確定數(shù)據(jù)集中每個樣本的隸屬度和聚類中心,從而實現(xiàn)聚類分析。然而,傳統(tǒng)的模糊C均值聚類算法存在收斂速度慢、對初始聚類中心敏感等問題。

改進的模糊聚類算法

為了克服傳統(tǒng)模糊C均值聚類算法的不足,研究者們提出了許多改進的模糊聚類算法。例如,基于遺傳算法的模糊聚類算法、基于粒子群優(yōu)化的模糊聚類算法等。這些改進算法在收斂速度、聚類效果等方面都有所提升。

基于模糊聚類的其他應(yīng)用領(lǐng)域

除了在數(shù)據(jù)分析和模式識別領(lǐng)域,模糊聚類算法還被廣泛應(yīng)用于其他領(lǐng)域。例如,在圖像分割、模式識別、生物信息學等領(lǐng)域都有模糊聚類算法的應(yīng)用。這些應(yīng)用領(lǐng)域的研究為模糊聚類算法的發(fā)展提供了新的方向和挑戰(zhàn)。

圖描述了一個凝聚模糊聚類方法AGENES和一個分裂模糊聚類方法DIANA在一個包括五個對象的數(shù)據(jù)的集合{a,b,c,d,e}上的處理的過程。初始時,AGENES將每個樣本點自為一簇,之后這樣的簇依照某一種準則逐漸合并,例如,例如簇C1中的某個樣本點和簇C2中的一個樣本點相隔的距離是所有不同類簇的樣本點間歐幾里得距離最近的,則認為簇C1和簇C2是相似可合并的。

實驗及結(jié)果分析

C2C電子商務(wù)信用評價模型的基本原理是:確認收貨之后,買方可以根據(jù)模型內(nèi)的評價指標,如商品質(zhì)量,物流速度,售后服務(wù)等方面,在一定時間內(nèi),根據(jù)自身交易完成情況為賣家評價,也可以雙方互評以形成信用記錄。交易雙方的信用反饋都會按模型設(shè)定的計算方式累計,以反映該用戶的信用狀況,以便其他交易方做選擇時參考。

目前淘寶網(wǎng)所采用的信用評價模型是累加模型,即原有的信用積分基礎(chǔ)上直接進行加減,其模型表示如下:

其中:Rn、Rn-1分別表示淘寶用戶截止到第 n、n-1 次交易之后所獲得的信用得分,rn{-1,0,1}表示{差評,中評,好評},即當 rn獲得“差評”時在原來信用積分的基礎(chǔ)上加上“-1”分,用戶獲得中評時,就在原來信用積分的基礎(chǔ)上加“0”分,當用戶獲得好評時,在原來信用積分的基礎(chǔ)上加“+1”分。累加模型能夠簡單直觀的展現(xiàn)交易雙方的信用積分,一定程度上可作為交易雙方的信用參考。

實驗平臺

MATLAB是matrix&laboratory兩個詞的組合,意為矩陣工廠(矩陣實驗室)。是由美國mathworks公司發(fā)布的主要面對科學計算、可視化以及交互式程序設(shè)計的高科技計算環(huán)境。它將數(shù)值分析、矩陣計算、科學數(shù)據(jù)可視化以及非線性動態(tài)系統(tǒng)的建模和仿真等諸多強大功能集成在一個易于使用的視窗環(huán)境中,為科學研究、工程設(shè)計以及必須進行有效數(shù)值計算的眾多科學領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計語言(如C、Fortran)的編輯模式,代表了當今國際科學計算軟件的先進水平。

構(gòu)建指標體系

由于本文主要是基于 C2C 電子商務(wù)交易過程中的信用問題,從交易主體的角度來對 C2C 電子商務(wù)信用風險進行評價,目前淘寶網(wǎng)的信用評價指標體系主要由三個指標構(gòu)成,分別是:與圖片相符程度、服務(wù)態(tài)度以及發(fā)貨速度,如下圖所示:

而在實際網(wǎng)購過程中可以發(fā)現(xiàn)這三個指標并不能讓消費者對于物品的進行準確評價,消費者往往需要額外進行大片文字的敘述來評價商品以及服務(wù)。

故此,本文根據(jù)消費者評論文字中經(jīng)常出現(xiàn)的關(guān)鍵詞新增了評價指標,選擇了商品屬性,賣家服務(wù)以及物流服務(wù)作為相應(yīng)準則層,具體的指標體系如下:

數(shù)據(jù)集搜集及預處理

本文以日常生活使用較多的淘寶網(wǎng)為例,按照指標體系中所列指標進行數(shù)據(jù)獲取,其中與圖片相符程度,服務(wù)態(tài)度以及發(fā)貨速度三個指標在淘寶網(wǎng)上能夠直接獲取,其他指標由于淘寶網(wǎng)上沒有直接數(shù)據(jù),故選擇了10家本人及朋友購買過的淘寶服裝店鋪,針對其他指標給出自己的評分,將所有指標的評分原始數(shù)據(jù)匯總,計算平均值,所得數(shù)據(jù)匯總?cè)缦拢?/p>

實驗過程(關(guān)鍵參數(shù)設(shè)置)

一次聚類算法是一種無監(jiān)督的層次聚類算法,需要事先給定層次聚類數(shù)C。

% 計算樣本點距離聚類中心的距離% 輸入:% ? center ? ? ---- 聚類中心% ? data ? ? ? ---- 樣本點% 輸出:% ? out ? ? ? ?---- 距離out = zeros(size(center, 1), size(data, 1)); for k = 1:size(center, 1), % 對每一個聚類中心f = U.^expo; ? ? ? % 隸屬度矩陣進行指數(shù)運算結(jié)果dist = distfcm(center, data); ? ? ? % 計算距離矩陣%將options 中的分量分別賦值給四個變量; expo = options(1); ? ? ? ? ?% 隸屬度矩陣U的指數(shù)max_iter = options(2); ?% 最大迭代次數(shù)min_impro = options(3); ?% 隸屬度最小變化量,迭代終止條件display = options(4); ?% 每次迭代是否輸出信息標志objfcn = zeros(max_iter, 1); % 初始化輸出參數(shù)obj_fcn

由于數(shù)據(jù)集各指標值的量綱相同,因此不需要對相關(guān)指標值進行標準化處理,得到如圖所示的結(jié)果

相應(yīng)的層次聚類譜系圖如圖所示:

?plot(data(:,1), data(:,2),'o'); ? ? ? hold on; ? ? ? maxU = max(U); ? ? ? index1 = find(U(1,:) == maxU); ? ? ? index2 = find(U(2,:) == maxU); ? ? ? line(data(index1,1),data(index1,2),'marker','*','color','g'); ? ? ? line(data(index2,1),data(index2,2),'marker','*','color','r'); ? ? ? plot([center([1 2],1)],[center([1 2],2)],'*','color','k')

結(jié)果分析

對于現(xiàn)有指標體系,增加了新的指標如:售后服務(wù),送貨速度,包裝完整度等,使得指標體系更完全,通過淘寶10個賣家的指標數(shù)據(jù)的處理,得出最終的信用綜合評分,由排名可以看見第四家得分最高,而第四家由于其商品質(zhì)量高,價格卻很便宜,在服務(wù)態(tài)度以及物流服務(wù)方面都深得買家的喜歡,排名最低的第一家買家其銷量非常高,但是由于商品質(zhì)量不過關(guān),使得商品的質(zhì)量與其價格不對稱,而且賣家售后服務(wù)態(tài)度惡劣,由此可以看出淘寶現(xiàn)有的信用評價體系能夠給買家提供一定的參考,但是如果能夠增加一些指標,將會對買家起到更好的參考作用。

總結(jié)

本文總結(jié)了簡單介紹了層次聚類算法國內(nèi)外研究現(xiàn)狀,重點介紹了層次聚類算法的基本原理與實現(xiàn)流程。同時,針對 C2C 電子商務(wù)中所出現(xiàn)的信用風險問題,提出使用信用評價體系來降低信用風險。并簡述了國內(nèi)外在信用評價方面的研究現(xiàn)狀。基于現(xiàn)有的評價指標體系,添加新指標,給出了更為全面完善的指標體系。以淘寶網(wǎng)為例,采集數(shù)據(jù),應(yīng)用層次聚類對10家店鋪進行聚類分析。對比最終結(jié)果和實際購買體驗,證明了淘寶現(xiàn)有信用評價模型對于消費者選擇賣家時有一定的指導意義,但是體系有明顯提升空間。

參考文獻

[1] Pang-Ning Tan Michael Steinbach Vipin Kumar著.范明,范宏建等譯.數(shù)據(jù)挖掘?qū)д揫M].北京:人民郵電出版社,2006.

[2]J.Han,M.Kamber著.范明,孟小峰等譯.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2001:1~262.

[3] 張鑫.層次聚類算法的研究與應(yīng)用[D]:[碩士學位論文].江西:江西理工大學,2008.

[4] 段明秀.層次聚類算法的研究及應(yīng)用[D]:[碩士學位論文].長沙:中南大學,2009.

[5] 楊海斌.一種新的層次聚類算法的研究及應(yīng)用[D]:[碩士學位論文].甘肅:西北師范大學,2011.

[6] 馬曉艷,唐雁.層次聚類算法研究[J].計算機科學,2008,34(7):34~36.

[7] 魏桂英,鄭玄軒.層次聚類方法的CURE算法研究[J].科技和產(chǎn)業(yè),2005,5(11):22~24.

[8] 蔣盛益,李霞.一種改進的BIRCH聚類算法[J].計算機應(yīng)用,2009,29(1):293~296.

?最受歡迎的見解

1.R語言k-Shape算法股票價格時間序列聚類

2.R語言基于溫度對城市層次聚類、kmean聚類、主成分分析和Voronoi圖

3.R語言對用電負荷時間序列數(shù)據(jù)進行K-medoids聚類建模和GAM回歸

4.r語言鳶尾花iris數(shù)據(jù)集的層次聚類

5.Python Monte Carlo K-Means聚類實戰(zhàn)

6.用R進行網(wǎng)站評論文本挖掘聚類

7.R語言KMEANS均值聚類和層次聚類:亞洲國家地區(qū)生活幸福質(zhì)量異同可視化

8.PYTHON用戶流失數(shù)據(jù)挖掘:建立邏輯回歸、XGBOOST、隨機森林、決策樹、支持向量機、樸素貝葉斯模型和KMEANS聚類用戶畫像

9.R語言基于Keras的小數(shù)據(jù)集深度學習圖像分類


MATLAB改進模糊C均值聚類FCM在電子商務(wù)信用評價應(yīng)用:分析淘寶網(wǎng)店鋪數(shù)據(jù)的評論 (共 條)

分享到微博請遵守國家法律
岳阳县| 张家港市| 大英县| 达孜县| 南和县| 阿勒泰市| 清镇市| 三门峡市| 黑龙江省| 梁平县| 文登市| 浪卡子县| 福州市| 蒲江县| 左云县| 漯河市| 武清区| 安多县| 高平市| 明光市| 罗田县| 大渡口区| 大厂| 四子王旗| 皮山县| 马鞍山市| 孝义市| 余姚市| 治多县| 灵武市| 清水河县| 永川市| 大理市| 长海县| 资溪县| 南城县| 晋宁县| 秦皇岛市| 临城县| 开原市| 台北市|