論數(shù)據(jù)挖掘與電子商務(wù)的契合:電子商務(wù)數(shù)據(jù)挖掘
發(fā)布時(shí)間:2020-03-07 來(lái)源: 感悟愛(ài)情 點(diǎn)擊:
[摘要]指出以6個(gè)論題為基礎(chǔ)的數(shù)據(jù)挖掘可以有效地幫助企業(yè)優(yōu)化決策管理、客戶關(guān)系管理、協(xié)同商務(wù)管理、營(yíng)銷模式管理、網(wǎng)站維護(hù)管理和風(fēng)險(xiǎn)控制管理、確認(rèn)目標(biāo)市場(chǎng),以獲得更大的競(jìng)爭(zhēng)優(yōu)勢(shì)。其次通過(guò)對(duì)電子商務(wù)環(huán)境下Web挖掘技術(shù)的論述,具體分析Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘、Web訪問(wèn)挖掘?qū)τ陔娮由虅?wù)的作用,并對(duì)具體技術(shù)進(jìn)行分析與評(píng)價(jià)。最后介紹國(guó)內(nèi)外電子商務(wù)數(shù)據(jù)挖掘的主要研究?jī)?nèi)容。
[關(guān)鍵詞]數(shù)據(jù)挖掘 電子商務(wù) Web挖掘
[分類號(hào)]F713 TP393
1 引 言
電子商務(wù)最早于20世紀(jì)60年代初在美國(guó)等國(guó)家興起,但直到20世紀(jì)90年代隨著互聯(lián)網(wǎng)的高速發(fā)展,以互聯(lián)網(wǎng)為平臺(tái)和依托,電子商務(wù)才真正意義上發(fā)展起來(lái),正在或終將從根本上改變社會(huì)經(jīng)濟(jì)的運(yùn)行模式、商務(wù)活動(dòng)的運(yùn)作方式以及人們的消費(fèi)模式。它以電子交易為手段,借助計(jì)算機(jī)和網(wǎng)絡(luò)等技術(shù)快速而有效地完成商品和服務(wù)的買賣,實(shí)現(xiàn)商務(wù)活動(dòng)的數(shù)字化、網(wǎng)絡(luò)化、自動(dòng)化、智能化、無(wú)紙化和全球化,縮短商品流通時(shí)間、強(qiáng)化供需雙方聯(lián)系、減少費(fèi)用、拓展市場(chǎng)和提高服務(wù)質(zhì)量,達(dá)到樹(shù)立企業(yè)形象、增強(qiáng)企業(yè)競(jìng)爭(zhēng)力和提高經(jīng)濟(jì)效益的目的。據(jù)美國(guó)有關(guān)機(jī)構(gòu)預(yù)測(cè),Internet上的電子貿(mào)易額在2010年前后會(huì)持續(xù)猛增,最后相對(duì)穩(wěn)定在10000億美元左右。
然而,電子商務(wù)的健康、有序和迅速發(fā)展卻存在著一系列十分復(fù)雜而又亟待解決的問(wèn)題。除了要明確我國(guó)電子商務(wù)的發(fā)展戰(zhàn)略和運(yùn)行環(huán)境、政府在電子商務(wù)中的作用與職能、管理模式、可信賴機(jī)構(gòu)的作用、對(duì)傳統(tǒng)企業(yè)管理模式的變革、良好的信息和安全基礎(chǔ)設(shè)施之外,還要重點(diǎn)解決與發(fā)展與電子商務(wù)有關(guān)的科學(xué)和技術(shù)及其應(yīng)用問(wèn)題,例如電子商務(wù)環(huán)境下的數(shù)據(jù)挖掘。本文即是對(duì)電子商務(wù)與數(shù)據(jù)挖掘的契合方式、相關(guān)技術(shù)及其應(yīng)用、主要研究?jī)?nèi)容的系統(tǒng)論述。
2 數(shù)據(jù)挖掘與電子商務(wù)契合方式
數(shù)據(jù)挖掘起源于20世紀(jì)90年代中期,推動(dòng)其誕生、發(fā)展的眾多原因中,對(duì)商業(yè)數(shù)據(jù)背后潛在知識(shí)的迫切需求和人類分析信息的有限能力之間日益增加的矛盾是其根本動(dòng)因。利用數(shù)據(jù)挖掘研究電子商務(wù)產(chǎn)生的不確定性海量數(shù)據(jù)中信息的分布規(guī)律,挖掘其中隱含的關(guān)系、模式和趨勢(shì),進(jìn)而發(fā)現(xiàn)具有規(guī)律性的知識(shí),可以幫助企業(yè)優(yōu)化企業(yè)決策管理、客戶關(guān)系管理、協(xié)同商務(wù)管理、營(yíng)銷模式管理、網(wǎng)站維護(hù)管理和風(fēng)險(xiǎn)控制管理,確認(rèn)目標(biāo)市場(chǎng),獲得更大的競(jìng)爭(zhēng)優(yōu)勢(shì)。
要使上述數(shù)據(jù)挖掘的效果真正體現(xiàn)出來(lái),理論界和實(shí)務(wù)界認(rèn)為迫切需要研究和解決的問(wèn)題有:①什么樣的商務(wù)站點(diǎn)可以贏得更多用戶的青睞?賣方如何根據(jù)用戶的嗜好改進(jìn)自己的商務(wù)站點(diǎn),以吸引更多的潛在買方光臨?②賣方如何有效地利用商務(wù)站點(diǎn)展開(kāi)宣傳攻勢(shì)?③賣方如何充分利用用戶瀏覽產(chǎn)生的信息,更好地為潛在買方提供個(gè)性化服務(wù)?④賣方如何根據(jù)自己掌握的有關(guān)信息預(yù)測(cè)客戶需求趨勢(shì)和潛在客戶群體?⑤用戶如何在浩如沙海的虛擬市場(chǎng)中找到自己需要的商品?⑥如何才能提高客戶的滿意程度?如何才能知道哪些客戶是公司的主要利潤(rùn)來(lái)源?⑦如何防止或減少電子支付欺詐,以充分保障銀行和買賣雙方的利益不受損失?⑧競(jìng)爭(zhēng)對(duì)手和自己網(wǎng)絡(luò)營(yíng)銷上存在什么樣的區(qū)別?
本文從數(shù)據(jù)挖掘的角度,將與電子商務(wù)的契合方式抽象為如下論題:①論題1:Web頁(yè)面或資源聚分類研究;②論題2:客戶群聚分類研究;③論題3:頻繁訪問(wèn)路徑挖掘研究;④論題4:交易關(guān)聯(lián)性挖掘研究;⑤論題5:異?蛻襞c異常交易檢測(cè)研究;⑥論題6:互聯(lián)網(wǎng)下供應(yīng)鏈關(guān)系挖掘研究。下文將對(duì)這6個(gè)論題所涉及的主要技術(shù)及其應(yīng)用、主要研究?jī)?nèi)容進(jìn)行闡述。
3 電子商務(wù)環(huán)境下Web數(shù)據(jù)挖掘的主要技術(shù)評(píng)述
3.1 技術(shù)概述
電子商務(wù)產(chǎn)生的數(shù)據(jù)具備異構(gòu)、不確定性、無(wú)結(jié)構(gòu)或半結(jié)構(gòu)、動(dòng)態(tài)性和海量性等特點(diǎn),復(fù)雜程度已遠(yuǎn)遠(yuǎn)超出了人類目前已有的分析能力;赪eb的數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)挖掘有許多不同之處。上文所述論題的Web數(shù)據(jù)挖掘主要包括三種數(shù)據(jù)挖掘任務(wù):
3.1.1 對(duì)Web內(nèi)容的挖掘 互聯(lián)網(wǎng)電子商務(wù)數(shù)據(jù)呈指數(shù)形式飛速增長(zhǎng),然而當(dāng)用戶(無(wú)論買點(diǎn)、賣方或任何商業(yè)關(guān)聯(lián)方)面對(duì)整個(gè)Internet的海量數(shù)據(jù)時(shí),卻感覺(jué)很難找到對(duì)自己有用的商業(yè)數(shù)據(jù)。例如:當(dāng)買方在互聯(lián)網(wǎng)尋找適合自己的商品和服務(wù)、比較商品價(jià)格和交易條件時(shí),需要盡可能搜集此商品的相關(guān)Web頁(yè)面,即以商品作為Web頁(yè)面聚類或者分類的依據(jù),以此提高電子商務(wù)交易過(guò)程尤其是前期交易過(guò)程的效率。總的來(lái)說(shuō)為方便客戶,應(yīng)該為他們提供一步到位的查詢解決方案,Web頁(yè)面的自動(dòng)聚分類方法有助于壓縮搜索空間,加快檢索速度,提高查詢精度,幫助客戶快速找到相關(guān)信息。
3.1.2 對(duì)Web結(jié)構(gòu)的挖掘 Web頁(yè)面是半結(jié)構(gòu)化的,在Web頁(yè)面不僅有各種內(nèi)容信息,而且存在特定的結(jié)構(gòu)標(biāo)記,其中最重要的標(biāo)記就是超鏈接。Web頁(yè)面所包含的知識(shí)不僅存在于各個(gè)頁(yè)面的內(nèi)容中,也存在于頁(yè)面之間的相互鏈接中。
對(duì)于電子商務(wù)而言,一個(gè)重要的問(wèn)題是要找到對(duì)某個(gè)商業(yè)主題可以當(dāng)作核心信息源的一些網(wǎng)站和網(wǎng)頁(yè)。通過(guò)對(duì)Web電子商務(wù)進(jìn)行數(shù)據(jù)挖掘時(shí)理解和利用超文本鏈接結(jié)構(gòu),可以此核心信息源為基礎(chǔ),優(yōu)化供應(yīng)鏈和虛擬企業(yè)產(chǎn)生和運(yùn)作的效率,有助于網(wǎng)絡(luò)電子商務(wù)社區(qū)的發(fā)現(xiàn)和利用。
3.1.3 對(duì)Web訪問(wèn)的挖掘 對(duì)Web訪問(wèn)的挖掘是目前研究最深入的Web數(shù)據(jù)挖掘技術(shù)。在Internet電子商務(wù)中,電子時(shí)空下推拉互動(dòng)的雙向交互信息被記錄在Web服務(wù)器的日志文件中。Web日志一般可分為訪問(wèn)日志、代理日志和引用日志。
對(duì)于拓?fù)浣Y(jié)構(gòu)已知的特定商務(wù)站點(diǎn),盡管用戶在不同時(shí)期可能有不同的瀏覽模式,但就長(zhǎng)期而言用戶行為是有一定的規(guī)律及趨勢(shì)的。通過(guò)分析Web日志文件,可以發(fā)現(xiàn)其中蘊(yùn)涵的相似客戶群體、相關(guān)Web重要頁(yè)面和有關(guān)客戶訪問(wèn)模式。以頻繁訪問(wèn)路徑和相關(guān)Web重要頁(yè)面為依據(jù)優(yōu)化商務(wù)站點(diǎn)結(jié)構(gòu),實(shí)現(xiàn)網(wǎng)站自適應(yīng);以客戶分類為依據(jù)為客戶提供個(gè)性化服務(wù)(如電子商品推薦系統(tǒng)),以挖掘銷售數(shù)據(jù)發(fā)現(xiàn)交易關(guān)聯(lián)性為依據(jù)提高營(yíng)銷活動(dòng)效率和強(qiáng)化廣告宣傳效應(yīng)。這里部分理論是以市場(chǎng)營(yíng)銷學(xué)的市場(chǎng)細(xì)分原理為基礎(chǔ),基本假定是“消費(fèi)者過(guò)去的行為是其今后消費(fèi)傾向的最好說(shuō)明”。
3.2 具體評(píng)述
隨著互聯(lián)網(wǎng)的興起,數(shù)據(jù)挖掘技術(shù)已開(kāi)始運(yùn)用到Web信息系統(tǒng)產(chǎn)生的海量數(shù)據(jù)上,在客戶關(guān)系管理、金融工程、信用管理、風(fēng)險(xiǎn)預(yù)測(cè)、保險(xiǎn)等諸多領(lǐng)域均得到廣泛應(yīng)用。
電子商務(wù)環(huán)境下Web數(shù)據(jù)挖掘技術(shù)既包括基于統(tǒng)計(jì)學(xué)的各類方法,也包括涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、人工智能等理論方法,這其中又以規(guī)則歸納、神經(jīng)網(wǎng)絡(luò)、案例學(xué)習(xí)、遺傳算法、粗糙集等智能方法最為常見(jiàn)。但需指出目前電子商務(wù)環(huán)境下Web數(shù)據(jù)挖掘算法的研究尚處于起步階段,無(wú)論在Web電子商務(wù)數(shù)據(jù) 特點(diǎn)的挖掘算法上,還是挖掘結(jié)果的經(jīng)濟(jì)學(xué)與管理學(xué)解釋和挖掘結(jié)果的有效應(yīng)用方面,均尚未涉及或仍有很大研究余地。
3.2.1 Web內(nèi)容挖掘 文本是存儲(chǔ)和交換信息的最自然的方式,文本挖掘具有非常高的商業(yè)前景。事實(shí)上研究表明即使在企業(yè)的電子商務(wù)信息中,也有80%的信息保存在文本中,如電子郵件、網(wǎng)頁(yè)以及報(bào)告等。
目前Web內(nèi)容挖掘多數(shù)是基于文本挖掘算法的,和通常文本挖掘的功能和算法類似,適用于商務(wù)文本的挖掘算法還沒(méi)有較多的進(jìn)展。但由于互聯(lián)網(wǎng)上的數(shù)據(jù)基本上都是HTML或XML格式的文件數(shù)據(jù)流,因此可利用文檔中的HTML或XML標(biāo)記來(lái)提高Web內(nèi)容挖掘的性能。
但Web內(nèi)容的動(dòng)態(tài)更新、存儲(chǔ)方式的特殊性、Web商務(wù)數(shù)據(jù)以及文本數(shù)據(jù)本身的特點(diǎn)使得Web內(nèi)容挖掘在處理下面這些任務(wù)中遇到很大困難:①難于處理具有主觀、非精確、非確定的數(shù)據(jù)和檢索要求;②現(xiàn)有搜索引擎沒(méi)有歸納和演繹的能力;③軟決策,而不是布爾代數(shù)的決策方式;④網(wǎng)頁(yè)評(píng)價(jià),難以按照對(duì)于查詢的相關(guān)性對(duì)網(wǎng)頁(yè)進(jìn)行評(píng)價(jià);⑤個(gè)性化,對(duì)于電子商務(wù)而言個(gè)性化的要求是非常重要的,必須根據(jù)每個(gè)用戶歷史訪問(wèn)記錄等資料進(jìn)行相關(guān)挖掘;⑥互聯(lián)網(wǎng)上的數(shù)據(jù)基本上都是HTML或者XML格式的文件數(shù)據(jù)流,但利用文檔中的HTML或XML標(biāo)記來(lái)提高Web內(nèi)容挖掘性能的研究目前尚少見(jiàn)。
3.2.2 Web結(jié)構(gòu)挖掘 Web結(jié)構(gòu)挖掘是從www上的組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)知識(shí),由于超文本文檔間的關(guān)聯(lián)關(guān)系使得www不僅可以揭示文檔中所包含的信息,同時(shí)也可以揭示文檔問(wèn)的關(guān)聯(lián)關(guān)系所代表的信息。利用這些信息可對(duì)頁(yè)面進(jìn)行排序,發(fā)現(xiàn)重要的頁(yè)面。Page-Rank法就是利用了文檔間鏈接信息來(lái)查找相關(guān)的Web頁(yè),其基本思想是:一個(gè)頁(yè)面被多次引用,則這個(gè)頁(yè)面很可能是重要的;一個(gè)頁(yè)面盡管沒(méi)有被多次引用,但被一個(gè)重要頁(yè)面引用,該頁(yè)面也可能是很重要的。
此外,通過(guò)挖掘網(wǎng)站結(jié)構(gòu)和頁(yè)面結(jié)構(gòu),也可以對(duì)同一商業(yè)網(wǎng)站內(nèi)Web頁(yè)面進(jìn)行分類和聚類。對(duì)Web頁(yè)內(nèi)結(jié)構(gòu)的分析,相對(duì)于普通文本結(jié)構(gòu)分析,具備一些明顯不同的特征:通常沒(méi)有段落、句子等顯要區(qū)別、文本中文字屬性特征比較豐富、文本中標(biāo)題性文字較多;因此主要的分類方法為基于特征的分類方法。而對(duì)于事先不知道其網(wǎng)絡(luò)架構(gòu)的目標(biāo)網(wǎng)站,則應(yīng)當(dāng)運(yùn)用聚類方法,而主要的聚類方法為分裂分類法。
一些研究人員提出了一些模型化Web拓?fù)浣Y(jié)構(gòu)的算法,如HITS算法和上文所述PageRank算法等。HITS通過(guò)給鏈接結(jié)構(gòu)增加內(nèi)容信息,同時(shí)使用了外層過(guò)濾進(jìn)行改進(jìn)。這些算法主要用作計(jì)算每個(gè)網(wǎng)頁(yè)的質(zhì)量和相關(guān)性,并應(yīng)用到了Clover和Coogle等系統(tǒng)中。其他的一些應(yīng)用包括發(fā)現(xiàn)Web上的電子商務(wù)社區(qū)等。Madria討論了Web結(jié)構(gòu)挖掘在數(shù)據(jù)倉(cāng)庫(kù)中的應(yīng)用,包括度量同一服務(wù)器中局部鏈接的頻率,度量數(shù)據(jù)倉(cāng)庫(kù)中Web文檔的重復(fù),從而在特定鏈接的層次結(jié)構(gòu)中發(fā)現(xiàn)信息流對(duì)站點(diǎn)設(shè)計(jì)的影響等。
3.2.3 Web使用挖掘 Web服務(wù)器上的訪問(wèn)日志數(shù)據(jù)是Web使用挖掘的最重要的數(shù)據(jù)源,它明確地記錄了站點(diǎn)訪問(wèn)者的瀏覽行為信息,但須指出其是不完整的數(shù)據(jù),如緩存頁(yè)的訪問(wèn)就不被記錄在日志中,目前尚無(wú)有效的算法處理此數(shù)據(jù)不完整性;其次可通過(guò)使用遠(yuǎn)程主體或?qū)ΜF(xiàn)有瀏覽器代碼的修改來(lái)實(shí)現(xiàn)客戶端數(shù)據(jù)的收集;第三,代理日志,即Proxy數(shù)據(jù)作為客戶端瀏覽器和Web服務(wù)器間的中間層緩存,采用Proxy跟蹤可揭示從多個(gè)客戶到多個(gè)服務(wù)器的HTTP請(qǐng)求,可用作刻畫(huà)共享一個(gè)Proxy服務(wù)器的一組商業(yè)客戶瀏覽行為的數(shù)據(jù)源。
常見(jiàn)的基于Web使用挖掘的客戶聚分類算法包括基于模糊理論的客戶群體聚類算法、K-paths聚類算法、客戶群體聚類的hamming聚類算法等;此外商務(wù)站點(diǎn)的結(jié)構(gòu)類似有向圖,用戶的訪問(wèn)行為構(gòu)成其訪問(wèn)子圖,研究該有向子圖有利于發(fā)現(xiàn)用戶興趣所在。而對(duì)基于Web使用挖掘而言的網(wǎng)頁(yè)聚分類,其挖掘數(shù)據(jù)的依據(jù)是Web的使用記錄而不是Web網(wǎng)頁(yè)的內(nèi)容信息,其數(shù)據(jù)范圍一般局限在一個(gè)或少數(shù)網(wǎng)站,這主要是由于很難追蹤用戶完整的上網(wǎng)訪問(wèn)記錄;值得注意的是挖掘過(guò)程和Web內(nèi)容挖掘一樣常常需要一些商業(yè)背景或領(lǐng)域知識(shí)。
Web使用挖掘的實(shí)例包括兩類:學(xué)習(xí)用戶日志文件和用戶導(dǎo)航模式。商業(yè)信息的提供者希望通過(guò)改進(jìn)站點(diǎn)的設(shè)計(jì)和了解用戶的興趣和偏好,提供給用戶適合的信息。挖掘出的信息可以應(yīng)用到網(wǎng)頁(yè)個(gè)性化、站點(diǎn)修改、商業(yè)智能、信息檢索等領(lǐng)域中。
Perkowitz通過(guò)記錄用戶訪問(wèn)站點(diǎn)的記錄改善站點(diǎn)的設(shè)計(jì),幫助用戶更快地瀏覽商業(yè)站點(diǎn)。路徑遍歷模式挖掘則是另一種用戶導(dǎo)航模式,在分布環(huán)境下當(dāng)用戶尋找感興趣的信息時(shí),可以通過(guò)超鏈地址從一個(gè)對(duì)象遍歷到另一個(gè)對(duì)象;很明顯理解這種環(huán)境下的用戶訪問(wèn)模式不僅能提高系統(tǒng)的設(shè)計(jì)水平,還能促進(jìn)市場(chǎng)決策判斷(比如在適當(dāng)?shù)牡攸c(diǎn)放一個(gè)廣告)。
4 目前國(guó)內(nèi)外主要研究?jī)?nèi)容
4.1 Web頁(yè)面聚分類應(yīng)用研究
頁(yè)面聚分類挖掘結(jié)果在電子商務(wù)各環(huán)節(jié)的應(yīng)用問(wèn)題;以Web內(nèi)容挖掘?yàn)橹鹘Y(jié)合Web結(jié)構(gòu)挖掘和Web使用挖掘的多智能集成算法的Web頁(yè)面聚分類模型的研究;如何改進(jìn)文本聚分類挖掘算法以適合電子商務(wù)Web頁(yè)面聚分類。
4.2 客戶群聚分類應(yīng)用研究
客戶聚分類在電子商務(wù)各環(huán)節(jié)的應(yīng)用問(wèn)題,研究對(duì)營(yíng)銷機(jī)制的影響;以Web訪問(wèn)挖掘?yàn)橹鞯亩嘀悄芗伤惴ǖ木鄯诸惸P停浑娮由虅?wù)推薦系統(tǒng)的研制與開(kāi)發(fā)。
4.3 客戶頻繁訪問(wèn)路徑挖掘應(yīng)用研究
以客戶頻繁訪問(wèn)路徑挖掘結(jié)果為基礎(chǔ)分析用戶訪問(wèn)站點(diǎn)的規(guī)律、改進(jìn)網(wǎng)站的組織結(jié)構(gòu)及其性能,實(shí)現(xiàn)網(wǎng)站自適應(yīng);客戶頻繁訪問(wèn)路徑挖掘算法。
4.4 交易關(guān)聯(lián)性挖掘應(yīng)用研究
以交易關(guān)聯(lián)性挖掘結(jié)果為基礎(chǔ)研究對(duì)企業(yè)決策管理、協(xié)同商務(wù)管理、政府監(jiān)管等方面的應(yīng)用問(wèn)題,研究影響識(shí)別交易關(guān)聯(lián)性的關(guān)鍵或主要數(shù)據(jù)特征;基于多智能算法的交易關(guān)聯(lián)性挖掘模型。
4.5 異常客戶與異常交易檢測(cè)應(yīng)用研究
異常監(jiān)測(cè)在電子商務(wù)中的基本應(yīng)用框架,異常交易或者電子欺詐所具備的數(shù)據(jù)特征,異常交易或電子欺詐的識(shí)別算法。
4.6 互聯(lián)網(wǎng)下供應(yīng)鏈關(guān)系挖掘研究
互聯(lián)網(wǎng)下供應(yīng)鏈關(guān)系挖掘的研究范疇,電子供應(yīng)鏈和虛擬企業(yè)形成效率等的關(guān)系,電子供應(yīng)鏈關(guān)系挖掘的基本模型、算法和應(yīng)用,如何解釋和應(yīng)用電子供應(yīng)鏈挖掘結(jié)果以有效地優(yōu)化電子商務(wù)供應(yīng)鏈。
4.7 電子商務(wù)數(shù)據(jù)挖掘的解釋問(wèn)題
電子商務(wù)數(shù)據(jù)挖掘涉及管理學(xué)、經(jīng)濟(jì)學(xué)、計(jì)算機(jī)科學(xué)、智能科學(xué)、數(shù)學(xué)等多領(lǐng)域、跨學(xué)科的理論知識(shí),因此需研究Web數(shù)據(jù)挖掘結(jié)果的管理理論解釋問(wèn)題和經(jīng)濟(jì)理論解釋問(wèn)題中模型的建立機(jī)制、步驟和對(duì)挖掘結(jié)果和解釋理論本身的互動(dòng)影響;主要涉及管理學(xué)和經(jīng)濟(jì)學(xué)理論的選擇;解釋的立場(chǎng)問(wèn)題;挖掘所獲得新知識(shí)對(duì)解釋理論本身的修正問(wèn)題。
4.8 商務(wù)數(shù)據(jù)挖掘過(guò)程改進(jìn)
商務(wù)數(shù)據(jù)挖掘須啟動(dòng)過(guò)程改進(jìn),當(dāng)前國(guó)內(nèi)外無(wú)成熟的商務(wù)數(shù)據(jù)挖掘的過(guò)程研究。研究商務(wù)數(shù)據(jù)挖掘或商務(wù)智能項(xiàng)目實(shí)施過(guò)程,定義企業(yè)在該領(lǐng)域的標(biāo)準(zhǔn)過(guò)程,研究如何通過(guò)企業(yè)過(guò)程的改進(jìn)不斷提高ERP等商業(yè)數(shù)據(jù)系統(tǒng)的應(yīng)用價(jià)值。
4.9 電子商務(wù)數(shù)據(jù)集特征識(shí)別
必須在Web挖掘算法的挖掘前、挖掘中、挖掘后各階段充分考慮電子商務(wù)數(shù)據(jù)集所獨(dú)有的、區(qū)別于一般數(shù)據(jù)集的特征;根據(jù)識(shí)別出的商務(wù)數(shù)據(jù)特征設(shè)計(jì)新的數(shù)據(jù)挖掘算法或?qū)υ瓟?shù)據(jù)挖掘算法進(jìn)行改進(jìn)和優(yōu)化,即特征結(jié)合問(wèn)題。
相關(guān)熱詞搜索:契合 數(shù)據(jù)挖掘 電子商務(wù) 論數(shù)據(jù)挖掘與電子商務(wù)的契合 數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用 數(shù)據(jù)挖掘與電子商務(wù)
熱點(diǎn)文章閱讀