靈感範文站

位置:首頁 > 論文 > 論文精選

數據挖掘論文的參考文獻新版多篇

數據挖掘論文的參考文獻新版多篇

數據挖掘論文 篇一

摘要:主要通過對數據挖掘技術的探討,對職教多年累積的教學數據運用分類、決策樹、關聯規則等技術進行分析,從分析的結果中發現有價值的數據模式,科學合理地實現教學評估,讓教學管理者能夠從中發現教學活動中存在的主要問題以便及時改進,進而輔助管理者決策做好教學管理。

關鍵詞:教學評估;數據挖掘;教學評估體系;層次分析法

1概述

近年來國家對中等職業教育的發展高度重視,在政策扶持與職教工作者的努力下,職業教育獲得了蓬勃的發展。如何提高教學質量、培養合格的高技術人才成爲職教工作者研究的課題。各種調查研究結果表明:加強師資隊伍的建設,強化教師教學評估對教學質量的提高尤爲重要。

所謂教學評估,就是運用系統科學的方法對教學活動或教育行爲的價值、效果作出科學的判斷過程。教學評估方式要靈活多樣,要多途徑、多方位、多形式的發揮評估的導學作用,以鼓勵評估爲主,充分發揮評估的激勵功能,促進教學的健康發展。

在中等職業學校多年的教育教學工作中積累了大量的教務管理數據、教師檔案數據等,怎樣從龐雜大量的數據中挖掘出有效提高教學質量的關鍵因素是個難題。數據挖掘技術卻可以從人工智能的角度很好地解決這一課題。通過數據挖掘技術,得到隱藏在教學數據背後的有用信息,在一定程度上爲教學部門提供決策支持信息促使更好地開展教學工作,提高教學質量和教學管理水平,使之能在功能上更加清晰地認識教師教與學生學的關係及促進教育教學改革。

2數據挖掘技術

2.1數據挖掘的含義

數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數據挖掘應該更正確地命名爲“從數據中挖掘知識”。即數據挖掘是對巨大的數據集進行尋找和分析的計算機輔助處理過程,在這一過程中顯現先前未曾發現的模式,然後從這些數據中發掘某些內涵信息,包括描述過去和預測未來趨勢的信息。人工智能領域習慣稱知識發現,而數據庫領域習慣將其稱爲數據挖掘。

2.2數據挖掘的基本過程

數據挖掘過程包括對問題的理解和提出、數據收集、數據處理、數據變換、數據挖掘、模式評估、知識表示等過程,以上的過程不是一次完成的,其中某些步驟或者全過程可能要反覆進行。對問題的理解和提出在開始數據挖掘之前,最基礎的工作就是理解數據和實際的業務問題,在這個基礎之上提出問題,對目標作出明確的定義。

2.3數據挖掘常用的算法

2.3.1分類分析方法:是通過分析訓練集中的數據,爲每個類別做出準確的描述或建立分析模型或挖掘出分類規則,以便以後利用這個分類規則對其它數據庫中的記錄進行分類的方法。2.3.2決策樹算法:是一種常用於分類、預測模型的算法,它通過將大量數據有目的的分類,從而找到一些有價值的、潛在的信息。它的主要優點是描述簡單,分類速度快,特別適合大規模的數據處理。2.3.3聚類算法:聚類分析處理的數據對象的類是未知的。聚類分析就是將對象集合分組爲由類似的對象組成的多個簇的過程。在同一個簇內的對象之間具有較高的相似度,而不同簇內的對象差別較大。2.3.4關聯規則算法:側重於確定數據中不同領域之間的關係,即尋找給定數據集中的有趣聯繫。提取描述數據庫中數據項之間所存在的潛在關係的規則,找出滿足給定支持度和置信度閾值的多個域之間的依賴關係。

在以上各種算法的研究中,比較有影響的是關聯規則算法。

3教學評估體系

評價指標體系是教學評估的基礎和依據,對評估起着導向作用,因此制定一個科學全面的評價指標體系就成爲改革、完善評價的首要目標。評價指標應以指導教學實踐爲目的,通過評價使教師明確教學過程中應該肯定的和需要改進的地方;以及給出設計評價指標的導向問題。

3.1教學評估體系的構建方法

層次分析法(簡稱AHP法)是美國運籌學家T·L·Saaty教授在20世紀70年代初期提出的一種簡便、靈活而又實用的多準則決策的系統分析方法,其原理是把一個複雜問題分解、轉化爲定量分析的方法。它需要建立關於系統屬性的各因素多級遞階結構,然後對每一層次上的因素逐一進行比較,得到判斷矩陣,通過計算判斷矩陣的特徵值和特徵向量,得到其關於上一層因素的相對權重,並可自上而下地用上一層次因素的相對權重加權求和,求出各層次因素關於系統整體屬性(總目標層)的綜合重要度。

3.2構建教學評估指標體系的作用

3.2.1構建的教學評估指標,作爲挖掘庫選擇教學信息屬性的依據。

3.2.2通過AHP方法,能篩選出用來評價教學質量的相關重要屬性,從而入選爲挖掘庫字段,這樣就減去了挖掘庫中對於挖掘目標來說影響較小的屬性,進而大大減少了挖掘的工作量,提高挖掘效率。3.2.3通過構建教學評估指標,減少了挖掘對象的字段,從而避免因挖掘字段過多,導致建立的決策樹過大,出現過度擬合挖掘對象,進而造成挖掘規則不具有很好的評價效果的現象。3.2.4提高教學質量評估實施工作的效率。

4數據挖掘在教學評估中的應用

4.1學習效果評價學習評價是教育工作者的重要職責之一。評價學生的學習情況,既對學生起到信息反饋和激發學習動機的作用,又是檢查課程計劃、教學程序以至教學目的的手段,也是考查學生個別差異、便於因材施教的途徑。評價要遵循“評價內容要全面、評價方式要多元化、評價次數要多次化,注重自評與互評的有機結合”的原則。利用數據挖掘工具,對教師業務檔案數據庫、行爲記錄數據庫、獎勵處罰數據庫等進行分析處理,可以即時得到教師教學的評價結果,對教學過程出現的問題進行及時指正。

另外,這種系統還能夠克服教師主觀評價的不公正、不客觀的弱點,減輕教師的工作量。

4.2課堂教學評價

課堂教學評價不僅對教學起着調節、控制、指導和推動作用,而且有很強的導向性,是學校教學管理的重要組成部分,是評價教學工作成績的主要手段。實現對任課教師及教學組織工作效果做出評價,但是更重要的目的是總結優秀的教學經驗,爲教學質量的穩定提高制定科學的規範。學校每學期都要搞課堂教學評價調查,積累了大量的數據。利用數據挖掘技術,從教學評價數據中進行數據挖掘,將關聯規則應用於教師教學評估系統中,探討教學效果的好壞與老師的年齡、職稱、學歷之間的聯繫;確定教師的教學內容的範圍和深度是否合適,選擇的教學媒體是否適合所選的教學內容和教學對象;講解的時間是否恰到好處;教學策略是否得當等。從而可以及時地將挖掘出的規則信息反饋給教師。管理部門據此能合理配置班級的上課教師,使學生能夠較好地保持良好的學習態度,從而爲教學部門提供了決策支持信息,促使教學工作更好地開展。

結束語

數據挖掘作爲一種工具,其技術日趨成熟,在許多領域取得了廣泛的應用。在教育領域裏,隨着數據的不斷累積,把數據挖掘技術應用到教學評價系統中,讓領導者能夠從中發現教師教學活動中的主要問題,以便及時改進,進而輔助領導決策做好學校管理,提高學校管理能力和水平,同時通過建立有效的教學激勵機制來達到提高教學質量的目的。這一研究對發展中的職業教育教學管理提出了很好的建議,爲教學管理工作的計算機輔助決策增添了新的內容。將數據挖掘技術應用於中職教學評估,設計開發一套行之有效的課堂教學評價系統,是下一步要做的工作,必將有力推動職業教育的快速發展。

數據挖掘論文 篇二

1理論研究

1.1客戶關係管理

客戶關係管理的目標是依靠高效優質的服務吸引客戶,同時通過對業務流程的全面優化和管理,控制企業運行成本。客戶關係管理是一種管理理念,將企業客戶視作企業發展最重要的企業資源,採用企業服務優化等手段來管理客戶關係。客戶關係管理並不是單純的信息技術或者管理技術,而是一種企業生物戰略,通過對企業客戶的分段充足,強化客戶滿意的行爲,優化企業可盈利性,將客戶處理工作上升到企業級別,不同部門負責與客戶進行交互,但是整個企業都需要向客戶負責,在信息技術的支持下實現企業和客戶連接環節的自動化管理。

1.2客戶細分

客戶細分由美國學者溫德爾史密斯在20世紀50年代提出,認爲客戶細分是根據客戶屬性將客戶分成集合。現代營銷學中的客戶細分是按照客戶特徵和共性將客戶羣分爲不同等級或者子羣體,尋找相同要素,對不同類別客戶心理與需求急性研究和評估,從而指導進行企業服務資源的分配,是企業獲得客戶價值的一種理論與方法。因此我們注意到,客戶細分其實是一個分類問題,但是卻有着顯著的特點。

1.2.1客戶細分是動態的企業不斷髮展變化,用戶數據不斷積累,市場因素的變化,都會造成客戶細分的變化。所以客戶細分工作需要根據客戶情況的變化進行動態調整,

減少錯誤分類,提高多次細分中至少有一次是正確分類的可能性。

1.2.2受衆多因素影響

隨着時間的推移,客戶行爲和心理會發生變化,所以不同時間的數據會反映出不同的規律,客戶細分方法需要在變化過程中準確掌握客戶行爲的規律性。

1.2.3客戶細分有不同的分類標準

一般分類問題強調準確性,客戶關係管理則強調有用性,講求在特定限制條件下實現特定目標。

1.3數據挖掘

數據挖掘就是從大型數據庫數據中提取有價值的、隱含的、事前未知的潛在有用信息。數據挖掘技術不斷髮展,挖掘對象不再是單一數據庫,已經逐漸發展到文件系統、數據集合以及數據倉庫的挖掘分析。

2客戶細分的數據挖掘

2.1邏輯模型

客戶數據中有着若干離散客戶屬性和連續客戶屬性,每個客戶屬性爲一個維度,客戶作爲空間點,全部客戶都能夠形成多爲空間,作爲客戶的屬性空間,假設A={A1,A2,…Am}是一組客戶屬性,屬性可以是連續的,也可以離散型,這些屬性就形成了客戶m維屬性空間。同時設g是一個描述客戶屬性的一個指標,f(g)是符合該指標的客戶集合,即爲概率外延,則任一確定時刻都是n個互不相交集合。在客戶價值概念維度上,可分爲“有價值客戶”“潛在價值客戶”“無價值客戶”三種類型,定義RB如下:(1)顯然RB是一個等價關係,經RB可分類屬性空間爲若干等價類,每個等價類都是一個概念類,建立客戶細分,就是客戶屬性空間和概念空間映射關係的建立過程。

2.2客戶細分數據挖掘實施

通過數據庫已知概念類客戶數據進行樣本學習和數據挖掘,進行客戶屬性空間與概念空間映射的自動歸納。首先確定一組概念類已知客戶集合。首先確定一個映射:p:C→L,使,如果,則。,求p(c)確定所屬概念類。數據部分有客戶數據存儲和概念維數據構成,客戶數據存儲有企業全部內在屬性、外在屬性以及行爲屬性等數據,方法則主要有關聯規則分析、深井網絡分類、決策樹、實例學習等數據挖掘方法,通過對客戶數據存儲數據學習算法來建立客戶數據和概念維之間的映射關係。

2.3客戶細分數據分析

建立客戶動態行爲描述模型,滿足客戶行爲非確定性和非一致性要求,客戶中心的管理體制下,客戶細分影響企業戰術和戰略級別決策的生成,所以數據挖掘要能夠彌補傳統數據分析方法在可靠性方面的缺陷。

2.3.1客戶外在屬性

外在屬性有客戶地理分佈、客戶組織歸屬情況和客戶產品擁有情況等。客戶的組織歸屬是客戶社會組織類型,客戶產品擁有情況是客戶是否擁有或者擁有哪些與其他企業或者其他企業相關產品。

2.3.2內在屬性

內在屬性有人口因素和心理因素等,人口因素是消費者市場細分的重要變量。相比其他變量,人口因素更加容易測量。心理因素則主要有客戶愛好、性格、信用情況以及價值取向等因素。

2.3.3消費行爲

消費行爲屬性則重點關注客戶購買前對產品的瞭解情況,是客戶細分中最客觀和重要的因素。

2.4數據挖掘算法

2.4.1聚類算法

按照客戶價值標記聚類結果,通過分類功能,建立客戶特徵模型,準確描述高價值客戶的一些特有特徵,使得企業在之後的市場活動中能夠迅速發現並抓住類似的高價值客戶,全面提高客戶的整體價值水平。通常都採用中心算法進行客戶的聚類分析,分析涉及的字段主要有客戶的基本信息以及與客戶相關業務信息,企業採用中心算法,按照企業自身的行業性質以及商務環境,選擇不同的聚類分析策略,有主屬性聚類分析和全屬性聚類分析兩類。主屬性聚類分析是企業根據在企業標度變量中選擇主要弧形作爲聚類分析變量。通常區間標度變量選用的度量單位會對聚類分析結果產生很大影響,選擇的度量單位越小,就會獲得越大的可能值域,對聚類結果的影響也就越大。

2.4.2客戶分析預測

行業競爭愈加激烈,新客戶的獲得成本越來越高,在保持原有工作價值的同時,客戶的流失也受到了企業的重視。爲了控制客戶流失,就需要對流失客戶的數據進行認真分析,找尋流失客戶的根本原因,防止客戶的持續流失。數據挖掘聚類功能同樣能夠利用在客戶流失數據分析工作中,建立基於流失客戶數據樣本庫的分類函數以及分類模式,通過模型分析客戶流失因素,能夠獲得一個最有可能流失的客戶羣體,同時編制一個有針對性的挽留方案。之後對數據進行分析並利用各種數據挖掘技術和方法在多個可供選擇的模型中找出最佳模型。初始階段,模型的擬合程度可能不理想,但是隨着模型的不斷更換和優化,最終就有可能找出合適的模型進行數據描述並挖掘出流失數據規律。通常模擬模型都通過數據分析專業和業務專家協作完成,採用決策樹、貝葉斯網絡、神經網絡等流失分析模型,實現客戶行爲的預測分析。

3結語

從工業營銷中的客戶細分觀點出發,在數據挖掘、客戶關係管理等理論基礎上,採用統計學、運籌學和數據挖掘技術,對客戶細分的數據挖掘方法進行了研究,建立了基於決策樹的客戶細分模型,是一種效率很高的管理工具。

作者:區嘉良 呂淑儀 單位:中國石化廣東石油分公司

數據挖掘論文 篇三

摘要:數據挖掘是一種特殊的數據分析過程,其不僅在功能上具有多樣性,同時還具有着自動化、智能化處理以及抽象化分析判斷的特點,對於計算機犯罪案件中的信息取證有着非常大的幫助。本文結合數據挖掘技術的概念與功能,對其在計算機犯罪取證中的應用進行了分析。

關鍵詞:數據挖掘技術;計算機;犯罪取證

隨着信息技術與互聯網的不斷普及,計算機犯罪案件變得越來越多,同時由於計算機犯罪的隱蔽性、複雜性特點,案件偵破工作也具有着相當的難度,而數據挖掘技術不僅能夠對計算機犯罪案件中的原始數據進行分析並提取出有效信息,同時還能夠實現與其他案件的對比,而這些對於計算機犯罪案件的偵破都是十分有利的。

1數據挖掘技術的功能與應用分析

1.1數據挖掘技術的概念

數據挖掘技術是針對當前信息時代下海量的網絡數據信息而言的,簡單來說,就是從大量的、不完全的、有噪聲的、模糊的隨機數據中對潛在的有效知識進行自動提取,從而爲判斷決策提供有利的信息支持。同時,從數據挖掘所能夠的得到的知識來看,主要可以分爲廣義型知識、分類型知識、關聯性知識、預測性知識以及離型知識幾種。

1.2數據挖掘技術的功能

根據數據挖掘技術所能夠提取的不同類型知識,數據挖掘技術也可以在此基礎上進行功能分類,如關聯分析、聚類分析、孤立點分析、時間序列分析以及分類預測等都是數據挖掘技術的重要功能之一,而其中又以關聯分析與分類預測最爲主要。大量的數據中存在着多個項集,各個項集之間的取值往往存在着一定的規律性,而關聯分析則正是利用這一點,對各項集之間的關聯關係進行挖掘,找到數據間隱藏的關聯網,主要算法有FP-Growth算法、Apriori算法等。在計算機犯罪取證中,可以先對犯罪案件中的特徵與行爲進行深度的挖掘,從而明確其中所存在的聯繫,同時,在獲得審計數據後,就可以對其中的審計信息進行整理並中存入到數據庫中進行再次分析,從而達到案件樹立的效果,這樣,就能夠清晰的判斷出案件中的行爲是否具有犯罪特徵[1]。而分類分析則是對現有數據進行分類整理,以明確所獲得數據中的相關性的一種數據挖掘功能。在分類分析的過程中,已知數據會被分爲不同的數據組,並按照具體的數據屬性進行明確分類,之後再通過對分組中數據屬性的具體分析,最終就可以得到數據屬性模型。在計算機犯罪案件中,可以將按照這種數據分類、分析的方法得到案件的數據屬性模型,之後將這一數據屬性模型與其他案件的數據屬性模型進行對比,這樣就能夠判斷嫌疑人是否在作案動機、發生規律以及具體特徵等方面與其他案件模型相符,也就是說,一旦這一案件的數據模型屬性與其他案件的數據模型屬性大多相符,那麼這些數據就可以被確定爲犯罪證據。此外,在不同案件間的共性與差異的基礎上,分類分析還可以實現對於未知數據信息或類似數據信息的有效預測,這對於計算機犯罪案件的處理也是很有幫助的。此外,數據挖掘分類預測功能的實現主要依賴決策樹、支持向量機、VSM、Logisitic迴歸、樸素貝葉斯等幾種,這些算法各有優劣,在實際應用中需要根據案件的實際情況進行選擇,例如支持向量機具有很高的分類正確率,因此適合用於特徵爲線性不可分的案件,而決策樹更容易理解與解釋。

2數據挖掘技術在計算機犯罪取證中的具體應用思路

對於數據挖掘技術,目前的計算機犯罪取證工作並未形成一個明確而統一的應用步驟,因此,我們可以根據數據挖掘技術的特徵與具體功能,對數據挖掘技術在計算機犯罪取證中的應用提供一個較爲可行的具體思路[2]。首先,當案件發生後,一般能夠獲取到海量的原始數據,面對這些數據,可以利用FP-Growth算法、Apriori算法等算法進行關聯分析,找到案件相關的潛在有用信息,如犯罪嫌疑人的犯罪動機、案發時間、作案嫌疑人的基本信息等等。在獲取這些基本信息後,雖然能夠對案件的基本特徵有一定的瞭解,但犯罪嫌疑人卻難以通過這些簡單的信息進行確定,因此還需利用決策樹、支持向量機等算法進行分類預測分析,通過對原始信息的準確分類,可以得到案件的犯罪行爲模式(數據屬性模型),而通過與其他案件犯罪行爲模式的對比,就能夠對犯罪嫌疑人的具體特徵進行進一步的預測,如經常活動的場所、行爲習慣、分佈區域等,從而縮小犯罪嫌疑人的鎖定範圍,爲案件偵破工作帶來巨大幫助。此外,在計算機犯罪案件處理完畢後,所建立的嫌疑人犯罪行爲模式以及通過關聯分析、分類預測分析得到的案件信息仍具有着很高的利用價值,因此不僅需要將這些信息存入到專門的數據庫中,同時還要根據案件的結果對數據進行再次分析與修正,並做好犯罪行爲模式的分類與標記工作,爲之後的案件偵破工作提供更加豐富、詳細的數據參考。

3結束語

總而言之,數據挖掘技術自計算機犯罪取證中的應用是藉助以各種算法爲基礎的關聯、分類預測功能來實現的,而隨着技術的不斷提升以及數據庫中的犯罪行爲模式會不斷得到完善,在未來數據挖掘技術所能夠起到的作用也必將越來越大。

參考文獻

[1]李豔花。數據挖掘在計算機動態取證技術中的應用[J]。信息與電腦(理論版),20xx(02):174-176.

作者:周永傑 單位:河南警察學院信息安全系

數據挖掘論文 篇四

1數據挖掘技術和過程

1.1數據挖掘技術概述

發現的是用戶感興趣的知識;發現的知識應當能夠被接受、理解和運用。也就是發現全部相對的知識,是具有特定前提與條件,面向既定領域的,同時還容易被用戶接受。數據挖掘屬於一種新型的商業信息處理技術,其特點爲抽取、轉化、分析商業數據庫中的大規模業務數據,從中獲得有價值的商業數據。簡單來說,其實數據挖掘是一種對數據進行深入分析的方法。因此,可以描述數據挖掘爲:根據企業設定的工作目標,探索與分析企業大量數據,充分揭示隱藏的、未知的規律性,並且將其轉變爲科學的方法。數據挖掘發現的最常見知識包括:

1.1.1廣義知識體現相同事物共同性質的知識,是指類別特點的概括描述知識。按照數據的微觀特點對其表徵的、具有普遍性的、極高概念層次的知識積極發現,是對數據的高度精煉與抽象。發現廣義知識的方法與技術有很多,例如數據立方體和歸約等。

1.1.2關聯知識體現一個事件與其他事件之間形成的關聯知識。假如兩項或者更多項之間形成關聯,則其中一項的屬性數值就能夠藉助其他屬性數值實行預測。

1.1.3分類知識體現相同事物共同特點的屬性知識與不同事物之間差異特點知識。

1.2數據挖掘過程

1.2.1明確業務對象對業務問題清楚定義,瞭解數據挖掘的第一步是數據挖掘目的。挖掘結果是無法預測的,但是研究的問題是可預見的,僅爲了數據挖掘而數據挖掘一般會體現出盲目性,通常也不會獲得成功。基於用戶特徵的電子商務數據挖掘研究劉芬(惠州商貿旅遊高級職業技術學校,廣東惠州516025)摘要:隨着互聯網的出現,全球範圍內電子商務正在迅速普及與發展,在這樣的環境下,電子商務數據挖掘技術應運而生。電子商務數據挖掘技術是近幾年來數據挖掘領域中的研究熱點,基於用戶特徵的電子商務數據挖掘技術研究將會解決大量現實問題,爲企業確定目標市場、完善決策、獲得最大競爭優勢,其應用前景廣闊,促使電子商務企業更具有競爭力。主要分析了電子商務內容、數據挖掘技術和過程、用戶細分理論,以及基於用戶特徵的電子商務數據挖掘。

1.2.2數據準備第一選擇數據:是按照用戶的挖掘目標,對全部業務內外部數據信息積極搜索,從數據源中獲取和挖掘有關數據。第二預處理數據:加工選取的數據,具體對數據的完整性和一致性積極檢查,並且處理數據中的噪音,找出計算機丟失的數據,清除重複記錄,轉化數據類型等。假如數據倉庫是數據挖掘的對象,則在產生數據庫過程中已經形成了數據預處理。

1.2.3變換數據轉換數據爲一個分析模型。這一分析模型是相對於挖掘算法構建的。構建一個與挖掘算法適合的分析模型是數據挖掘獲得成功的重點。可以利用投影數據庫的相關操作對數據維度有效降低,進一步減少數據挖掘過程中數據量,提升挖掘算法效率。

1.2.4挖掘數據挖掘獲得的經濟轉化的數據。除了對選擇科學挖掘算法積極完善之外,其餘全部工作都自行完成。整體挖掘過程都是相互的,也就是用戶對某些挖掘參數能夠積極控制。

1.2.5評價挖掘結果這個過程劃分爲兩個步驟:表達結果和評價結果。第一表達結果:用戶能夠理解數據挖掘得到的模式,可以通過可視化數據促使用戶對挖掘結果積極理解。第二評價結果:用戶與機器對數據挖掘獲得的模式有效評價,對冗餘或者無關的模式及時刪除。假如用戶不滿意挖掘模式,可以重新挑選數據和挖掘算法對挖掘過程科學執行,直到獲得用戶滿意爲止。

2用戶細分理論

用戶細分是指按照不同用戶的屬性劃分用戶集合。目前學術界和企業界一般接受的是基於用戶價值的細分理論,其不僅包含了用戶爲企業貢獻歷史利潤,還包含未來利潤,也就是在未來用戶爲企業可能帶來的利潤總和。基於用戶價值的細分理論選擇客戶當前價值與客戶潛在價值兩個因素評價用戶。用戶當前價值是指截止到目前用戶對企業貢獻的總體價值;用戶潛在價值是指未來用戶可能爲企業創造的價值總和。每個因素還能夠劃分爲兩個高低檔次,進一步產生一個二維的矩陣,把用戶劃分爲4組,價值用戶、次價值用戶、潛在價值用戶、低價值用戶。企業在推廣過程中根據不同用戶應當形成對應的方法,投入不同的資源。很明顯對於企業來說價值用戶最重要,被認爲是企業的玉質用戶;其次是次價值用戶,被認爲是金質用戶,雖然數量有限,卻爲企業創造了絕大部分的利潤;其他則是低價值用戶,對企業來說價值最小,成爲鉛質用戶,另外一類則是潛在價值用戶。雖然這兩類用戶擁有較多的數量,但是爲企業創造的價值有限,甚至很小。需要我們注意的是潛在價值用戶利用再造用戶關係,將來極有可能變成價值用戶。從長期分析,潛在價值用戶可以是企業的隱形財富,是企業獲得利潤的基礎。將採用數據挖掘方法對這4類用戶特點有效挖掘。

3電子商務數據挖掘分析

3.1設計問卷

研究的關鍵是電子商務用戶特徵的數據挖掘,具體包含了價值用戶特徵、次價值用戶特徵、潛在價值用戶特徵,對電子商務用戶的認知度、用戶的需求度分析。問卷內容包括3部分:其一是爲被調查者介紹電子商務的概念與背景;其二是具體調查被調查對象的個人信息,包含了性別、年齡、學歷、感情情況、職業、工作、生活地點、收入、上網購物經歷;其三是問卷主要部分,是對用戶對電子商務的瞭解、需求、使用情況的指標設計。

3.2調查方式

本次調查的問卷主體是電腦上網的人羣,採用隨機抽象的方式進行網上訪問。一方面採用大衆聊天工具,利用電子郵件和留言的方式發放問卷,另一方面在大衆論壇上邀請其填寫問卷。

3.3數據挖掘和結果

(1)選擇數據挖掘的算法利用Clementine數據挖掘軟件,採用C5.O算法挖掘預處理之後數據。

(2)用戶數據分析

1)電子商務用戶認知度分析按照調查問卷的問題“您知道電子商務嗎?”得到對電子商務用戶認知情況的統計,十分了解20.4%,瞭解30.1%,聽過但不瞭解具體使用方法40.3%,從未聽過8.9%。很多人僅聽過電子商務,但是並不清楚具體的功能與應用方法,甚至有一小部分人沒有聽過電子商務。對調查問卷問題“您聽過電子商務的渠道是什麼?”,大部分用戶是利用網瞭解電子商務的,佔40.2%;僅有76人是利用紙質報刊雜誌上知道電子商務的並且對其進行應用;這也表明相較於網絡宣傳紙質媒體推廣電子商務的方法缺乏有效性。

2)電子商務用戶需求用戶希求具體是指使用產品服務人員對應用產品或服務形成的需求或者期望。按照問題“假如你曾經使用電子商務,你覺得其用途怎樣,假如沒有使用過,你覺得其對自己有用嗎?”得到了認爲需要和十分需要的數據,覺得電子商務有用的用戶爲40.7%,不清楚是否對自己有用的用戶爲56.7%,認爲不需要的僅有2.4%。

3)電子商務用戶應用意願應用意願是指消費者對某一產品服務進行應用或者購買的一種心理慾望。按照問題“假如可以滿足你所關心的因素,未來你會繼續應用電子商務嗎?”獲得的數據可知,在滿足各種因素時,將來一年之內會應用電子商務的用戶爲78.2%,一定不會應用電子商務的用戶爲1.4%。表明用戶形成了較爲強烈的應用電子商務慾望,電子商務發展前景很好。基於用戶特徵的電子商務數據研究,電子商務企業通過這一結果能夠更好地實行營銷和推廣,對潛在用戶積極定位,提高用戶體驗,積極挖掘用戶價值。分析爲企業準確營銷和推廣企業提供了一個有效的借鑑。

4結語

互聯網中數據是最寶貴的資源之一,大量數據中包含了很大的潛在價值,對這些數據深入挖掘對互聯網商務、企業推廣、傳播信息發揮了巨大的作用。近些年來,數據挖掘技術獲得了信息產業的極大重視,具體原因是出現了大量的數據,能夠廣泛應用,並且需要轉化數據成爲有價值的信息知識。通過基於用戶特徵的電子商務數據挖掘研究,促使電子商務獲得巨大發展機會,發現潛在用戶,促使電子商務企業精準營銷。