
1 引 言
隨著生活水平的提高,汽車正逐步走進千家萬戶,我國已成為一個巨大的汽車市場,在這個市場上充斥著國產自主車型、進口車型以及合資車型。國產自主車型的優勢在于價格低廉,但品質欠佳;進口車型的優勢在于品質優良,但價格昂貴;合資車型介于兩者之間,價格和質量略高于國產自主車型,低于進口車型。目前這3種車型在中國市場各占有一定的比例。但是隨著居民收入水平的不斷提高,對汽車品質的要求也越來越高,國產自主車型只靠低廉的價格來占領汽車市場的空間越來越小,特別是許多合資車的價格也在下降,已經和一些同級別的國產自主車型的價格不相上下。因此,如何才能提高國產自主車型的質量和品質,使國產自主車型不但價格低廉而且品質過硬,是國產汽車生產商要考慮的問題。只有依靠先進的設計理念、優良的品質、可靠的性能才能占領中國的汽車市場,并向國外市場發展,才能使國產自主車型發展為國內甚至國際知名品牌。
新車投產后,可能會存在這樣那樣的一些問題,有些是設計缺陷,有些是工藝問題或者是技術方面的不足。這些問題隨著投產后用戶的使用逐步暴露出來,對于汽車生產商來說,只有逐步對暴露的問題進行解決,并不斷總結經驗,才能使汽車質量不斷提高。
數據挖掘(Data Mining)技術出現于20世紀80年代末,最早是在數據庫領域發展起來的。數據挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在的有用信息和知識的過程[1]。因此,在運用數據挖掘技術對汽車進行改進時,首先要獲取大量相關的數據信息。
2 數據庫的構建與數據采集
數據庫是數據挖掘的基礎,汽車的改進與新車的研發首先要有大量的數據支持,因此首先要建立合理的數據庫。
2.1 數據庫的構建
對于某一款車型,汽車數據庫的構建可以分為兩種形式:第一種是以汽車的組成零部件為對象進行構建;第二種是以所售車輛為對象進行構建。這兩種構建方式各有優勢,下面分別進行介紹。
以汽車的組成零部件為對象進行構建數據庫,根據每一對象可能出現問題的情況不同,對每一部件進行分析,對其可能出現的問題進行預想,并將此部件可能出現的問題作為此部件的對象屬性。另外,考慮到預想以外的情況也有可能出現,因此,對于每一個對象的屬性都是可以擴展的,當4S店采集到預想問題以外的情況時,將這一問題作為新的屬性添加到這一對象中。如對一款新車A建立數據庫,以車型A作為一個新類,將汽車的重要組成部分,如外形、底盤、發動機、變速箱等作為將對象。對于每一對象可能出現的問題進行預想,如底盤方面,某處漏油、異響等作為屬性建立數據庫。4S店根據進店車輛的維修保養情況以及車主反映某方面的問題對數據進行錄入。由于人員素質不同,因此數據庫的錄入工作不能太復雜,最好采用選擇的形式。對于某一數據,如果對象屬性中沒有此選項,則由工作人員負責添加,添加之后的項作為一項新的屬性,其他數據采集點的人員再碰到此問題便可以對其進行選擇。
以銷售的汽車為單位購建數據庫。一款新車投放市場以后,汽車制造商為此款車創建一個數據庫,數據庫以售出的汽車作為存儲對象。每售出一臺汽車數據庫增加一項,這個數據庫相當于為售出的汽車創建了汽車檔案。每次車輛進4S店保養或維修,4S店工作人員都將汽車的狀態以及故障情況,添加對應的項中。而每一項又包含各種屬性,這些屬性可以按部件分類,也可以按故障進行分類。這些屬性也是提前預設好的,數據采集人員只負責添加數據,對于一些出現的問題而數據庫中沒有的屬性,數據采集人員可以添加,添加后其他相關車輛也相應增加了此種屬性。
這兩種構建數據庫的方法各有優勢。第一種構建數據庫的方法,以零部件作為對象,通過一段時間的數據采集,能夠很快發現汽車的缺陷所在,在改進方面具有很強的針對性。第二種構建方法,以所售汽車為數據庫的存儲對象,首先對用戶來說建立了汽車檔案,能夠及時為用戶提供維修保養的建議,提高服務質量。另外,車輛數據的完整性較高。
2.2 數據的采集與錄入
對于汽車制造商來說,獲取數據應該是一件比較容易的事情。每一家汽車制造商在其產品銷售的城市都設有4S店,有些汽車品牌在一個城市不止有一個4S店。這些4S店負責車輛的銷售以及售后服務。因此,4S店直接與汽車使用者接觸,能夠準確地獲得關于車輛使用缺陷與不足以及客戶改進需求的第一手資料。
對于數據的采集,可以將4S店的電腦作為數據庫的終端,與生產商的數據庫進行連接,并對終端設置用戶訪問權限,如4S店的工作人員只能查看添加數據,對于已有的數據無權修改等,這樣4S店便可作為汽車制造商的數據采集節點,將所有4S店的電腦與數據庫相連,這就構成了一張很大的數據采集網絡。
當一輛車到4S店進行保養或者維修時,4S店的工作人員根據數據庫中的各項對車主進行訪問,并將得到的結果進行錄入。如果是車輛維修,首先按照故障的位置,在數據庫中找到相應的大項,然后,確認是人為事故還是機械故障。如果是保養,確定車輛的狀態,同時,針對數據庫對象預設的屬性對用戶進行訪問,錄入結果。
3 基于數據挖掘技術的汽車改進
利用數據挖掘技術對車輛進行改進,主要是設定一定的規則,并通過軟件編程對數據庫中的數據進行分析,發現車輛潛在的問題,并確定問題所在,給汽車制造商提出汽車改進合理化建議。而汽車改進主要是對汽車投入市場后針對車輛在使用中發現的問題與不足以及客戶反饋的問題進行改進或提高。對于汽車改進可以分為兩類:一類是急需性改進,如生產設計缺陷等;另一類是非急需性改進,如對外形尺寸的改進。