
[摘 要] 利用數據挖掘技術中的聚類分析方法進行財務分析。選取幾個核心的財務指標數據,利用SPSS分析軟件對我國上市房地產公司進行聚類分析,將其分類,為投資者提供最佳的決策依據。
[關鍵詞] 數據挖掘;聚類分析;財務分析
[中圖分類號]F275[文獻標識碼]A[文章編號]1673-0194(2009)03-0030-03
1 數據挖掘技術
從商業角度來看數據挖掘是一種新的商業信息處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助商業決策的關鍵性信息。數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程[2]。
數據挖掘的分析方法有許多,如關聯分析、聚類分析、人工神經網絡和決策樹等。它被應用到公司客戶關系管理、投資項目決策、銀行風險評估和金融市場股價分析等眾多領域。
2 聚類分析
聚類分析是數據挖掘技術中的重要分析技術,是通過數據建模簡化數據的一種方法,研究成果主要集中在基于距離和相似度的聚類方法。就數據挖掘功能而言,聚類能夠作為一個獨立的工具獲得數據的分布狀況,觀察每一簇數據的特征,集中對特定的聚簇集合作進一步的分析,聚類分析主要針對的數據類型包括區間標度變量、二元變量、標稱變量、序數型變量、比例標度變量以及由這些變量類型構成的符合類型[5]。
稱為數據矩陣。數據矩陣是對象—變量結構的數據表達方式。
相異度矩陣(Dissimilarity Matrix),按n個對象兩兩間的相異度構建n 階矩陣,又因為相異度矩陣是對稱的,只需寫出上三角或下三角即可:
其中d(i, j)表示對象i與j的相異度,它是一個非負的數值。當對象i與j越相似或“接近”時,d(i, j)值越接近0;反之,d(i, j)值越大。相異度矩陣是對象—對象結構的一種數據表達方式。多數聚類算法都是建立在相異度矩陣基礎上,如果數據是以數據矩陣形式給出的,就要將數據矩陣轉化為相異度矩陣。對象間距離是經常采用的求相異度方法。
3 房地產類上市公司聚類分析研究
3. 1確定挖掘對象
財務分析是管理中不可缺少的工具,是在會計信息供給與會計信息需求之間架起的一座橋梁,它通過對會計信息的透視與剖析,滿足會計信息需求者的不同要求[1]。財務狀況反映了公司的運營狀況。本文選取了我國上市公司中20家具有代表性的房地產公司進行分析:招商地產(000024)、萬科A(000002)、棲霞建設(600533)、榮盛發展(002146)、中糧地產(000031)、中華企業(600675)、華發股份(600325)、保利地產(600048)、金地集團(600383)等,分別用X1,X2,X3,…,X20表示。可以預測大部分公司屬于一類,也即表現一般,它們將歸為一類;很少一部分歸為一類,也即表現業績優良或是較差。再利用其他輔助指標就可以判定哪些是值得投資的。
3. 2數據準備
3. 2. 1數據選取
以2008年3月31日為時點,選取20家上市房地產公司以下關鍵財務數據:流動資產合計、總資產合計、流動負債合計、長期負債合計、資本公積、盈余公積、未分配利潤7個財務數據,分別用L1,L2,L3,…,L7表示(見表1)。
表3反映了聚類分析的凝聚過程。
第一列表示聚類分析的步驟,在本次分析中共進行了19次。第二和第三列表示哪兩個樣本聚成了一類。第四列表示兩個樣本的相似系數。第五列表示參與聚類的是樣本還是類,0表示樣本,非零數字N表示第N步產生的聚類參與本步聚類。第七列表示本步驟聚類結果將在以后的第幾步中用到。 第一行表示8和9兩個樣本最先進行了聚類,樣本間相似系數為0.998,本次聚類結果將在以后的第四步中用到;以此類推,將20個樣本全部聚類。
表4是最終聚類結果的類成員表,在利用SPSS分析過程中,本文設置分為2~4類,從而輸出了劃分2~4類時每個樣本屬于某一類的結果。
4 結 論
聚類分析事前并沒有制定分類的標準。本文中,當劃分為兩類的時候,只有銀基發展和其他不同類,通過傳統的財務分析方法可以得出,其總資產增長率為負;當劃分為3類時,天倫置業各項指標表現都較差,其總資產周轉率是最低的;當劃分為4類時,華業地產的總資產周轉率和凈資產報酬率都不錯,尤其是速動比率最大。聚類分析對于通過財務指標理性選擇值得投資的上市公司起到了積極的作用,但一個企業的價值衡量并不限于此,聚類分析只是提供了一個可以橫向比較同類上市公司的工具。
主要參考文獻
[1] 葛家澍. 財務會計理論、方法、準則探討[M]. 北京:中國財政經濟出版社,2002.
[2] 〔加〕 Jiawei Han,M kamber. 數據挖掘技術與概念[M]. 北京:機械工業出版社,2001.
[3] 李劍鋒,李一軍,祁威,等. 數據挖掘在公司財務分析中的應用[J]. 計算機工程與應用,2005(2).
[4] 林偉林,林有. 數據挖掘在上市公司財務狀況分析中的應用[J]. 市場周刊:財經論壇,2004(10).
[5] 李雄飛,李軍. 數據挖掘與知識發現[M]. 北京:高等教育出版社,2003.
[6] 章文波,陳紅艷. 實用數據統計分析及SPSS 12.0應用[M]. 北京:人民郵電出版社,2006:179-192.