
1 背景介紹
在我國,中小企業是國民經濟最活躍的主體,被稱為中國經濟的生力軍。在江蘇省,中小企業的重要性則更為突出。江蘇省中小企業在拉動GDP,推動社會經濟發展,促進就業等繁忙都作出了巨大的貢獻。然而,中小企業在發展過程中卻面臨著各種困難,在面臨人民幣升值,金融危機等一系列問題下的中小企業生存更是艱辛。其中首要的瓶頸便是融資問題。在我國,按照現有的有關貸款通則以及相關規定,對中小企業的貸款問題限制的比較嚴格。本文選取了37個成功融資的中小企業,采用數據挖掘中的Apriori算法,對這些中小企業融資途徑進行關聯分析,找到合適的融資途徑組合。
2 關聯規則及Apriori算法
2.1 關聯規則
關聯規則挖掘用于尋找給定數據集中數據項之間的有趣的關聯或相關關系。關聯規則揭示了數據項間的未知的依賴關系,根據所挖掘的關聯關系,可以從一個數據對象的信息來推斷另一個數據對象的信息。關聯規則的挖掘通過規則的支持度和置信度進行度量,這兩種度量反映了所發現規則的有用性和確定性。
定義1:設D是事務集,A,B為項集,且有規則A=>B。如果D中,包含A•B事務所占比例為s%,稱A=>B有支持度s。
定義2:設D是事務集,A,B為項集,且有規則A=>B。如果D中,c%的事務包含A的同時也包含B,則稱A=>B有置信度c。
定義3:設D是事務集,A,B為項集,若A=>B滿足置信度c和支持度s,則稱A=>B為關聯規則。
定義4:對關聯規則A=>B,若同時滿足最小支持度閥值和最小置信度閥值,則稱其為強規則。
關聯規則挖掘的過程分為兩個步驟。第一步,發現所有的大項目集,即支持度大于給定最小支持度閥值的項集;第二步,從大的項集中產生關聯規則。
2.2 Apriori算法
對于Ck中的任一項集c,若c得任一k-1子集在Lk-1中不存在,則將c從Ck中刪除。算法的下一步是對數據庫進行檢索,得到Ck中的項集的支持度,與最小支持度進行比較,從而得到Lk。它由Ck中的一部分項集組成,條件是它們的支持度不小于最小支持度。
3 Apriori算法在中小企業融資途徑選擇中的應用
由于證券市場門檻高,創業投資體制不健全,公司債發行的準入障礙,中小企業難以通過資本市場公開籌集資金,因此造成了中小企業融資渠道過于狹窄的現狀。一般說來,中小企業融資有以下幾種方式:①銀行貸款;②信用社貸款;③擔保機構貸款:④內部職工集資;⑤民間借款;⑥拖欠貸款;⑦親朋借款;⑧租賃
本文以江蘇省中小企業為研究對象開展調查,樣本涉及江蘇省的南京、常州、南通、連云港、鹽城、淮安等多個城市的中小企業。在對大量調查數據進行分析處理后,選擇37個成功融資的中小企業作為原始事務集,并將融資渠道分為8種,作為8種項集
首先掃描數據庫,識別所有單個項(1-項集)和它們的支持度,建立候選1-項集C1
假定最小支持度(min_sup)s=10%(至少在3個事務中),選擇1-項集的支持度大于或等于(min_sup)s的項,建立頻繁1-項集,并記作L1
假定最小支持度為至少在2個事務中,選擇2-項集的支持度大于或等于(min_sup)s的項,建立頻繁2-項集,并記作L2
重復以上過程,建立候選3-項集C3和頻繁3-項集L3
這時,由于C4為空集,停止Apriori算法。頻繁項集為L=L1∪L2∪L3。
若企業融資的途徑多于一種,則通過以上頻繁項集可以推導出強規則,即最佳融資途徑組合。
考慮頻繁3-項集{1,2,3},由于這三種途徑頻繁地一起使用,我們可以從這個3-項集推導出一些規則。
首先,得到非空真子集:{1},{2},{3},{1,2},{1,3},{2,3}。
然后,對于每個子集,形成如下規則,并計算置信度:
R1∶{1}→{2,3}, 2/26=1/13
R2∶{2}→{1,3}, 2/11
R3∶{3}→{1,2}, 2/4=1/2
R4∶{1,2}→{3}, 2/7
R5∶{1,3}→{2}, 2/3
R6∶{2,3}→{1}, 2/3
令min_conf為50%,選取R3、R5、R6為強規則。
用相同的方法計算頻繁2-項集,還可以得到以下四個強規則:
4 挖掘結果分析
從Apriori算法計算后得到的挖掘結果顯示以下規則:
規則一:江蘇省中小企業在融資時若只選擇一種融資方式,則向銀行貸款或者向信用社貸款是最有可能成功的融資途徑。
規則二:如果中小企業選擇兩種融資途徑,則有七種融資組合具有較高的成功率,即{銀行貸款,信用社貸款},{銀行貸款,擔保機構貸款},{銀行貸款,內部職工集資},{銀行貸款,拖欠貸款},{銀行貸款,親朋借款},{信用社貸款,擔保機構貸款},{民間借款,親朋借款}。
規則三:如果中小企業選擇兩種以上的融資途徑來保證借貸的成功率,則只有一種融資組合具有較高的成功率,即{銀行貸款,信用社貸款,擔保機構貸款}。
規則四:如果中小企業希望通過信用社貸款,則同時再向銀行借款,成功的可能性比僅僅選擇信用社貸款更大。如果希望通過擔保機構借到資金,則同時再向銀行或信用社進行借貸,這樣的成功幾率更高。
規則五:對于成功借貸的中小企業來說,民間借款和向親朋借款通常是同時進行的。即如果企業已經選擇了民間借款這種途徑,則再向親朋借款的可能性非常大。同樣的,如果企業選擇了向親朋借款,則很有可能會尋找其他的民間借款途徑。
規則六:企業如果希望僅僅通過擔保機構貸款,而不選擇其他的途徑,這樣的風險是相當大的。如果同時再向銀行以及信用社進行借款,將會大大降低風險,提高借貸的成功率。
通過對關聯規則的分析,可以清楚地看到,如果中小企業希望成功地從社會融資,融資途徑的選擇非常重要。通過對八種不同的融資途徑的分析,發現像銀行貸款成功的可能性最高。但是,由于貸款交易和監控成本高等原因,銀行不愿對中小企業放貸。同時,中小企業因資信等級低,缺乏抵押資產,融資成本高等原因,難以得到銀行資金支持。因此,中小企業必須考慮兩種及兩種以上的融資途徑。從Apriori算法計算后得到的挖掘結果顯示,{銀行貸款,信用社貸款},{銀行貸款,擔保機構貸款},{銀行貸款,內部職工集資},{銀行貸款,拖欠貸款},{銀行貸款,親朋借款},{信用社貸款,擔保機構貸款},{民間借款,親朋借款}以及{銀行貸款,信用社貸款,擔保機構貸款}是常見的融資途徑組合。其中,{信用社貸款,擔保機構貸款},{銀行貸款,信用社貸款}成功的可能性最高。并且,僅僅通過擔保機構貸款得成功率很低,但如果與向銀行和信用社貸款相結合,將會大大提高成功率。
由于中小企業的融資渠道過于集中于商業銀行,獲得資金來源的渠道過于單一,所以通過本文數據挖掘的結論,一些中小企業可以改變原有的融資方式,尋找其他的途徑。
在中小企業融資途徑中應用數據挖掘具有決策指導意義,它可以分析企業的融資趨勢,挖掘潛在途徑,提高企業融資的成功率。