
1 引 言
在線評論被認為是傳統口碑的數字化表現形式[1],承載了消費者的直接產品體驗,蘊含了大量的管理和決策支持信息。其價值可以從買方和賣方兩方面來分析:
(1) 買方價值:在線評論屬于一種無偏產品信息,其可信度大大高于商家的促銷信息,對潛在客戶的購買決策具有重要影響[2]。
(2) 賣方價值:廠商可以通過對用戶發表的在線評論的研究,來發現用戶對本企業產品的滿意程度,本產品與同類產品相比的優勢和劣勢,據此對產品進行改進,從而增強企業競爭力。
然而,隨著在線評論的不斷增加,在線評論也出現了信息爆炸時代的普遍問題——信息過載[3-4]。在線評論數量的巨大和質量的參差不齊嚴重干擾了評論閱讀者對產品質量的有效判斷,增加了信息搜尋成本,降低了決策的效率[5]。因此,有效地識別在線評論的價值就顯得至關重要。
許多電子商務網站會鼓勵閱讀者對自己看到的在線評論進行投票,然后利用投票數來評價一條評論的有用性。本文在現有研究的基礎上,構建在線評論投票數的影響因素模型。本文的研究目的是更好地解釋為什么有的評論會得到較多的投票數,而有的評論只得到很少的投票數。
本文收集了中國最大的電子產品交易網站——京東商城熱門手機的在線評論信息,結合文本挖掘技術和實證研究方法,從數字特征、寫作風格和語義3個維度來研究在線評論投票數的影響因素、作用方向和重要程度。本文內容組織如下:第2節,根據相關理論和文獻研究提出理論假設,建立在線評論投票數的影響因素模型。第3節,闡述數據采集、處理和實證分析的過程,并對分析結果進行分析和解釋。第4節,給出研究結論及其意義,并指出研究局限和后續研究方向。
2 模型與理論假設
在之前研究的基礎上,本文構建的在線評論投票數影響因素模型如圖1所示。
2.1 數字特征維度
數字特征指的是不涉及文本內容的信息,包括:① 產品的平均得分,記為AvgScore。② 評論者評分,記為Rating。③ 評論發表距今的時間間隔,記為ElapsedDay。④ 評論者是否填寫了產品的不足,記為NoDisadv。
文獻[6]研究表明評論者是否填寫了產品的不足對投票數沒有顯著影響,這與之前的研究略有出入。消費者通常會認為負面信息比正面信息更具診斷價值,因而在做購買決策時更多地依賴負面信息[5] ,而產品的不足反映的正是其負面信息,由此,本文提出假設H1。
H1:評論者是否填寫了產品的不足對投票數有顯著的正向影響。
2.2 寫作風格維度
寫作風格反映了評論人寫作的特點。寫作風格主要體現在正文各部分內容(優點、不足和使用心得)是否相同,文本長度,平均句長和評論的主觀性等方面。
評論可以分為標題和正文。標題通常比較短,評論者的寫作風格主要體現在正文里,所以本文中寫作風格主要指的是正文風格。寫作風格包括:① 正文各部分內容(優點、不足和使用心得)是否相同,記為Same。② 文本長度。評論分為標題和正文兩部分,標題長度記為TitLen,正文長度記為ConLen。本文將長度作為文本信息量的一個度量指標。③ 平均句長,記為AvgLen。④ 評論的主觀性,記為Sub。本文把評論中形容詞所占比重作為評論主觀性的代理指標。
正文各部分內容(即優點、不足和使用心得)是否相同以及評論的主觀性是本文新加入模型的影響因素。
評論者在優點、不足和使用心得中填寫相同的內容,可能的原因是:用重復來強調自己滿意或者不滿意的強烈情感;發表評論僅為了獲得網站的積分,復制粘貼可以節約時間。基于以上的分析,并不能斷定正文各部分內容是否相同對投票數的影響是正向還是負向。正文分為優點、不足和使用心得3部分,通常來講,優點是對產品的正面評價,不足是對產品的負面評價,使用心得是對產品的總體評價,表達正面情感或者負面情感均可。若優點和不足填寫了相同的內容,評論者可能是想通過這種重復來強調自己的某種情感(滿意或者不滿意),那么它對投票數有正向影響;若使用心得和優點或者是不足內容相同,這樣就會減少評論的信息量,可能會對投票數有負向影響。由此,本文提出假設H2。
H2:正文各部分內容是否相同對投票數有影響,但不確定是正向還是負向。
H2a:評論優點和不足內容是否相同對投票數有顯著的正向影響。
H2b:評論優點和使用心得內容是否相同對投票數有顯著的負向影響。
H2c:評論不足和使用心得內容是否相同對投票數有顯著的負向影響。
文獻[7]把評論文本內容分為客觀和主觀兩類。文獻[8]研究了文本的主觀性對在線評論有用性的影響,結果發現,評論的主觀性越大,評論的有用性越低。由此,本文提出假設H3。
H3:評論的主觀性對評論的投票數有顯著的負向影響。
2.3 語義維度
文獻[6]研究表明語義是影響投票數的重要因素,但是并沒有深入研究每一個詞語對投票數的影響,且由于采用了因子分析的方法,實驗結果比較難以解釋。挖掘重要產品特征和判斷評論觀點的情感傾向是在線評論挖掘的兩個很重要的方面[9],所以本文假設產品特征和觀點的強烈程度對投票數有顯著影響。文獻[5,10]都直接把評論者評分作為評論者情感傾向的代理指標,并未從語義的角度來考慮情感傾向及其程度,所以本文將通過情感程度詞來展現評論者情感強烈程度。本文擴展了原模型中語義對投票數的影響,從產品特征詞(記為Feature)、產品故障詞(記為Breakdown)和情感程度詞(記為SenDe) 3方面來研究語義對投票數的影響。