2009年6月10日 星期三

06/11/2009 - 林宛瑩

目前分析結果小結

1. 結點數目與其他X變數的相關性很高,造成其他X變數分析的困難;且其餘X變數與票房的相關性均沒有結點數目來得好。(和學姊討論過後決定將此現象解釋為研究樣本具代表性)

2. 與票房最相關的變數為結點數目中的OnlyOutdegree(=1),此結果有兩個意涵,第一個是此性質的變數最能代表在虛擬社群網路中的隱藏人口(只閱讀不做回應),第二個是當網路中此變數越高,表示該網路越能將隱藏人口轉為顯性人口(不只閱讀還會回應),驅動力越強,票房也就越高。

3. Degree Centralization越低,票房越高,相關係數-0.312(顯著水準: 0.01)。但此結果可能是因為此種網路連結的結構會造成結點數越多Degree Centralization越低,因結點數多的效應而造成Degree Centralization越低,票房越高的情形。

4. 整體網路密度也和上述有同樣情況,結點數越多造成網路密度降低,而形成網路密度越低,票房越高的情形。相關係數-0.265(顯著水準: 0.01)

5. 電影評價在經過標準化後,發現與票房無顯著關係。此結果有可能是具有平價好壞屬性的文章數量太少,造成樣本不夠客觀,之後會試著加入推噓文的變數來調整電影評價的值。

6. 之前自訂了一個假設是電影評價越兩極化(好壞評價的數量越接近)會引起討論熱潮並提升票房,但將標準化的電影評價絕對值處理並與票房做相關性分析,發現結果並不顯著。

7. 針對第六點的結果,以噓文的比例來做另一個角度的分析。「在電影討論網路中,噓文的比例越高表示該電影的好壞越具有爭議?進而引起討論熱潮並提升票房?」結果分析出來相關係數為0.382(顯著水準: 0.01)

8. 意見領袖的相關變數希望可以多增加幾個定義,目前已有的定義是「該作者文章有被板主訂為精華文章並有使用者推文分數總和大於等於10」。另外將新增兩個定義,分別是「作者文章有被板主訂為精華文章」與「使用者推文分數總和大於等於10」,進而比較分析出來的結果。

9. 在網路變數方面另外加上reachability,與票房結果相關係數為0.310(顯著水準: 0.01)。表示網路可達性越高,票房結果越好。

10. 社會網路相關變數不足,希望尋找更多可解釋的社會網路指標來解釋網路現象或票房結果。(若網路變數效果不彰,將嘗試簡化現有網路,如留下該網路之最大Component)

11. 之後希望加上電影分類(:恐怖片、喜劇片…etc.)的變數,或許可以看到不一樣的分析結果。

12. 時間序列的資料待差分處理後重新分析。

沒有留言:

張貼留言