社會計算(social computing)的方法論以社會科學理論為導引,并結合大數(shù)據(jù)與人工智能算法解決社會問題。本文從大量文獻中提煉出融合大數(shù)據(jù)與社會科學理論的五種研究類型:基于大數(shù)據(jù)的探索性研究、基于大數(shù)據(jù)的驗證性研究、大數(shù)據(jù)與結構化數(shù)據(jù)整合下的探索性或驗證性研究、基于大型互聯(lián)網(wǎng)實驗的驗證性研究和基于大數(shù)據(jù)(或結合結構化數(shù)據(jù))先探索后驗證的整合研究。本文針對上述五種研究進行了典型研究示例和若干相關研究成果展示。
一引言
社會科學家一般多關注因果和解釋性問題,計算機學家旨在提升預測模型準確率。而隨著社會計算、計算社會學、計算社會科學等交叉學科的興起,關于“預測性和可解釋性不再是權衡和競爭,而是可以相互補充”的呼吁逐漸得到重視。2021年,霍夫曼(Jake Hofman)與瓦茨(Duncan Watts)等人在《自然》雜志上發(fā)文,依據(jù)可解釋性和預測性將計算社會科學的研究方法劃分到四個象限中:(1)描述性統(tǒng)計;(2)因果研究;(3)預測模型與預測因子分析;(4)因果與預測整合的研究(Hofman et al.,2021)。其中,第一象限與第三象限是數(shù)據(jù)驅(qū)動的探索性研究,第二象限是理論驅(qū)動的驗證性研究,第四象限則是探索性和驗證性結合的研究。本文以電子印跡大數(shù)據(jù)、整合的大數(shù)據(jù)與結構化數(shù)據(jù)、大型互聯(lián)網(wǎng)實驗數(shù)據(jù)這三種數(shù)據(jù)來源為基礎,結合單獨或者整合的探索性和驗證性研究方法,為這一領域的方法論做出系統(tǒng)的梳理和詳細的案例展示。
大數(shù)據(jù)及其分析方法的出現(xiàn)推動了社會科學研究新范式的涌現(xiàn)。傳統(tǒng)社會科學定量研究中,問卷數(shù)據(jù)存在樣本規(guī)模?。ㄌm德爾、馬科夫斯基,2006)、失真(Fisher,1993)和系統(tǒng)誤差等問題。而獲得更準確且更大規(guī)模的數(shù)據(jù),如經(jīng)濟社會普查數(shù)據(jù)的成本極高,同時,這類數(shù)據(jù)通常時效性也較差(高見、周濤,2016;Einav & Levin,2014)。
大量非結構化電子印跡數(shù)據(jù)(如網(wǎng)頁搜索、社交網(wǎng)絡互動內(nèi)容、衛(wèi)星遙感、視頻圖像、移動通信、社交媒體等)的記錄和積累為社會科學研究者帶來了前所未有的重大機會和挑戰(zhàn)(舍恩伯格、庫克耶,2013)。一方面,這些非結構化數(shù)據(jù)具有規(guī)模更大、實時性更強、精度更高的特點。因此,非結構化大數(shù)據(jù)的使用既可以降低小樣本數(shù)據(jù)的稀疏性和偏差度,又可以增加社會現(xiàn)象動態(tài)發(fā)展過程的可見度,更好地描述社會經(jīng)濟發(fā)展態(tài)勢。另一方面,理解和分析這類海量的非結構化數(shù)據(jù),需要前沿的數(shù)據(jù)挖掘、機器學習和統(tǒng)計力學方法,這對以統(tǒng)計分析為主要工具的傳統(tǒng)社會科學研究者提出了挑戰(zhàn)。
近年來,大批計算機科學家和物理學家與社會科學家形成深度合作,旨在共同應對社會治理和預測問題,積極應對上述傳統(tǒng)統(tǒng)計分析方法面臨的挑戰(zhàn)并提供了一些解決方案。這些具有交叉學科性質(zhì)的學者一同提出了若干新的研究分支,包括計算社會科學(Lazer et al.,2009;Shah et al.,2015)、計算社會經(jīng)濟學(Gao et al.,2019;Zhou,2021)、社會計算(Wang et al.,2007;孟小峰等,2013;Evans et al.,2020;Evans,2020),等等。盡管這些研究分支的提法各有不同,但這些涌現(xiàn)出來的新研究分支具有明顯的共性,即都是基于大數(shù)據(jù),運用統(tǒng)計力學、動態(tài)建模和人工智能等方法和技術,來獲得對社會現(xiàn)象和規(guī)律更精準的刻畫,并提出科學解釋。需要注意的是,與傳統(tǒng)社會科學相比,二者之間的區(qū)別主要體現(xiàn)在研究方法的發(fā)展上,而非研究問題本身。新研究分支雖然只是在研究方法和數(shù)據(jù)上有所發(fā)展,卻在解決重要社會問題上創(chuàng)生出巨大價值。概括來說,這些研究在與理論的對話過程中往往基于大量新數(shù)據(jù)來應用新方法,從而獲得有社會科學理論觀照的新發(fā)現(xiàn),因此,筆者將這些研究統(tǒng)稱為“社會計算(social computing)驅(qū)動的社會科學研究”。
國內(nèi)關于社會計算研究的綜述性文章,主要從數(shù)據(jù)、方法、工具或具體引入某一 方法形成的新研究范式等方面展開闡述。其中包括羅瑋和羅教講(2015)基于2014年美國社會學年會“新計算社會學”討論會以及相關文獻,將計算社會學相關內(nèi)容劃分為“大數(shù)據(jù)的獲取與分析、質(zhì)性研究與定量研究的融合、互聯(lián)網(wǎng)社會實驗研究、計算機模擬研究和新型社會計算工具的研制與開發(fā)”這五類,主要從數(shù)據(jù)、方法和工具來做闡釋,將這三個方面視為計算社會科學研究所需要的“原料”。陳云松等人(2020)則以瓦茨在2014年《美國社會學雜志》(American Journal of Sociology)上對社會科學家只重視可解釋性而忽略預測性的批評為基礎,重點介紹基于機器學習的方法為社會計算研究帶來的新研究范式。胡安寧等人(2021)從研究方法層面介紹了機器學習模型在處理個體效應異質(zhì)性中存在的優(yōu)勢。羅家德等人(2018,2021)主要從方法論層面闡述了理論、數(shù)據(jù)挖掘結果和預測模型間的動態(tài)三角對話的研究范式。
本文主旨是針對具體的研究問題,闡述如何使用和整合對應的社會科學理論、新數(shù)據(jù)和新方法來獲得新發(fā)現(xiàn)、驗證或修正理論,為相關研究者對上述不同要素進行組合、銜接和取舍以形成完整研究提供參考和定位。因此,我們從方法論角度作綜合梳理,輔以具體案例展示,提出社會計算驅(qū)動的五類社會科學研究,分別是:(1)基于大數(shù)據(jù)的探索性研究;(2)基于大數(shù)據(jù)的驗證性研究;(3)大數(shù)據(jù)與結構化數(shù)據(jù)整合下的探索性或驗證性研究;(4)基于大型互聯(lián)網(wǎng)實驗的驗證性研究;(5)基于大數(shù)據(jù)(或結合結構化數(shù)據(jù))先探索后驗證的整合研究。這五種方法論的提煉是筆者以薩爾加尼克(Matthew Salganik)基于大數(shù)據(jù)和調(diào)查數(shù)據(jù)提出的擴充型提問(擴展研究變量和議題)和豐富型提問(整合少數(shù)人的調(diào)查數(shù)據(jù)與大量研究對象的大數(shù)據(jù))兩種方法論(Salganik,2017)為基礎,結合上述霍夫曼與瓦茨等人(Hofman et al.,2021)在《自然》雜志上提出四象限研究,進一步提煉得出的分類。在本文的劃分依據(jù)下,第三類大數(shù)據(jù)與結構化數(shù)據(jù)整合下的探索性或驗證性研究以及第五類基于大數(shù)據(jù)(或結合結構化數(shù)據(jù))先探索后驗證的整合研究尤其反映了薩爾加尼克(Salganik,2017)以及霍夫曼與瓦茨等人(Hofman et al.,2021)的方法論關切,展現(xiàn)了近年來的重要發(fā)展,標示著社會科學理論和社會計算方法在進一步深度整合。
這五大方法論劃分所強調(diào)的核心內(nèi)容包括以下三點。
第一,社會計算不是計算機科學(computer science)和社會數(shù)據(jù)(social data)的簡單疊加,而是方法論層面的革新。社會計算扎根社會現(xiàn)實問題,解釋和聯(lián)系社會科學理論。
第二,五種方法論主要從該類研究所關注和解決的社會科學理論問題出發(fā),以社會科學研究中對理論問題的探索性、驗證性以及探索和驗證的整合研究來劃分。
第三,圍繞所對話的理論或研究問題,社會計算驅(qū)動的社會科學研究的數(shù)據(jù)來源主要包括直接獲得的電子印跡數(shù)據(jù)、電子印跡數(shù)據(jù)和結構化數(shù)據(jù)的結合,或是大規(guī)模網(wǎng)絡實驗數(shù)據(jù)。
綜上所述,五種研究方法論以社會科學的問題意識為核心,以不同數(shù)據(jù)來源為基礎,組織不同測量、分析方法和模型來解決問題。上述要素綜合形成五種差異化的方法論演進路線。在提出上述方法論的“骨架”后,本文在每個方法論闡述下凝練和舉出一個典型的案例,并簡要介紹若干其他有代表性的案例,通過實例化的方式展現(xiàn)五種方法論下的具體的研究步驟和范式。
二基于大數(shù)據(jù)的探索性研究
以往社會科學研究的數(shù)據(jù)往往來自問卷調(diào)查和控制實驗,存在數(shù)據(jù)樣本數(shù)量少、主觀性高的問題。此外,當知曉自己是調(diào)查對象或?qū)嶒瀸ο螅茉L者會傾向于給出更易被社會接受的答案,而非真實的答案(Fisher,1993)。本文強調(diào)的電子化印跡數(shù)據(jù)是在研究對象不知情的情況下在現(xiàn)實生活中記錄形成的,因此叫做自然數(shù)據(jù)。這類數(shù)據(jù)具有細粒度、大規(guī)模、強時序性的特點,因此,在開展大數(shù)據(jù)的探索性研究過程中發(fā)揮了重要作用。
大數(shù)據(jù)的探索性研究可以用于分析失業(yè)情況和職場發(fā)展。在無干預的情況下,筆者通過分析企業(yè)員工在內(nèi)部辦公系統(tǒng)中留下的記錄,發(fā)現(xiàn)員工在辦公系統(tǒng)中的活躍程度,特別是通過回溯員工間在辦公系統(tǒng)發(fā)布任務、領取任務、上傳、分享和下載文件等行為形成的互動關系,和該員工接下來一年之內(nèi)的晉升或者離職有顯著關系(張琳艷等,2015;Yuan et al.,2015)。自然數(shù)據(jù)還可以用來定量刻畫兩性不平等的程度。筆者通過分析互聯(lián)網(wǎng)求職者的簡歷數(shù)據(jù),發(fā)現(xiàn)平均而言女性要比男性多讀一個學位或者多工作5年才能獲得和男性一樣的預期收入(Yang et al.,2018;王軍等,2019)。
以下,筆者通過一個宗教隔離的研究案例(Hu et al.,2019)來詳細展示如何采集和分析自然數(shù)據(jù),并得到有價值的結論。宗教在人類文化中扮演著重要角色,宗教信仰有正面的價值,例如促進人類的合作(Purzycki et al.,2016)、提高生活的滿意度(Lim & Putnam,2010)以及精神和身體健康水平(Koenig et al.,2001),等等。與此同時,因為不同宗教之間可能存在信仰內(nèi)容和觀念形態(tài)的差異,宗教之間會出現(xiàn)隔離現(xiàn)象,而這種現(xiàn)象對于文化演進、經(jīng)濟發(fā)展和政治制度往往存在負面的影響(Atran & Jeremy,2012)。
筆者利用微博的公開數(shù)據(jù)分析宗教信徒之間形成的在線社交關系,觀察這種社交關系中不同宗教之間是否存在隔離現(xiàn)象。為了從微博用戶中把有宗教信仰的用戶找出來,筆者先建立了一個宗教相關關鍵詞的列表,該詞表覆蓋了最常見的一些和宗教相關的詞語。筆者在微博用戶的自我介紹、標簽和昵稱中搜索這些關鍵詞,發(fā)現(xiàn)170000多用戶包含了詞表中至少一個關鍵詞,有9000多用戶包含了至少兩個關鍵詞。筆者所在的研究團隊人工標注了這9000多用戶,確認其中6875名是有特定宗教信仰的用戶,分別屬于佛教、基督教、道教、伊斯蘭教中的一類。隨后,根據(jù)這些用戶之間的關注行為形成宗教關注網(wǎng)絡。通過對這一特殊社交網(wǎng)絡的探索性分析,筆者得到以下四個主要的發(fā)現(xiàn)。
第一,不同宗教之間的社交隔離非常嚴重。事實上,98.4%的微博關注關系出現(xiàn)在兩個信仰同一宗教的用戶間,而只有1.6%的連邊跨越不同宗教。筆者使用“同配系數(shù)”(assortative coefficient)(Newman,2003)來比較不同類別節(jié)點間連邊的比例與隨機化的網(wǎng)絡相應連邊的比例,以刻畫不同類別節(jié)點之間的隔離程度。最終得到同配系數(shù)r=0.973(r取值的區(qū)間是[-1,1],r=1時表示完全隔離)。該結果說明不同宗教之間的社交隔離非常嚴重。筆者還計算了很多其他測量隔離程度的指數(shù),包括E-I指數(shù)(Krackhardt & Stern,1988)、Gupta-Anderson-May指數(shù)(Gupta et al.,1989)、優(yōu)勢比(Moody,2001)等,結論均相同。
第二,跨越宗教的連邊對于維持整體網(wǎng)絡的連通性起到了決定性的作用。社交網(wǎng)絡是一種典型的具有交換和傳播信息功能的網(wǎng)絡,對于這類網(wǎng)絡而言,連通性是非常重要的性質(zhì)。要判斷連邊對于維持網(wǎng)絡連通性的作用大小,最通常的辦法是比較去掉這些連邊前后的網(wǎng)絡連通性的差異(Li et al.,2021)。筆者對比了移除不同類型的連邊前后網(wǎng)絡的連通性,發(fā)現(xiàn)相比于其他算法篩選的連邊,移除跨宗教連邊后網(wǎng)絡連通性下降得最多,說明跨宗教連邊在維持網(wǎng)絡連通性方面所起到的作用比通過其他算法篩選出來的邊都要顯著得多。
第三,在中國,信仰不同宗教的微博用戶中,佛教徒最具開放性。在排除了不同教派人數(shù)差異的影響后,筆者發(fā)現(xiàn),平均而言佛教徒關注其他宗教信徒或被其他宗教信徒關注的可能性都要更大。
第四,所有的跨宗教連邊中約一半都和慈善有關。筆者發(fā)現(xiàn),在所有被分析的6875個用戶中,有309個用戶至少吸引了一個其他宗教信仰者的關注。其中有33個屬于主要發(fā)布慈善活動消息和新聞的用戶。在這33個用戶中,有15人曾因為慈善活動被媒體報道過,有12人在微博標簽中有“慈善家”這一標簽。雖然這33個慈善用戶只占了所有用戶中的0.48%,但卻吸引了46.7%的跨宗教連邊,可見慈善是增加宗教間溝通的可能切入點。
社會計算科學驅(qū)動的探索性研究從數(shù)據(jù)挖掘(data mining)出發(fā),在得到一些指標值與行為規(guī)律的發(fā)現(xiàn)后,不能止步于此,還需要與現(xiàn)有理論對話并進行詮釋,從而可以提出命題,以豐富、修正舊理論或發(fā)展新理論。接下來,筆者將繼續(xù)展示如何根據(jù)上述探索研究中發(fā)現(xiàn)的指標和行為規(guī)律與宗教研究的相關理論進行對話,對探索結果做出詮釋并提出理論命題。
根據(jù)案例研究問題和重要發(fā)現(xiàn),本研究問題與齊美爾提出的“社會距離”展開了對話。這個概念主要表征“個體之間、群體之間或者個體與群體之間的相互作用和分離程度”(孔建勛、張曉倩,2017:76)。美國芝加哥學派社會學家帕克認為“社會距離是用以描述人際、社會關系的狀態(tài),表征相互理解和親密的程度的概念”(Park,1924;孔建勛、張曉倩,2017:77)。博格達斯(Emory Bogardus)開發(fā)了社會距離測量量表,主要用于研究種族之間的隔離(Bogardus,1925)。已有的一些宗教理論揭示了宗教之間由于受到歷史、宗教文化、利益和資源分配失衡以及各國“政教分離”政策的實施等影響,最終導致宗教去中心化,造成多元文化沖突(亨廷頓,2013;Nataraj,1965)。上述發(fā)現(xiàn)一、二證實了在中國情境下宗教分離現(xiàn)象的存在,并測量了分離程度。
回顧中國情境下的宗教研究,佛教非排他性的宗教觀(薛克翹,2006)解釋了發(fā)現(xiàn)三中佛教徒更有可能關注其他宗教信仰的人的結果。另外,社會規(guī)范理論強調(diào)社會整體對于宗教的態(tài)度會影響信徒的幸福感(Eichhorn, 2011;Stavrova et al., 2013)。在中國傳統(tǒng)宗教中,由于佛教是溝通中國大陸與東亞、南亞、臺灣地區(qū)和香港地區(qū)的重要載體(Ji,2011;Laliberté,2011),因此受到更多的重視和認同,例如開展世界性的佛教論壇等(Lu & Gao,2017)。因此,在中國佛教徒的幸福感水平極大可能高于其他宗教信徒。
關于發(fā)現(xiàn)四,信徒參加宗教活動以及個人宗教身份的認同可以提升其幸福感(Ritter et al.,2014),當幸福感提升后,這些信徒可能更愿意關注社會慈善等事務,同時也有更大可能關注其他宗教信仰的人。因此,跨宗教連邊大多與慈善相關。
綜上,在上述理論詮釋的基礎上,關于發(fā)現(xiàn)三、四的解釋還需要因果關系的進一步驗證,由此我們提出以下命題,以期在后續(xù)研究中把幸福感視作中介變量來解釋宗教身份認同與參與慈善活動和關注其他宗教群體的因果關系。
命題1:個人宗教身份的認同和參加宗教活動可以提升信徒的幸福感,使信徒愿意關注社會慈善。
命題2:個人宗教身份的認同和參加宗教活動可以提升信徒的幸福感,使信徒愿意和其他宗教群體個人產(chǎn)生聯(lián)系。
上述基于微博大數(shù)據(jù)的探索性研究雖然簡單,但卻是第一次定量化地在中國的互聯(lián)網(wǎng)環(huán)境中測量了宗教隔離的程度。同時,在方法上可以讓讀者觀察到如何利用自然數(shù)據(jù)對宗教和相關社會問題進行探索性研究,展示了從收集數(shù)據(jù)、指標計算、數(shù)據(jù)挖掘、發(fā)現(xiàn)行為規(guī)律、對話理論做出詮釋、提出后續(xù)有待驗證的命題的過程。
探索性研究一般到發(fā)現(xiàn)和詮釋為止,而這里提出命題旨在展示如何在探索和理論對話中啟發(fā)后續(xù)更多因果關系的驗證,從而形成理論上的推論,而非僅僅止步于社會事實的發(fā)現(xiàn)。綜上所述,以電子印跡大數(shù)據(jù)為基礎的探索性研究對于理論的意義主要包括如下兩點。第一,可以使用大規(guī)模(甚至是全樣本)、細粒度、無干預的數(shù)據(jù)為理論提供新的測量方法和工具,定量化、科學化地揭示社會規(guī)律和事實。第二,在探索普遍性規(guī)律及變量之間可能的關聯(lián)關系的基礎上,啟發(fā)理論上基于因果機制的發(fā)現(xiàn)、提出命題,助益于后續(xù)更嚴格的建模和驗證。
三基于大數(shù)據(jù)的驗證性研究
目前大多數(shù)社會計算驅(qū)動的社會科學研究所得到的實際上只是描述與關聯(lián)關系,用這種關聯(lián)關系直接對社會現(xiàn)象進行解釋是不可靠的,因為充分的解釋必須建立在因果關系的前提下。瓦茨曾分析了若干社會科學研究論文,指出大量的研究都把可解釋性和因果性混為一談,同時他對因果關系的驗證也提出了更高的要求,即如果變量之間存在因果關系,那么同時應具備高預測性,從而更好地用于政策干預(Watts,2014)。得益于大數(shù)據(jù)和人工智能技術的發(fā)展,預測的效果被越來越多地用于結合因果計量模型,以共同驗證社會科學的理論假設,從而彌補了單單使用預測模型無法真正證明或者證偽理論假設的缺陷。事實上,關聯(lián)關系也可以用于預測,所以預測精度高對于因果關系的存在是必要而非充分的(Hempel & Oppenheim,1948)。另外,應用預測方法也有很多局限性(Jasny & Stone,2017;周濤,2017)。因此,筆者倡導在使用預測模型得到結果后,仍需要結合可解釋人工智能方法,如SHAP(shapley additive explanations)(Lundberg & Lee,2017)等做出理論詮釋,進一步通過假設演繹、使用因果模型/實驗來做驗證——這樣才是具有說服力的社會計算研究方法。
下面著重介紹一個基于高校學生校園行為的大數(shù)據(jù)研究學生行為和成績之間關系的案例(Cao et al.,2017)。回顧相關理論和實證研究。第一,生活規(guī)律的學生往往有更好的自控能力,而自控能力和成績表現(xiàn)是正相關的(Poropat,2009)。第二,更規(guī)律的生活,例如規(guī)律地吃飯、打熱水、洗澡等活動,往往意味著更好的健康狀況,而健康狀況與學生表現(xiàn)有直接的關系(Santana et al.,2017;Hoffmann et al.,2018)。實證表明,規(guī)律的吃飯行為與學業(yè)表現(xiàn)具有很強的相關性(Valladares et al.,2016)。尤其是吃早餐對于學生的認知能力、心理健康和幸福感具有正向的影響。第三,社會發(fā)展理論表明學生習得行為就是來自其在社會化過程中個體行為以及與他人互動的一致性(Catalano et al.,2009),因此有規(guī)律的生活有助于個體的發(fā)展和增強其學校連結(school conneetedness)。而且,已有研究顯示,較強的學校連結有利于學生的健康,可以提高其學業(yè)表現(xiàn)(Basch,2011;Sampasa-Kanyinga & Hamilton,2017)。
因此我們形成了一個理論假設:有規(guī)律的生活會正向影響學生成績。
筆者及其研究小組分析了中國某大學校園一卡通中18960名本科生的匿名數(shù)據(jù),覆蓋了五個學期,包括3380567次洗澡、20060881次吃飯、3466020次進出圖書館和2305311次在教學樓打水的記錄等——這些也是第二部分強調(diào)的“自然數(shù)據(jù)”。筆者通過計算學生洗澡和吃飯時間的真實熵來定量刻畫生活的規(guī)律性。之所以采用真實熵而非香農(nóng)熵,是因為衡量學生吃飯是否規(guī)律不僅要看時間分布是否集中,還要看是否有序,比如吃了早餐吃中餐再吃晚餐,第二天同樣吃早餐、中餐、晚餐,這是有規(guī)律的。而如果第一天吃了早餐不吃中餐,直接吃晚餐,第二天不吃早餐,吃中餐和晚餐,規(guī)律性相較于第一種情況有所降低。筆者用真實熵來度量集中度和周期性(Song et al.,2010;Xu et al.,2019),最終證明了假設,即生活規(guī)律的程度和學生學習成績顯著相關(Cao et al.,2017)。
為排除其他因素的影響,筆者同時控制了其他行為指數(shù)(例如努力程度)對上述相關關系的影響,同時控制了單純的學生行為數(shù)據(jù)等變量,最終得到生活規(guī)律性仍然對學習成績有顯著影響并且可以顯著提升預測準確率(Cao et al.,2019;Yao et al.,2019)。因此本案例展示從理論對話、提出假設、驗證假設、穩(wěn)健性檢驗的驗證性研究過程,這一方法論已經(jīng)廣泛用于社會計算驅(qū)動的社會科學研究的方方面面,例如對勞動力市場的分析(張琳艷等,2015;Yuan et al.,2015)和家庭財富情況的分析(Blumenstock et al.,2015)等。
此外,大數(shù)據(jù)結合網(wǎng)絡動態(tài)模型可以為探索復雜系統(tǒng)理論的動態(tài)演化機制提供解決方案。風險投資領域普遍存在的聯(lián)合投資現(xiàn)象可以給投資者帶來更廣闊的市場機會(Hochberg et al.,2010)和更高的市場聲望(Poldolny,2001;Milanov & Shephere,2013),幫助其抵御不確定的市場環(huán)境和投資風險。中國風險聯(lián)合投資中存在“主投—跟投”的現(xiàn)象,這些“主投”機構一般為產(chǎn)業(yè)領袖。產(chǎn)業(yè)領袖會建立自己的圈子,圈子中存在其他跟投機構,這些產(chǎn)業(yè)領袖同時充當著溝通不同圈子的“橋”的角色,導致小世界網(wǎng)絡結構的形成。但不同圈子的其他跟隨者之間則存在很少的聯(lián)系,因此,這些產(chǎn)業(yè)領袖之間形成了一個互相聯(lián)系緊密的“精英俱樂部”。筆者對中國2000年到2013年風險投資產(chǎn)業(yè)投資事件進行整理,將兩個機構在同一時間投資同一家公司的行為視為一次聯(lián)合投資,從而形成整個風險投資產(chǎn)業(yè)的聯(lián)合投資網(wǎng)絡(Gu et al.,2019)。筆者基于社會網(wǎng)理論中伙伴選擇機制(partner-selection mechanism)和嵌入性理論(embedding theory)建立關于聯(lián)合投資網(wǎng)絡兩種嵌入性的合作策略——關系性嵌入和結構性嵌入的假設(Granovetter,2017),使用基于多主體建模的方法,從網(wǎng)絡的初始情況出發(fā),預測網(wǎng)絡發(fā)展演化的過程。在與真實風險投資網(wǎng)數(shù)據(jù)對比后發(fā)現(xiàn),與隨機選擇模型相比,這兩個機制下的模擬模型在全局和局部網(wǎng)絡特征方面更接近真實的風險聯(lián)合投資網(wǎng)絡,并隨時間變化,逐漸涌現(xiàn)出“精英俱樂部型小世界網(wǎng)絡”的結構。該研究從大數(shù)據(jù)與基于多主體的模型為中國風險投資聯(lián)合網(wǎng)絡結構的涌現(xiàn)提供了理論上的解釋,屬于驗證性研究,而過去調(diào)查問卷幾乎不可能收集這類長時段、多時間戳、全產(chǎn)業(yè)的社會網(wǎng)絡數(shù)據(jù)。由于大數(shù)據(jù)的積累,這類動態(tài)演化的問題才可以得到解釋。
在社會計算驅(qū)動的驗證性研究中,無論是預測模型還是模擬模型,強調(diào)的都是使用大數(shù)據(jù)、利用因果模型或者理論指導下的模擬模型來驗證因果關系和理論機制,最終獲得變量間因果關系上的可解釋性。
四大數(shù)據(jù)與結構化數(shù)據(jù)整合下的探索性研究
非結構化大數(shù)據(jù)不能取代傳統(tǒng)的問卷調(diào)查或是檔案數(shù)據(jù)庫中的結構化數(shù)據(jù)。這兩類數(shù)據(jù)的整合一方面可以測量更豐富的理論構念,增強理論發(fā)展、修正和探索,另一方面可以增強社會預測,助力社會治理,解決單一數(shù)據(jù)源不能解決的問題。
大數(shù)據(jù)與結構化數(shù)據(jù)整合可以推斷更多較難獲得的調(diào)查數(shù)據(jù)。大數(shù)據(jù)技術的發(fā)展讓我們有機會采集和處理與一個國家總?cè)丝谝?guī)模相當(同一數(shù)量級)的數(shù)據(jù),例如Facebook、Twitter、微信、微博等社交媒體和智能手機覆蓋總?cè)丝谥姓紦?jù)相當比例的用戶。因此,這類數(shù)據(jù)不再被看作是人口數(shù)據(jù)的一個小規(guī)模抽樣,而是可以直接表達總體的統(tǒng)計性質(zhì)。一方面,獲得這些大數(shù)據(jù)的成本遠遠低于經(jīng)濟或人口普查,但另一方面,這些在社交媒體和手機通信中表現(xiàn)出來的行為本身往往不能直接回答我們亟須了解的有關家庭收入、就業(yè)情況、身心健康等重要社會問題。
將社交媒體和手機通信大數(shù)據(jù)與部分社會調(diào)查數(shù)據(jù)相結合,可以為上述難題提供可行的解決方案。例如,當我們需要分析大量個體的家庭收入時,就會面臨以下兩個方面的困難:一是很多較貧困的國家和地區(qū)不進行全民經(jīng)濟普查,二是這類數(shù)據(jù)往往不輕易向科研機構開放。在這種情況下,一方面,我們可以利用傳統(tǒng)問卷調(diào)查的方式獲得少量家庭收入的調(diào)查數(shù)據(jù),由于這部分數(shù)據(jù)和研究問題非常相關且獲得成本較高,我們不妨稱其為“難獲得的直接數(shù)據(jù)”。另一方面,大量社交媒體和手機通信大數(shù)據(jù)可稱為“易獲得的間接數(shù)據(jù)”。當二者結合,我們將“難獲得的直接數(shù)據(jù)” 作為扎根真相(ground truth),利用機器學習的方法,建立通過“易獲得的間接數(shù)據(jù)”來預測扎根真相的模型。先基于這些少量樣本訓練優(yōu)化模型,待達到相當精確度后,原則上就可以推論出所有“易獲得的間接數(shù)據(jù)”樣本的“難獲得的直接數(shù)據(jù)”,如使用社交媒體或智能手機用戶的家庭收入。盡管預測得到的數(shù)據(jù)不完全準確,但是其精確度對于分析宏觀問題往往是足夠的。
布盧門施托克(Joshua Blumenstock)等人利用上述方法嘗試繪制了盧旺達全國范圍的財富分布情況并識別最貧困的人口(Blumenstock et al.,2015;Blumenstock,2016;Steele et al.,2017)。通過和運營商合作,該研究團隊可以分析匿名處理后的盧旺達150萬手機用戶數(shù)十億次電話和短信的頻率數(shù)據(jù)。他們在盧旺達手機用戶中招募了856名志愿者,收集了這些人非常詳細的社會經(jīng)濟狀況的問卷調(diào)查數(shù)據(jù),內(nèi)容包括財產(chǎn)所有權、住宅特征、福利情況,等等。根據(jù)這些志愿者每人平均數(shù)千次電話和短信記錄,建立了機器學習模型,可以利用志愿者的手機記錄預測他們的財富指數(shù),預測得到的財富指數(shù)和真實財富指數(shù)之間的皮爾遜相關系數(shù)高達0.68。盡管預測數(shù)值和真實數(shù)值還存在不小的偏差,但這個預測模型能夠通過手機數(shù)據(jù)估計150萬盧旺達家庭的財富情況,并描繪覆蓋整個盧旺達的財富地圖和貧困人口分布圖。相比大規(guī)模的經(jīng)濟普查或問卷調(diào)查,這種“從間接數(shù)據(jù)推斷直接數(shù)據(jù)”方法的性價比在繪制地區(qū)經(jīng)濟狀況畫像和時事政策干預中具有顯著優(yōu)勢。
大數(shù)據(jù)與調(diào)查數(shù)據(jù)相結合的方法還可以進一步修正或探索理論。鄧巴提出以功能劃分五種不同互動模式的理論——親族支持團體、共情群體、共宿群體、社群或族系和部落群體(Dunbar,1993;Dunbar & Spoors,1995;Hill & Dunbar,2003;Zhou et al.,2005;Pollet et al.,2011)。黃光國提出了中國語境下的三種不同的社會關系行為原則(Hwang,1987)——需求法則、人情交換法則和公平法則?;诖耍P者嘗試探索關于中國人的人脈圈層到底可以劃分為幾層(羅家德等,2021;Gao et al.,2020)。筆者以問卷調(diào)查收集到的用戶之間的關系強度作為扎根真相,再從這些用戶在社交軟件中互動的電子印跡化數(shù)據(jù)整理出指標,結合扎根真相,建立五層、四層、三層探索性預測分類模型,輔以解釋模型,不斷尋找準確率最高的劃分方式,從而得到最合適的圈層結構。初步探索結果發(fā)現(xiàn),家人、親密熟人、一般熟人、認識之人四層模型解釋力最強,預測模型最逼近扎根真相。
綜上所述,融合大數(shù)據(jù)與社會調(diào)查的探索性或驗證性研究主要強調(diào)的是使用大數(shù)據(jù)和預測模型來提出新的測量模型,建立基于理論構念或需要通過問卷調(diào)查和定性訪談獲得的“扎根真相”,形成新的測量模型,從而通過易取得的大數(shù)據(jù)和預測模型去估計不易獲得的扎根真相的過程,最大限度地展現(xiàn)大數(shù)據(jù)與調(diào)查數(shù)據(jù)結合后的價值,解決各類社會科學問題,極大地滿足了社會治理、營銷等多個場景中對于獲得更具實時性、全局性、低成本性的扎根真相的應用需求。
五基于大型互聯(lián)網(wǎng)實驗的驗證性研究
除了電子印跡收集到的“自然數(shù)據(jù)”以及與社會調(diào)查和結構化數(shù)據(jù)整合得到的數(shù)據(jù)外,另外一種重要的大數(shù)據(jù)來源就是網(wǎng)絡實驗收集的數(shù)據(jù)。這類數(shù)據(jù)具有規(guī)模較大、成本較低、代表性較高的特點,為以實驗為基礎的驗證性研究帶來了新的機遇。
社會實驗是在實驗室的環(huán)境中抽象和模擬真實社會情景,并通過受試者在實驗室中的反饋推斷真實人群的社會心理和社會行為的研究方法,也是最近半個世紀以來社會科學研究中被越來越多使用的手段之一。與觀察行為不同,研究人員開展實驗,以期系統(tǒng)性地干預世界,獲得因果性的驗證(Salganik,2017)。在實驗設計中,研究者可以設計隨機對照實驗以排除混雜因素,這就要求研究者要先提出理論假設,然后把假設轉(zhuǎn)化成研究設計。具體來說,包括設計實驗方式、確定混雜因素、具體設計實驗、招募參與者、隨機分組、實施干預、測量結果、驗證假設、得出結論等步驟(陳曉萍等,2012)。因此,實驗是一種嚴格以理論為指導的研究類型,是一種驗證性研究。
雖然傳統(tǒng)的線下實驗研究是因果研究中非常重要的研究范式,但也存在如下局限。第一,由于招募志愿者和實施實驗的成本較高,因此受試者數(shù)量往往很少,由此造成統(tǒng)計顯著度和可信度降低。第二,為了節(jié)省成本和實施方便,很多研究人員直接在其工作的校園內(nèi)招募志愿者,這些被招募的學生并不能充分代表廣泛人群,因此實驗結果的普適性常被質(zhì)疑。最近開放科學合作組織對100項心理學實驗進行了重復,結果發(fā)現(xiàn),成功復現(xiàn)的實驗還不到40%(Open Science Collaboration,2015)。盡管對于這個結論還存在爭議(Gilbert et al.,2016),但是目前越來越多的證據(jù)顯示小樣本的實驗室心理行為研究的可信度遠低于預期。
運用互聯(lián)網(wǎng)的手段設計和實施大規(guī)模社會科學實驗有望克服原有實驗設計成本過高、樣本數(shù)量較少、樣本代表性不足等問題。例如,在米爾格拉姆(Stanley Milgram)著名的線下小世界實驗中,其中一次,他讓受試將發(fā)出的296封信件通過熟人關系送達隨機選擇的千里之外的陌生人(Milgram,1967)。事實上只有64封信件送到了收件者手中,米爾格拉姆僅從這64封信件要經(jīng)歷多少次轉(zhuǎn)手中得到了著名的“六度分離”理論,即兩個陌生美國人之間只隔了五個中間的熟人就可以相互連接起來。與之相對,多德(Peter Dodds)等人利用互聯(lián)網(wǎng)上電子郵件重做了米爾格拉姆的實驗(Dodds et al.,2003)。來自168個國家和地區(qū)的98865人參加了這次實驗,數(shù)據(jù)可信度和推論范圍遠超過米爾格拉姆的線下實驗。實驗的結果顯示,在當時普遍使用的互聯(lián)網(wǎng)通信網(wǎng)絡中,人們連接更加緊密,美國大陸的“六度分離”演變成世界范圍的“四度分離”。
另外一個具有代表性的利用大規(guī)?;ヂ?lián)網(wǎng)實驗研究社會科學問題的工作是邦德(Robert Bond)等人針對美國議會大選做的涉及6100多萬人的政治動員實驗(Bond et al.,2012)。他們假設個人的投票行為會受到朋友投票行為的影響。通過與Facebook合作,他們在2010年11月2日美國議會大選日當天,以所有18歲以上登錄了Facebook網(wǎng)頁的用戶為實驗對象并將其劃分為三類:(1)社會組——實驗對象的Facebook頁面“新聞推薦”欄目的頂部會出現(xiàn)一個鼓勵用戶去投票的通告,并提供幫助用戶找到附近的投票站的鏈接。這個通告下面有一個寫著“我已經(jīng)投過票了”的按鈕,用戶通過點這個按鈕來表達政治選擇,該信息可以被Facebook好友獲取。此外,用戶還可以看到好友中已經(jīng)點了那個按鈕的數(shù)量,系統(tǒng)還會隨機展示6個報告投過票的朋友的頭像。(2)信息組——用戶除了看不到任何投過票朋友的頭像外,能夠得到和社會組完全相同的信息。(3)控制組——用戶在自己的Facebook主頁沒有收到任何相關信息。
這個研究最終發(fā)現(xiàn),社會組有20.04%的人會點擊“我已經(jīng)投過票了”按鈕,而信息組只有17.96%,相差2.08%。這證明了社會化的場景會大幅度提高人們政治表達的意愿。此外,通過對比真實的投票記錄來分析這些用戶是否真正會去投票,研究者發(fā)現(xiàn),社會組和信息組的真實投票率相同,都比沒有得到信息的用戶高0.39%,進一步證明利用人際關系網(wǎng)絡的政治動員是有效果的。另外,社會組和信息組的真實投票率相同說明社會場景更多是讓人們愿意表達和分享,而不是立刻和直接地改變?nèi)说男袨椤?/p>
網(wǎng)絡大規(guī)??茖W實驗在很大程度上解決了傳統(tǒng)線下實驗樣本量小、代表性不足等缺陷,也給社會科學理論中因果關系的驗證帶來了很多機會。下面,筆者將簡要介紹幾個典型案例,以便讀者可以從中更加全面地了解這類研究的方法論優(yōu)勢。
2009年10月,美國國防高級研究計劃局(DARPA)組織了一個旨在探索“互聯(lián)網(wǎng)和社交網(wǎng)絡如何在解決一個緊急的跨區(qū)域問題上發(fā)揮重要作用”的競賽,競賽的目標是要參賽隊在最短的時間內(nèi)找到美國大陸上10個紅色的氣象氣球。與其他團隊設置的只獎勵最后找到氣球的人的獎勵機制不同,麻省理工學院彭特蘭(Alex Pentland)等人基于Kleinberg-Raghavan機制(Kleinberg & Raghavan,2005)提出了一種層層遞推的激勵機制。參與者領取待解決的任務后,通過社交媒體或者其他方式找到自己朋友中可能會解決問題或者對解決問題有幫助的人參與進來,最終形成一個鏈條。如果某個人A最終解決了問題,A是由B引入的,B是由C引入的,C是由D引入的,那么A、B、C、D共同分享獎金。彭特蘭小組利用這個機制的吸引力在比賽前就招募到了4400人幫助尋找氣球,最終也在正式比賽中以最短的時間找到了10個氣球,奪取了比賽的冠軍(Pickard et al.,2011)。這一實驗獎勵機制也啟發(fā)了一系列后續(xù)研究(Li et al.,2017;顧勤、周濤,2021)。
另外一個是關于馬太效應理論的網(wǎng)絡實驗。薩爾加尼克等人(Salganik et al., 2006)利用互聯(lián)網(wǎng)招募了14341名青年志愿者參加一個音樂鑒賞任務。他們被要求對48首新歌進行從優(yōu)到差的排序。這些人被分為9個組,其中控制組的志愿者看不到任何其他人的信息,其余志愿者被分為8個組,他們在評價歌曲的同時可以看到每一首歌被他們所在小組人員下載的次數(shù)。薩爾加尼克等人發(fā)現(xiàn),控制組不同歌曲下載的次數(shù)比較接近,但是另外8個組中歌曲下載次數(shù)的差異遠遠大于控制組,出現(xiàn)了“贏者通吃”的現(xiàn)象。這暗示了馬太效應的存在:初始下載次數(shù)占優(yōu)的歌曲會影響其他志愿者下載,從而使得初始的差距被進一步放大。在一個后續(xù)實驗中,研究團隊顛倒了受歡迎和不受歡迎的歌曲下載的初始排名,最終得到了完全不同的結果(Salganik & Watts,2008)。范德賴特(van de Rijt)研究小組做了另外一個揭示初始條件設置導致馬太效應發(fā)生的網(wǎng)上實驗,并完整地觀察到這一過程(van de Rijt,2014)。他們在眾籌網(wǎng)站Kickstarter上隨機選擇了200個新的眾籌項目,這些項目被選擇時的籌款總額都是0美元。然后,研究組隨機選擇100個項目(控制組)不做任何操作,另外100個項目給一筆隨機選定額度的初始捐助。盡管在選擇要給哪些項目進行初始捐助的時候研究組是盲目的,但是這些獲得了少量初始捐助的項目最終成功募集到所需資金的概率是另外100個控制組項目的兩倍,初始的24.52美元平均能吸引191美元的額外捐助。
綜上,實施大規(guī)?;ヂ?lián)網(wǎng)實驗可以解決以往線下實驗樣本量小、代表性不足等問題,從而通過較低的成本形成或驗證以往無法驗證的理論。
六基于大數(shù)據(jù)先探索后驗證的整合研究
基于大數(shù)據(jù)或大數(shù)據(jù)與結構化數(shù)據(jù)的整合數(shù)據(jù)還可以開展先探索后驗證的整合性研究。一方面,探索性研究可以獲得定量化的社會現(xiàn)象之間可能的聯(lián)系的規(guī)律,在與理論對話中獲得對現(xiàn)象的解釋或提出待驗證的理論命題。另一方面,驗證性研究可以在已有命題的基礎上做出理論驗證的研究設計,提出假設,用計量工具/實驗來驗證假設。這種整合性的研究兼具理論上的推論性和應用上的可預測性。
筆者以組織管理中某大型互聯(lián)網(wǎng)公司中“影響團隊創(chuàng)新能力的因素”為例來簡述這一過程(Luo & Gao,2021)。我們收集了該公司兩萬余名員工形成的三千多個團隊從2014年到2018年的五年期資料。本案例采用的研究思路如下:第一,在探索性研究部分,回顧已有文獻中影響團隊創(chuàng)新的因素,整合大數(shù)據(jù)與結構化數(shù)據(jù)并計算表征上述影響因素的指標,形成指標體系,針對“團隊是否具有高創(chuàng)新能力”這一問題建立預測模型,依據(jù)預測模型作可解釋機器學習模型(interpretable AI)分析,對特征重要性、特征之間的關系進行詮釋。第二,在探索性研究啟發(fā)驗證性研究部分,針對探索分析得到的、但已有理論未提供解釋的新的發(fā)現(xiàn),使用反溯推理(abductive reasoning)(Peirce,1893)提出假設,驗證假設并得出結論,從而對預測模型的黑箱作出進一步解釋,由此完成先探索后驗證的整合研究。
本案例數(shù)據(jù)來源主要有兩部分,一部分是全公司員工參與項目和培訓課程的帶有時間戳的印記化記錄,包括其參加項目和課程名稱的文本,還包括團隊內(nèi)面試官對新招聘員工擁有的知識和技能的評價文本等非結構化數(shù)據(jù)。另一部分為這些團隊的創(chuàng)新獎勵記錄、員工個人信息等結構化數(shù)據(jù)。已有影響團隊創(chuàng)新的因素主要包括:團隊在合作網(wǎng)絡中的位置(團隊對外獲取異質(zhì)知識、資源的能力)、知識與技能、團隊內(nèi)網(wǎng)絡密度(團隊內(nèi)成員的互動特征)、團隊規(guī)模、團隊成員組成(相似性和異質(zhì)性)等。因此筆者對團隊創(chuàng)新能力、團隊合作網(wǎng)絡位置以及員工知識進行定義和測量,并從數(shù)據(jù)中得到相關的指標。
為了測量團隊在合作網(wǎng)絡中的位置,筆者根據(jù)員工參加項目記錄,將員工作為節(jié)點,如果兩個員工在同一時間段共同參與同一個項目,則二者之間就形成了一條項目合作的連邊。由于員工本身嵌入在正式的團隊中,最終可以形成嵌入在同一或不同“團隊”中的員工與員工之間項目合作網(wǎng)絡,進而計算相關網(wǎng)絡指標來表征團隊在合作網(wǎng)絡中的位置以及團隊內(nèi)的互動特征。
員工培訓課程中的知識多樣性主要通過員工參加培訓課程的記錄來計算。因為培訓課程知識為文本數(shù)據(jù),需要通過人工標注的方式對其中涉及的知識作分類,形成每一個團隊中“員工—獲取知識分類”的矩陣,并使用信息熵計算團隊中員工通過參加培訓課程獲得知識的多樣性。
招聘員工知識的多樣性則基于面試官對新招聘員工知識和技能的評價文本,通過自然語言處理技術,提取出新聘員工技能的實詞,再利用詞向量和詞嵌入的方法表示出文本特征。最終所有員工知識和技能點在嵌入空間中的平均距離即可表示出員工知識的多樣性。
通過對結構化數(shù)據(jù)庫的分析,可以得到團隊的創(chuàng)新能力、團隊成員組成的性別、職級、工作類型多樣性,以及平均年齡、任期、團隊規(guī)模等。
基于上述建立的指標體系,隨機篩選50%的樣本建立針對“團隊是否具備高創(chuàng)新能力”的預測模型,使用十折交叉驗證的方法以保證結論的穩(wěn)健性,剩下50%的樣本用于后續(xù)驗證性分析。以50%作為訓練集,50%作為測試集建立預測模型,使用多種預測模型的實驗中得到XGBoost預測模型準確率最高,平均準確率為76%。接下來作預測模型的可解釋AI分析,使用SHAP模型,對指標重要性進行排序并篩選重要指標,得到除團隊成員構成的其他指標外,“參加培訓課程知識多樣性”“合作網(wǎng)絡E-I指數(shù)”“新員工知識與上一年入職新員工知識差異”“團隊內(nèi)合作網(wǎng)絡密度”(不分先后)這些指標對于團隊創(chuàng)新能力的提高影響最大。在此基礎上,筆者對這些變量之間的交互關系與團隊高創(chuàng)新能力關系做了進一步的探索,發(fā)現(xiàn)培訓知識多樣性和新員工與上一年入職員工知識差異的交互作用有利于提高對團隊創(chuàng)新能力的預測準確率,而在已有理論中卻缺少知識和網(wǎng)絡之間的交互關系對團隊創(chuàng)新能力影響的闡述。
綜上,在建立預測模型和可解釋模型的探索中,得到三個結論:(1)合作網(wǎng)絡對外開放程度對創(chuàng)新能力的積極效果(Burt,2004;Carnabuci & Diószegi, 2015)。(2)團隊員工參加培訓知識多樣性是影響創(chuàng)新的重要指標(Tannenbaum & Yuki, 1992;Brown & Charliez, 2013)。(3)招聘知識多樣性高,或與上一年入職員工知識異質(zhì)性高的員工進入團隊,可以為團隊帶來更異質(zhì)的想法,增強團隊創(chuàng)新能力。
針對上述幾個因素之間的交互關系對于團隊創(chuàng)新能力的影響在已有理論中缺少解釋的現(xiàn)狀,啟發(fā)我們在理論上來進行推理(reasoning),發(fā)展理論并開展驗證性研究(Shrestha et al.,2021)。基于此,在驗證性分析部分,筆者提出并驗證了團隊在合作網(wǎng)絡中的位置和團隊員工培訓課程學習知識的多樣性分別受到新注入的知識的多樣性(即招聘知識與上一年入職員工知識的差異)的調(diào)節(jié),對提高團隊創(chuàng)新產(chǎn)生積極的影響。
首先提出假設。由于在網(wǎng)絡中多樣化的知識對于創(chuàng)新的積極效果受到傳播過程異質(zhì)信息快速同質(zhì)化的影響,學習多樣化知識很難長期維持團隊的高創(chuàng)新能力。而“注入”知識多樣性的員工會給網(wǎng)絡帶來一個積極的“震動”,改變團隊在網(wǎng)絡中組織知識的方式,使得團隊可以更好地利用網(wǎng)絡中異質(zhì)的結構和內(nèi)容的創(chuàng)新優(yōu)勢,帶來更多的想法,改變已有成員的認知結構(Perretti et al.,2006),進而調(diào)整成員固有的看待已有知識的方式,塑造他們新的認知,為創(chuàng)新帶來新的活力。因此,我們提出了假設1。
假設1:新加入員工與上一年入職員工知識的差異正向調(diào)節(jié)團隊培訓知識多樣性對提高團隊創(chuàng)新能力的正向影響。
一個團隊中的員工有更多的團隊外的合作者有利于團隊成員與更多的不同工作模式和知識特征的團隊進行交流、資源共享,因此有助于團隊創(chuàng)新。但是,由于長期穩(wěn)定合作的團隊之間已深諳彼此交互的術語,這種例行的合作模式會導致團隊之間在合作中變得僵化(Morrison,2002;Perretti & Negro,2006)。因此,團隊中有新的成員加入,會對團隊之間的合作者重新思考合作方式和互動模式產(chǎn)生影響。因此,筆者認為,與已有成員相比,具有異質(zhì)知識的新成員的加入不僅會讓已有合作網(wǎng)絡中的成員重新思考他們與新成員的工作配合方式,舊的合作關系下的成員之間也會重新調(diào)整和思考他們合作的策略與模式。帶有異質(zhì)知識的新成員加入合作網(wǎng)絡會增強團隊在跨團隊合作網(wǎng)絡中的優(yōu)勢地位。因此提出假設2。
假設2:新的帶有異質(zhì)知識的員工的加入正向調(diào)節(jié)團隊在合作網(wǎng)絡中的開放度(E-I指數(shù)來衡量,越大代表開放度越大)對團隊創(chuàng)新的積極影響。
使用上述隨機劃分的剩余50%的數(shù)據(jù)集,筆者使用面板數(shù)據(jù)進行回歸分析,得到在控制歷史創(chuàng)新能力和其他影響團隊創(chuàng)新因素的基礎上,合作網(wǎng)絡E-I指數(shù)和新入職員工與上一年入職員工知識差異的交互作用對維持團隊創(chuàng)新能力存在積極的效果(β=0.025,P<0.001),員工培訓課程知識多樣性和新入職員工與上一年入職員工知識差異的交互作用同樣對維持團隊創(chuàng)新能力存在積極的效果(β=0.019,0.001
綜上,第一階段探索性分析中二者之間的特征交互作用對團隊創(chuàng)新能力影響的探索結果在理論上獲得了解釋,后續(xù)研究可以根據(jù)探索性分析得到的其他洞見來形成更多值得驗證的理論假設。
通過對大數(shù)據(jù)的充分利用,本案例使用了綜合的、擴展的測量指標,建立了具有較好預測準確率的預測模型,對影響團隊創(chuàng)新解釋機制做出了理論上的貢獻。同時,通過這個研究案例還可以看出,非結構化與結構化數(shù)據(jù)的融合可以形成較大規(guī)模的樣本量,探索性和驗證性研究中使用不同的數(shù)據(jù)集進行探索和驗證,避免使用同一批數(shù)據(jù)既做擬合又做驗證,能夠在很大程度上檢驗以往研究中理論可重復性低的問題(Nosek et al.,2015)。
以上案例展示了從探索性研究到驗證性研究的一條演進道路。此外,還有研究先基于理論假設作驗證,再使用預測模型探索重要特征(Christoph et al.,2021),也有研究同時建立預測模型和可解釋模型,二者之間不斷對話,啟發(fā)理論創(chuàng)新。例如在2018年發(fā)表在《自然》雜志上的一篇文章(Awad et al.,2018)收集了223個國家4000萬參與者對于自動駕駛汽車決策選擇的數(shù)據(jù),通過探索性和驗證性整合研究來啟發(fā)新的心理學理論,發(fā)現(xiàn)了以往忽略的自動駕駛汽車的一些倫理規(guī)范問題,例如人類決策過程的內(nèi)在沖突、人際沖突、倫理道德的文化差異等。在此基礎上,后續(xù)研究(Agrawal et al.,2020)使用該數(shù)據(jù)對預測模型和決策心理模型進行了對話和相互的修正,針對預測模型和心理模型預測結果差異較大的樣本進行分析,獲得在具體決策情境下,一些在心理模型中未被注意到的幾種因素的交互關系對決策的影響,啟發(fā)作者提出理論假設并做出實驗驗證,使得心理可解釋模型更加完善。最終得到了僅由22個參數(shù)組成的心理理論模型,相比于未考慮交互項但具有超過3000個參數(shù)的深度學習模型,該模型兼?zhèn)涓哳A測精度和可解釋性。正如魯丁(Charles Rudin)所強調(diào)的,在高風險決策中僅僅依靠預測模型及其特征重要性分析是非常危險的,應該輔以嚴格的驗證性分析,結論才具有可靠性和推論性(Rudin,2019)。
綜上,大數(shù)據(jù)(或與結構化數(shù)據(jù)整合)的探索性和驗證性相結合的研究可在理論解釋模型上提供新的洞見,具體包括:(1)獲得新的理論的測量指標、測量方法,或者對原有缺少可解釋性的指標進行拆解或重新劃分。(2)獲得不同指標之間的交互關系與因變量可能存在的因果關系。(3)獲得在社會治理、知識決策、政策干預上新的洞見和啟發(fā)。將這種探索性和驗證性的研究綜合起來,可以獲得理論上的可解釋性和較高的預測性。
七總結與討論
融合大數(shù)據(jù)與社會科學理論的研究方法開始見諸學術期刊不過二十年左右的時間,大量的文章則在最近幾年才出現(xiàn)。相比社會科學漫長的歷史來說,社會計算驅(qū)動的社會科學研究方法論方興未艾,整體上來說還處于不斷摸索前進的階段,本文主要在方法論上做了一個階段性小結。本文對社會科學理論的探索性研究、驗證性研究以及數(shù)據(jù)取得的三種不同方法(收集電子印跡的大數(shù)據(jù)、整合大數(shù)據(jù)與結構化數(shù)據(jù)庫或問卷調(diào)查的數(shù)據(jù)以及互聯(lián)網(wǎng)實驗數(shù)據(jù))劃分了五類研究方法,并對每一類研究方法給出了一個梗概的介紹。不排除將來還有更多的研究進路被發(fā)現(xiàn)和使用。毋庸置疑的是,社會計算驅(qū)動的社會科學研究新方法論,深刻地改變了整個社會科學的理論發(fā)展與研究范式。
需要強調(diào)的是,與早期的大數(shù)據(jù)研究僅強調(diào)歸納而忽略因果、演繹推理不同,社會計算更多強調(diào)用理論指導計算機技術探索并解釋社會規(guī)律和模式,與社會學理論形成密切的對話,最終用于啟發(fā)、驗證或修正理論。
當然,如前文所述的方法還存在很多的缺陷和挑戰(zhàn),需要有志于此的學者作更多的貢獻。
首先,將社會計算研究用于政策干預和指導存在較大的挑戰(zhàn)。邦德等人研究中涉及6100萬人的實驗并形成干預,這類研究不僅僅立足于解釋和預測,更重要的目標是達成有利于社會發(fā)展、降低不平等(Bond et al.,2012;Blumenstock,2016)的干預,但此類研究還是鳳毛麟角。
其次,幾種研究方法可能帶來一系列法規(guī)、道德和倫理的問題,需要研究人員謹慎對待。大數(shù)據(jù)和人工智能的研究本身就帶來了一系列的科學倫理問題(Poldolny,2001)。具體來說,第一,要特別注意保護被分析對象的隱私。在使用“自然數(shù)據(jù)”時,一部分數(shù)據(jù)并非來自公開網(wǎng)站(例如智能手機數(shù)據(jù)),一部分數(shù)據(jù)雖然來自公開網(wǎng)站但不等于用戶希望別人看到自己被分析的結果——例如一個人愿意在Facebook上向好友公開他的信息,但不等于他愿意公開通過其Facebook數(shù)據(jù)預測到他罹患抑郁癥(de Choudhury et al.,2014)或者是男同性戀(Kosinski et al.,2013)的結論。雖然研究論文使用和報道的數(shù)據(jù)經(jīng)過匿名化處理,但是最近一些研究發(fā)現(xiàn)可以通過這些匿名數(shù)據(jù)反推到個體(de Montjoye et al.,2013,2015)。所以在報告研究結果和共享研究數(shù)據(jù)時要非常謹慎,避免其他研究人員通過技術手段反向識別數(shù)據(jù)對象的身份。第二,在開展互聯(lián)網(wǎng)實驗時,有些時候為了實驗效果,受試者并不知道自己處于實驗環(huán)境下,研究人員必須充分評估實施實驗對受試者的情緒和心理造成的影響。第三,對于分析結果和結論的公開也要謹慎。譬如數(shù)據(jù)分析和生物、物理實驗可能會揭示不同種族的人群因為基因或者其他原因?qū)е碌闹橇?、體力和心理的差異,這些差異的公開可能反而會將弱勢群體置于更不利的位置。
結合本文所給出的幾種研究方法類型,在社會科學理論指導下的社會計算研究可總結為驗證性研究和探索性研究,或是兩者的結合。固然在單一論文中這五類研究方法多是單獨使用的,但在系列研究中,探索性與驗證性研究卻應在如圖1所示的理論、數(shù)據(jù)挖掘和模型的三角對話中一輪又一輪地交互進行。伴隨著理論、數(shù)據(jù)挖掘和模型的三角對話,這一過程中同時存在著演繹法和歸納法。
一方面,社會科學理論可以為大數(shù)據(jù)挖掘提供指導,選擇更適合刻畫研究對象的指標,實例化或修正算法。另外,理論還可以為機器學習模型或者動態(tài)模擬模型的建立提供靈感或直接支持。得到模型后也需要繼續(xù)與理論進行對話,判斷是否與已有理論一致,如果一致則為理論的驗證,如果不一致則對模型進行影響準確率因素的分析,以不斷修正模型。
另一方面,隨著數(shù)據(jù)驅(qū)動的預測模型的建立,數(shù)據(jù)挖掘結果和機器學習模型同樣可以啟發(fā)探索新的理論方向,驗證或挑戰(zhàn)已有理論。當理論與機器學習模型不一致時,通過對模型作可解釋人工智能算法、定性調(diào)查、分錯誤樣本溯因,綜合判斷是否需要對理論進行修正和重新闡述,可提出相應的命題(Evans et al.,2020)。同樣,因數(shù)據(jù)驅(qū)動而建構的模型后續(xù)還可繼續(xù)根據(jù)提出的命題來完成驗證性研究。這些例子可以在本文第二部分和第四部分中找到。
本文所討論的驗證性研究可以粗略地分為三類。第一類是利用數(shù)據(jù)挖掘結果和機器學習或動態(tài)模擬模型,提供理論修正或重建洞見。這只是完成了弱模型(weak model)的建立,接下來可根據(jù)探索性研究提出的命題,繼續(xù)結合理論提出嚴格的理論假設,再收集大數(shù)據(jù)、建立因果模型、驗證假設,最終得出更具推論性的結論。第二類是利用大數(shù)據(jù)與結構化數(shù)據(jù)的整合進行理論驗證。結構化數(shù)據(jù)庫或問卷調(diào)查可以提供扎根真相,因果模型可以驗證理論假設,大數(shù)據(jù)則可以測量和計算更多相關指標,從而極大地豐富傳統(tǒng)社會科學理論研究議題。第三類則是根據(jù)理論設計大規(guī)?;ヂ?lián)網(wǎng)實驗。
如本文第四部分所描述的探索性研究案例,可以在一輪又一輪的三角對話中,與某一研究相關的各類型數(shù)據(jù)整合在一起,預測模型被建立且在修正中準確度不斷提高,由此社會科學的理論可以得到更深入的發(fā)展。從探索性到驗證性的完整研究在第六部分案例中有所展示。
很多學科都曾因為理論和方法的突破而產(chǎn)生重大轉(zhuǎn)折。這個轉(zhuǎn)折期往往群星璀璨,碩果累累。20世紀初期量子力學理論對物理學的影響、20世紀后期基因測序技術對生物學的影響就是非常典型的例子。筆者認為,社會科學這一歷史悠久的學科正在因為大數(shù)據(jù)和人工智能技術的引入而經(jīng)歷一次重大的轉(zhuǎn)折。希望在可見的未來可以有更多新鮮的血液,在一個學科發(fā)生重大轉(zhuǎn)折的開始時期就注入進來,從而將此一新方法深植在社會科學研究之中。
審核編輯:郭婷
-
人工智能
+關注
關注
1791文章
46697瀏覽量
237182 -
大數(shù)據(jù)
+關注
關注
64文章
8856瀏覽量
137222
原文標題:社會計算驅(qū)動的社會科學研究方法
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論