學術研究的目的是理解世界,而不是爭論定性定量孰優(yōu)孰劣!
本文作者為中國大學公共管理學院副教授張楠迪揚,首發(fā)“公共管理評論”,由于原文太長,特作整理節(jié)選,特此分享。作者認為,社會科學研究的定性與定量方法之爭由來已久,但定性與定量方法在服務于理解世界時,不存在本質的分歧,但作為研究工具具有不同的優(yōu)點,而在運用方法之前,研究者須主動、深入了解研究對象,并對研究者的身份、基本概念、研究目的與研究方法有自覺意識,并此以為選擇方法的依據(jù)。
?

社會科學研究在定性與定量研究方法上向來紛爭不休。即便試圖彌合爭論的學者也帶有明顯的偏愛立場。就方法言方法,可能很難跳出爭論。方法是研究工具,研究者選用工具是為了更好地理解我們所生活的世界。如果定量與定性方法承認研究者試圖理解的是同一個世界,兩種方法則不存在目的上的分別。至于如何對待認識論上的分歧,或許我們更應該回歸研究本身,以及研究背后的哲學基礎。哲學層面的元問題先于對因果的關注,先于對方法與技術的討論。
理解與闡釋:先于定性與定量之爭的元問題

做研究的根本目的是理解世界,這是先于定性與定量方法之爭元問題。不論定性與定量研究,其目的都是更好地理解我們所生活的世界?!袄斫馐澜纭钡暮x可以分為兩個層次,一是了解與闡釋;二是分析并探究因果機制和影響。理解又分為兩個層面:一是了解事實,二是理解意義。
理解的第一個層次是“了解事實”。研究者要了解事實,首先要明白何為“事實”,如何可以做到“面向事實”?!笆聦崱笔钦嬲嬲l(fā)生的事情。社科研究中,“事實”主要指人類行為與各種社會關系的總合。如何了解人類行為及各種社會關系呢?這需要研究者明確地認識自身與研究對象的關系,擺正有自覺意識的認識姿態(tài)。
近代西方哲學在認識論的脈絡上有兩派分野。第一派是“主客二分”,標志是笛卡爾開啟的主體性認識論。笛卡爾的“我思故我在”確定了近代哲學主體性的存在,標志著主體性的覺醒。這是一種“主客體二分”的認識論。研究者將自我之外的研究對象當作客觀存在與客體來認識和分析。主客二分的認識方式是一種以研究者的地位為主體的認識方式。
第二派是主體間性?,F(xiàn)象學宗師胡塞爾開啟了對認識論主體間性的討論。胡塞爾認為,事實是存在本身所顯現(xiàn)的樣子。了解事實需要研究者從顯現(xiàn)的事實那里,如事實本身所呈現(xiàn)的那樣,來了解事實本身。如何以事實本身所呈現(xiàn)的方式認識事實?這就需要從事實的角度了解事實本身。胡塞爾提出了“主體間性”,強調研究者主體之外的人,不是只能成為主體思維對象的純粹的、靜止的客體,而是成為與研究者相同的認識主體。研究者應通過“移情”或“同感”等技術,感受其他主體本身的生存狀態(tài),并以其他主體自在的呈現(xiàn)方式作為研究的出發(fā)點。然而,即便處于對其他主體主動的、同情式的理解,胡塞爾的主體間性仍然遭遇了“主客二分”的批評。
海德格爾(Heidergger))將胡塞爾認識論主體間性,推進到本體論的主體間性,強調主體間的交往與共在。這將以往的靜態(tài)“事實”推進到動態(tài)的對“關系”的理解。哈貝馬斯提出并推崇理解、溝通的交往主體間行為,注重對“事實”在社會關系層面上的理解,是社會科學研究中社會網絡研究的哲學基礎。
作為社會科學研究的認識論基礎,第一派“主體論”強調研究者“以我為主”,第二派認識論主體間性強調“理解他人”,本體論主體間性強調“理解關系與互動”。實際研究中,研究者的三種身份應是融合的統(tǒng)一體,主動做出基于設身處地理解他人與社會關系的行為。
在具體推進方式上,了解事實遵循的原則是經典的“3W原則”,即發(fā)生了什么、參與主體有誰、如何發(fā)生的。這個原則的實際運用往往并非是線性的。研究者在研究之初盡量有意識地懸置“偏見”,懸置研究預設,盡情感知事實、感知資料,這是必要的研究步驟,更是寶貴的素質和能力。研究者也許最初確定的研究主題與最終確定做的題目完全不同,這是研究過程中常見的情況,既不必在感知到新課題時,為放棄本來的課題而慌張;更不能因噎廢食,不做理論與經驗準備就進入田野。真正有意思的研究題目很可能是在扎實的學術積淀與在田野中經驗的碰撞中不期而遇的。
孔飛力的《叫魂:1768年中國妖術大恐慌》摘獲了1990年美國“列文森中國研究最佳著作獎”,成為多年來政治學科理解帝制中國的經典必讀書目。然而孔飛力在1984年來到北京,在第一歷史檔案館翻閱史料時,完全沒有想到會寫出這本書。他最初計劃的研究對象是清政府內部的通信系統(tǒng),而“剪辮案”只是他分析清政府通信體系影響政策運作的一個證明性案例。隨著對資料的不斷深入理解和反復閱讀,孔飛力很快就轉而專門研究“叫魂案”及其背后所揭示的權力運行機制。孔飛力對研究主題的轉變恰是在不斷增加對史實了解的情況下做出的決定。
誠然,可以作為學科訓練的技能包括撰寫訪談提綱、訪談與觀察、收集資料的方法等,然而,掌握了相同技術的不同研究者觀察同一事物的所得仍然不同。技術訓練能保證初學者不犯簡單錯誤,但進入田野,能收獲什么,取決于研究者的個體差異,一千個讀者心中有一千個哈姆雷特。這是定性研究方法難教、難學的部分,需長期浸潤、耳濡目染、積累感受,才可觸類旁通。但同時也是研究之所以可以豐富有趣之處。

馬林諾夫斯基和土著打成一片的田野工作者形象
“理解”的第二個層面是理解意義。闡釋與分析即賦予事實以意義,這是社會科學研究的重要環(huán)節(jié)。闡釋意義要求將事實還原到其本來的情景。“看到”不等于“看見”。如果研究者沒有意識到自己與研究對象的關系,并努力從事實本身出發(fā)理解事實,則可能任憑自己的猜想闡釋事實。猜想中可能包括知識結構、性格、經歷等諸多原因導致的偏見,就容易犯張冠李戴的錯誤,把統(tǒng)計相關解釋成因果相關,或者主觀賦予統(tǒng)計相關以因果意涵。理解意義絕不是閉門造車,或在匱乏經驗支持的前提下分析數(shù)據(jù)可以實現(xiàn)的。理解意義要求研究者必須深入現(xiàn)實、深入實踐,長期觀察、反復揣摩。但時間并不是“理解意義”的保證。絕大多情況下,我們并不能期許長期泡在田野里一定會有驚天動地的發(fā)現(xiàn)。但幾乎可以肯定的是,脫離現(xiàn)實情景的論斷,很有可能成為空中樓閣。因此格爾茨強調要將文化當成一個文本看待,用“深描”闡釋文本的意義。有關“深描”的意義,最經典的是格爾茨的“眨眼”例子。同是“眨眼”的動作,所表達的意義可能截然不同,可能是無意地抽動眼皮,可能是向密友投去的暗號,可能是惡作劇模仿,也可能是小丑在舞臺上表演示意,或更多其他含義。到底是什么意義,需要深入理解情景(Context),理解這個動作發(fā)生的文化及社會背景?!吧蠲琛笔堑湫偷娜祟悓W研究方法,通過對細節(jié)的洞見對意義進行闡釋。格爾茨的另一本念書《尼加拉:十九世紀巴厘劇場國家》是他對“深描”方法的操作示范。通過對細節(jié)進行其所在情景的分析,格爾茨揭示了巴厘人帶有展示和表演形式的權力關系。在格爾茨的研究之前,書中揭示的這種關系長期為西方世界所忽視,是學術界的盲區(qū)。
概念與分類
蘇格拉底以降,知識是關于一般和典型的思考,以便指導未來,降低人類社會對不確定性的焦慮和不安。而任何對知識的追求與討論都始于概念。概念先于任何有關方法的定量與定性之爭。概念是我們理解世界的基本工具和出發(fā)點。定量與定性研究都會面對界定概念與分類的工作,因此理解概念與分類的哲學基礎十分重要。
社會科學研究的起點是對論斷與觀點的文獻回顧,較少討論不同研究者對核心概念本身含義的共識和爭論。很多情況下,研究者假設大家已經對核心概念有共識。實際上,大家不過是使用同樣的詞語自說自話。這種情況下,我們則把研究置于一個巨大而模糊的想象空間。概念的內涵需要辨析,以確保不同研究者在同一個概念平臺上交流和爭論。
然而,辨析概念的過程是極端痛苦的。蘇格拉底之死就是一個辨析概念致死的故事。蘇格拉底喜歡通過詰問的方式辨析概念的含義。比如,蘇格拉底希望年輕人做正直的人。關于對“正直”的定義,蘇格拉底通過舉例提出臨時定義,然后在不斷對年輕人的詰問過程中,補充新的內容,去掉沖突的內容,擴大或縮小概念的內涵外延,直到達到滿意的結果。作為鼻祖的蘇式歸納法在社會科學研究多派方法中都可找到蹤影。但也正是因為如此,很多青年人在被蘇格拉底窮追猛問的過程中瞠目結舌,因自己暴露出的“無知”惱羞成怒。雅典人更認為蘇格拉底是戕害年輕人思維的罪魁禍首。可見,人們在尋找嚴肅交流基礎的第一步就遭到了巨大阻礙。然而人類社會正是在用各種概念構建人文、社會科學領域的知識大廈。
概念之上有分類?;诟拍畹姆诸愂莿澐值挠^念,是一種簡化或者降維,歸根結底依舊源于人類對復雜世界掌握的渴望,以及對復雜中不確定性的抗拒和排斥?!胺诸悺痹O置了一個社會的基本范疇,嚴格約束著人們的心靈及思維活動,并成為一切社會關系的基礎。
亞里士多德首先提出了分類思想。然而,涂爾干認為,“分類絕不是人類由于自然的必然性而自發(fā)形成的”。雖然模糊中我們可以感到不同事物的相似之處,但“一個類別就是一組事物;可事物卻從來沒有依據(jù)這樣的形式進行歸類而呈現(xiàn)在我們的視野中?!币虼?,涂爾干提出他有關分類的核心問題:究竟是什么使人們采取這種方式來安排他們的觀念的,人們又是在哪兒發(fā)現(xiàn)這種獨特配置的藍圖的。

涂爾干在《原始分類》中分析了澳洲、祖尼人、蘇人,以及中國的原分類范疇。比如,祖尼人將首先將空間分成東、西、南、北、上、下、中七個方位,祖尼文化的其他分類都建立在七分方位的基礎上。類似祖尼文化的當代案例并不少,如果不能了解與理解這種文化的分類基礎,恐怕后續(xù)因果分析會無限尷尬。對基本概念和分類匱乏情景理解的定性因果分析可能會強詞奪理,定量分析至多止步于統(tǒng)計相關的張冠李戴。
加里·格爾茨和詹姆斯·馬里奧在《兩種傳承》中提出了定量與定性方法在分類方式上的分野。兩位作者同時認為,定性研究者通常堅持不同類屬的邊界應該互斥,并通過語義學的方法界定類屬;定量研究者則以編碼方式模糊不同類屬之間的邊界,試圖使不同概念變得更有連續(xù)性。其實這并非兩種方法的分歧,而是不同簡化程度的分別。
當對一個變量做二值(0-1)處理時,定量與定性都對變量做了非此即彼的分類。而對同意類屬進行不同程度的分類,雖然定量處理的連續(xù)感更強,但依然要做出類別劃分。純粹的連續(xù)變量不涉及分類。而更易成為爭論焦點的或許是分類標準,因為這在很多時候體現(xiàn)的是研究者的眼光。大數(shù)據(jù)時代,目前海量的自然語言文本分析的熱點包括主題模型(LDA)以及利用主題模型進行情感分析等。具體技術層面涉及數(shù)據(jù)挖掘、機器學習等。但大數(shù)據(jù)時代更多的是要求人們提高甄別數(shù)據(jù)、收集與分析數(shù)據(jù)的技能,這并未沖擊范疇在哲學層面上的討論。
理論建構:基于扎根方法

理論建構是社會科學研究的主要目的,因為理論可以讓我們以清晰、確定的方式理解世界。理論是一組充分發(fā)展的概念及概念間關系的陳述,構成可用于解釋或預測現(xiàn)象的統(tǒng)合型架構。目前的社會科學研究中,定性研究更多承載著建構理論的功能。這主要是因為一個理論通常涵蓋多個概念、多種關系、多個因果關系、多條因果路徑與機制,需要與之相匹配的研究方法也具備較為宏觀的視野和寬廣的涵蓋范圍,這恰是定性方法的長處。
理論建構是一個對復雜事實抽象與概括的過程。源于人類學的扎根理論(“必記本”注:Grounded Theory),這是目前較成系統(tǒng)、應用較為普遍的建構理論的定性方法。扎根理論是由斯特勞斯(Strauss)和格拉斯(Glaser)創(chuàng)立的。扎根理論的本意是將研究者的分析、邏輯推演與理論建構建立在“資料”的基礎上,把“根”扎在“資料”中,扎在田野里。扎根理論認為,研究者在研究之前并不真正了解事實,無須一般理論預設,而是需要在田野中進行訪談,收集資料,經過多級編碼過程,逐漸提取核心概念與框架,最終實現(xiàn)對研究對象解釋性框架的建立。
建構理論不可能是一次性研究行為,扎根理論強調長期、反復出入田野,通過資料收集不斷豐富對事實的了解,修正與精煉研究問題。這對研究者來說是個極其痛苦和奢侈的過程,不僅耗時長,而且與研究者所希望達到的對研究的掌控感相悖。但經過這個過程發(fā)現(xiàn)真正觸及心靈、令自己喜悅的研究問題,才是更有沖擊力的好問題。
美國耶魯大學的詹姆斯?斯科特(James Scott)是政治學系屈指可數(shù)的政治人類學家,他的名著《弱者的武器:農民反抗的日常形式》(The Weapon of the Weak: Everyday Forms of Peasant Resistance)分析了人們對馬來西亞農民日??範幮问降恼J識,這是他長期扎根馬來西亞農村與當?shù)剞r民深入互動的結果。
因果關系與機制
因果關系是構成理論的重要組成部分。探究與驗證因果關系、闡釋因果關系毫無疑問是社會科學研究關注的核心之一。大衛(wèi)·休謨(David Hume)開啟了思想界對因果關系的探討與界定。在《人類理解和道德原則研究》中,休謨提出因果關系需滿足的兩個條件:恒隨性(定義1),即原因是一個物象隨后的物象;反事實性(定義2),即第一個物象不出現(xiàn),第二個物象將永遠不會出現(xiàn)。雖然,休謨對因果關系的界定遭到了若干批評,但這無疑是研究因果關系的重要開端。特別是統(tǒng)計方法被廣泛應用到社會科學研究后,因果關系需滿足三個條件:恒隨性(定義1),反事實性(定義2),統(tǒng)計相關性(定義3)。
很多學者認為因果關系的核心是因果機制。因為建立因果關系后,人們很自然會問因果關系是如何發(fā)生的。這個問題會讓展示統(tǒng)計相關后對機制進行隨性想象的研究陷入尷尬。因果機制是原因的效應傳遞到結果的過程,這一過程被社會學家認為是理解因果的必要信息。任何發(fā)展較好的理論都會討論因果機制。因果機制應該如何識別并分析,定性與定量方法似有不同。定性研究者認為,大樣本統(tǒng)計發(fā)現(xiàn)如果不能獲得經驗支持,則無法證明存在因果機制,統(tǒng)計發(fā)現(xiàn)只能是統(tǒng)計相關。比如,科利爾(Collier)和赫夫勒(Hoeffler)費倫(Fearon)和萊廷(Laitin)通過對跨國數(shù)據(jù)的分析,發(fā)現(xiàn)人均GDP與內戰(zhàn)呈現(xiàn)顯著負相關。科利爾和赫夫勒認為,貧窮影響經濟機遇,進而增加內戰(zhàn)發(fā)生幾率。費倫和萊廷認為,國家避免內戰(zhàn)的能力是其間的因果機制。桑班尼斯通過深度個案研究認為,兩者提出的機制解釋均缺乏經驗事實,人均GDP很可能只是在與其他變量的交互作用下發(fā)生影響。因此,定性研究者認為個案內分析(Within-Case Analysis)與過程追蹤(Process Tracing)可以發(fā)現(xiàn)原因導致結果的經驗證據(jù)。定量研究也在做著同樣的努力,探究中介變量(Mediator)的影響,構建結構方程模型(SEM)的分析是對傳導機制與影響路徑的研究。

然而,少有研究分析原因傳遞到結果的“過程”到底是什么。這一過程是多因串聯(lián)傳遞的因果鏈條,還是一個只能由先后發(fā)生的細節(jié)填充的“因”與“果”兩點間的距離?KKV認為因果機制不要求對因果性有新的解釋。但在一對因果關系被證明之前,很難說“因”與“果”之間的所謂“機制”是否真的應該被當作“機制”,這其間還蘊含著多少未知的豐富內容。比如,《兩種傳承》中提到一個研究案例:長期的跨國定量研究顯示,經濟發(fā)展和民主正相關。這一論斷被政治學、社會學認為是最穩(wěn)健的發(fā)現(xiàn)之一。然而《兩種傳承》的作者認為,這個研究對于任何人來說都是未完成的,它留下了一個黑箱,而且“不允許學者去評估其他備選的機制理論……定性研究者必須用詳盡的分析來充盈黑箱……為了區(qū)分出在因果關系被建立之前的機制,人們必須走出統(tǒng)計相關,走向定性分析”。
這涉及《兩種傳承》中提到的另一個問題:對稱性與非對稱性。作者認為定性方法具有非對稱性,原因是定性研究強調殊途同歸,多種原因可導致同一結果;定量研究因其單因果性而具有對稱性。這是作者所認為的定量與定性方法在因果關系與機制上的分野。實際上,兩位作者犯了并未統(tǒng)一比較前提的錯誤。嚴格意義上,這并非定性與定量方法在認識論上的差別。單一定量研究和單一定性研究的涵蓋面不同。定性方法追求宏大視野,目的是建構理論,尤善多因素、多維度分析,可縱橫捭闔;單一定量研究通常關注一個主要感興趣的自變量對因變量的影響。
當然,單一研究通常建構多個模型,自變量的數(shù)量依然是有限的。這是定量研究的局限,然而模型的“簡潔”正是統(tǒng)計與量化研究之美。這也是定量研究實現(xiàn)漸進式知識積累的方式,通過對不同自變量細致的測量與分析,并測算其對因變量的影響,獲得一種可度量的確定性。如果把探究同一因變量的不同研究匯總,很難說定量研究是《兩種傳承》作者所認為的“對稱”。在這個意義上,定量與定性方法并不存在認識論上的沖突。
因果推論
因果推論是證明因果關系的過程。定性與定量方法在證明因果關系上的方式顯著不同。定性方法是以自然語言為分析工具,通過邏輯推理的方式分析研究者收集的資料與數(shù)據(jù)。在KKV看來,相當數(shù)量的定性研究,由于沒有達到因果推論的標準,仍停留在描述階段。他們認為很多描述性推斷研究刻意回避進行因果推論,他們更希望自己手頭掌握的能夠不言自明。然而,KKV也承認,量化研究雖然可以獲得精準性(Precision),但未必可以獲得準確性(Accuracy)。獲得準確性在根本上要依靠研究者的洞見。
對于符合因果推論的標準,社會科學研究中,即便對定量方法來說也是十分困難的。古希臘哲學家赫拉克利特有言:人不能兩次踏入同一條河流。對于一個給定的個案,歷史不可能重演。這是目前統(tǒng)計學對于個案反事實在因果推斷上的基本認識。用定量思維方式表述,因果推斷的基本問題是:不可能觀測到同一個單元的Yt(i)與Yc(i)的值,因此,不可能觀測到t對i的影響。實驗法是定量方法回應反事實問題的主要工具,包括自然實驗、準實驗法、中斷或其他強有力的設計。然而,無論是定量方法基于概率論的平均主義,還是定性方法的“最小重寫原則”(“必記本”注:Minimum Rewrite Rule),歸根結底是對反事實問題的無奈。
展示統(tǒng)計相關與估計參數(shù)是定量方法大顯神通的領域。各類定量研究方法課程主要傳授的是這部分內容,建立回歸模型分析感興趣的自變量對因變量的影響。展示統(tǒng)計相關的分析主要包括收集數(shù)據(jù)與分析數(shù)據(jù)。
第一,收集數(shù)據(jù)。定量研究數(shù)據(jù)一般為結構性數(shù)據(jù)。傳統(tǒng)的收集方式主要包括問卷調查、結構性訪談、公開數(shù)據(jù)、授權數(shù)據(jù)等。大數(shù)據(jù)時代,數(shù)據(jù)挖掘成為新型數(shù)據(jù)獲取方式。如以問卷收集數(shù)據(jù),還涉及問卷設計、錄入、編碼等。
第二,分析數(shù)據(jù)。萬變不離其宗,社會科學研究應用各式統(tǒng)計模型的主要目的是尋找差異和關聯(lián)。亦或是比較并驗證兩組之間是否存在顯出差異;亦或是驗證自變量與因變量是否存在顯著的統(tǒng)計相關,以及估計自變量對因變量的影響程度(參數(shù)估計)。各式模型主要用于分析三類數(shù)據(jù):截面數(shù)據(jù)、縱貫數(shù)據(jù)和空間數(shù)據(jù)。截面數(shù)據(jù)是較為常見的數(shù)據(jù)類型,此外還包括附著時間維度的縱貫數(shù)據(jù),附著空間維度的地理空間數(shù)據(jù)。根據(jù)因變量類型、特點、數(shù)據(jù)分布特征等,選擇適當?shù)幕貧w模型。由于各類模型要求數(shù)據(jù)滿足統(tǒng)計學意義上的假設,但社會科學研究的數(shù)據(jù)一般包含復雜的多重因素,很難還原自然科學實驗室環(huán)境中無噪聲的數(shù)據(jù),或在獲取數(shù)據(jù)本身就存在困難。
如何讓社會科學數(shù)據(jù)“減噪”,減小數(shù)據(jù)缺陷對分析的干擾,盡可能滿足統(tǒng)計模型的假設要求,從而讓統(tǒng)計估計結果更具解釋力,這是大量統(tǒng)計學家、社會科學研究者不斷修正模型、提出新的研究方式的主要目的。比如,多層回歸模型(Multi-level Model)是對嵌套數(shù)據(jù)分析的修正;雙重差分模型(DID)是社會科學領域實驗研究的一個進步。當然,相當數(shù)量的統(tǒng)計技術用于描述數(shù)據(jù)特點、分布,以展示趨勢,為進一步統(tǒng)計分析奠定基礎。比如,空間分析中常用空間自相關分析、空間回歸、地理加權回歸等探索性空間分析技術實現(xiàn)的就是這一目的。
生于公元前634年的泰勒斯,是西方世界第一個哲學家。也許并非巧合,泰勒斯也是數(shù)學家。他提出命題的思想,通過邏輯證明以確保命題的正確性。始自泰勒斯,西方哲學就在紛繁變化的現(xiàn)象中尋找永恒不變的本質。在因果推斷的道路上,定量方法展現(xiàn)了人類在理解世界時,對清晰度、確定性的極致要求,以及對尋求廣泛適用的規(guī)律的熱切與渴望。
數(shù)據(jù)驅動與理論驅動:知識發(fā)現(xiàn)與深層拷問

大數(shù)據(jù)時代,面對浩如煙海的數(shù)據(jù)洗禮,不少社會科學研究者提出了數(shù)據(jù)驅動(Data-driven)式研究。與傳統(tǒng)理論驅動(Theory-driven)相比,數(shù)據(jù)驅動是以數(shù)據(jù)為知識發(fā)現(xiàn)的驅動力。研究者在了解數(shù)據(jù)面貌之前不應讓任何理論預設干擾思考與判斷。海量數(shù)據(jù)是任何個人意義上的人憑肉眼或自然能力很難全面掌握的,那么借助計算機技術呈現(xiàn)的數(shù)據(jù)的描述性特征,可以帶來很多讓人眼前一亮的發(fā)現(xiàn)。
清華美院副教授向帆及團隊利用公開資料收集了全國美展2276張獲獎作品,通過對作品的顏色、主題、人物數(shù)量、性別、獲獎作者年齡一系列指標進行分析,研究團隊識別出少數(shù)民族女性、沙發(fā)、牛是具有統(tǒng)計意義的高頻獲獎因素。這個項目贏得了Science雜志主辦的數(shù)據(jù)故事比賽,其他獲獎者包括美國國家實驗室NASA、拉莫斯國家實驗室、Climate.gov國家氣象實驗室等分析航天、太空等數(shù)據(jù)的科學家。該項目的數(shù)據(jù)量可能未必算作大數(shù)據(jù),但很好地體現(xiàn)了大數(shù)據(jù)時代的分析思維。大數(shù)據(jù)時代不再是資源匱乏的時代,但缺乏看到價值與有趣之處的慧眼。大數(shù)據(jù)時代歡迎“腦洞大開”。
研究者所做的事情“其實就是把你靠肉眼觀察,無論多么辛苦都看不到的東西,想辦法轉化為你能看到的,并且愿意看的東西?!边@應該是大數(shù)據(jù)時代對我們的最大沖擊之一。以前難以看到的,現(xiàn)在不僅可見,而且這種知識發(fā)現(xiàn)不再局限在象牙塔,開始成為一種大眾參與和狂歡的機制。大量數(shù)據(jù)處理技術仍然在幫助我們在混亂中實現(xiàn)分類,降低復雜程度,發(fā)現(xiàn)趨勢、識別模式,以便緩解認知世界的焦慮感,增加生存的安全感。更進取一些,為了預測,或對當下及未來采取主動行動。
然而,在獲得新技能的同時,我們還是要問,然后呢?當帶著赤子之心尋找寶物后,當喧囂歸于沉靜,研究者還是要回到對元問題拷問中。
數(shù)據(jù)驅動不等于不需要理論。沒有理論,我們可能很難知道應該怎樣驅動數(shù)據(jù)。沒有理論關懷的數(shù)據(jù)發(fā)現(xiàn)與描述雖然具有大視野、大場景的沖擊力,但同時可能很難掙脫淺顯的韁繩。
同樣道理,從理論假設開始的研究也有可能會成為思維的枷鎖,束縛研究者的手腳,而數(shù)據(jù)恰恰是擺脫理論桎梏的經驗基礎。因此,理論驅動與數(shù)據(jù)驅動并非互斥,關鍵在于研究者是否能夠具備方法論的自覺意識。
選擇定性還是定量:直面骨感現(xiàn)實
定性與定量方法的氣質迥然不同。很多時候,選擇定性還是定量不像是在選擇方法,更像在選擇立場。選了立場,堅守的時間長了,就存在退出成本,更加難以進入彼此的語境和思維方式,最終成了兩者之間的芥蒂。這或許也是為什么定性與定量方法之間存在長年的爭論。實際上,兩種方法只是學者們在理解世界不同階段時使用的不同方法,并不存在本質上的沖突。
理想狀態(tài)的研究是研究者可以自如穿梭于定量與定性方法,可獲得支持研究的完美數(shù)據(jù)。然而這種情況在社會科學研究中幾乎不可能發(fā)生?,F(xiàn)實情況往往是資源有限、時間有限、數(shù)據(jù)有限、能力有限。任何研究者都在一種“主客雙限”的情況下展開研究。不同研究者可能根據(jù)現(xiàn)實條件選擇研究方法。這都無可厚非。無論是定量與定性研究都是理解世界的渠道,而不同研究者所要理解的是同一個世界,這是交流得以存在、知識得以積累的前提。
作為研究方法,定性與定量有各自擅長的方面,定性方法在對細節(jié)的挖掘、對情景的理解、對事實的參悟、對過程的追蹤與詮釋上是定量方法不能比擬的;定量方法在對研究對象的量化測量、對一般規(guī)律的驗證也是定性方法難以企及的。方法選擇上,我們不應該因為某些方法“成為趨勢”,或漸受追捧,就跟風式追隨,而是要認真考慮自己的研究適用什么方法。盲目擴大個案研究結論適用范圍的定性研究是不負責任的,缺乏對事實基本理解與尊重的大樣本定量研究是魯莽而武斷的。當然,這首先需要在技能的修習上獲得選擇和使用方法的自由。
在理解世界的過程中,我們始終在路上。為了更好地理解世界,研究者從概念出發(fā),基于概念進行分類,并在此基礎上建構理論,驗證理論,獲得知識積累。作為幫助人們理解世界的工具,定性與定量方法各自服務于這一過程的相應階段。無論研究者使用何種方法,都需要有四種自明意識:①自明與研究對象的關系(身份自明);②自明所用基本概念內涵與外延(概念自明);③研究將完成哪個階段性任務,描述與闡釋、理論/分析框架建構,還是因果關系驗證(研究階段自明);④所選方法是否合適(方法自明)。在方法論自明的前提下,無論選擇什么方法,都需要研究者帶著近乎“笨拙”的執(zhí)著精神,反復出入現(xiàn)實、不斷積累、沉淀與追問。雖然驗證一個常識對于知識積累有一定意義,但真正可以打動人心并被載入知識史冊的,永遠只會是思想性洞見。