考研分數(shù)“信度”幾何
再過幾天,2023年全國碩士研究生招生考試將迎來初試。作為國家選拔人才的重要方式,考研選拔中的“唯分數(shù)論”導向一直受到學術(shù)界質(zhì)疑。追根溯源,這主要是對研究生招生考試預測準確性的懷疑。
考研分數(shù)能否代表學生日后的學業(yè)表現(xiàn),又在學業(yè)表現(xiàn)的哪些方面起到作用?除考分外,是否有更好的預測指標選拔研究生?這些問題亟待解答。
三點原因致研究生“高分低能”
碩士研究生入學考試作為研究生教育的起點,對研究生培養(yǎng)起著至關(guān)重要的作用。近年來,通過研究生選拔考試脫穎而出的人才,往往受到“高分低能”的詬病,即只有高分數(shù),卻缺乏創(chuàng)新意識和科研實踐能力。
比如,有研究者提出,當前研究生考試沒有跳出應試教育的窠臼,其命題原則實際上鼓勵學生對考題死記硬背。這種方式很難挑選出有才能的學生,往往導致善于考高分的人進入寶塔頂尖,真正有潛力的學生卻被埋沒。
從已有研究結(jié)果看,考研分數(shù)對研究生學業(yè)表現(xiàn)的預測準確性確實不容樂觀。比如,有學者曾對國內(nèi)某“雙一流”高校546名碩士生的畢業(yè)論文成績與入學考試初試成績進行過研究,發(fā)現(xiàn)二者之間甚至呈現(xiàn)出顯著的負相關(guān)關(guān)系。
至于原因,學界一般認為有如下幾個方面。
一是考試命題問題。根據(jù)教育部2021年出臺的《2022年全國碩士研究生招生工作管理規(guī)定》,研究生入學考試中,全國統(tǒng)一考試的全部或部分考試科目由教育部考試中心統(tǒng)一命題,其他考試科目由招生單位根據(jù)大綱自行命題。
由于采取自命題筆試的高校較多,水平參差不齊,導致在試題質(zhì)量與管理規(guī)范性上與統(tǒng)考存在差距。同時,初試筆試科目各不相同,復試階段卻采取統(tǒng)一劃線,導致初試分數(shù)的可比性變差。
二是研究生選拔過程重筆試、輕復試,學生非認知能力因素(如考生考研動機、意志品質(zhì))較難得到考查。近年來,勞動力市場“學歷門檻”的上升,導致大量學生的考研目的只是為拿到碩士文憑、改變工作處境,對學術(shù)科研毫無興趣。雖然復試環(huán)節(jié)可以考查學生的動機和興趣,但生源一般的招生單位為滿足擴招需要,往往采取等額復試的方式,或者重初試分數(shù),淡化復試表現(xiàn),導致學生的考研動機和創(chuàng)新能力難以得到有效甄別。
三是高校對學生本科學業(yè)表現(xiàn)考查不足。國外大學對于申請人認知因素的考查方式,主要是本科成績和標準化入學考試(如GRE)。雖然國內(nèi)高校在研究生復試階段也會要求學生提交本科成績單,但由于復試周期較短,招生單位往往沒有充分時間核實材料的真實性,也無法發(fā)揮本科成績的評價作用。
同時,國外高校在研究生選拔過程中,往往采用“本科院校競爭性水平”的概念衡量學校間教學質(zhì)量水平的差異。有研究者認為,如果將這一概念作為學生平均學分績點(GPA)的權(quán)重因素,可進一步提升本科GPA的參考價值。在我國,鑒于現(xiàn)行研究生招考制度難以分辨學生是否具備科研潛力,部分招生單位在自主招生時,也會看重申請者的本科院校水平。
然而,對此也有人提出質(zhì)疑。
北京大學教授岳昌君曾對北京市高校碩士研究生創(chuàng)新能力進行過調(diào)查。發(fā)現(xiàn)來自原“985工程”高校學生的創(chuàng)新精神得分高于原“211工程”高校的學生,兩者均高于普通本科高校學生,但這幾種差異在統(tǒng)計上并不顯著。
那么,到底是考研分數(shù)對研究生未來學業(yè)表現(xiàn)預測更準確,還是本科學校層次和學業(yè)成績對研究生綜合素質(zhì)反映更全面,抑或有其他因素會產(chǎn)生影響?對這些問題的回答將有助于我們未來制定更科學、有效的研究生人才選拔制度。
生源高校層次與答辯分數(shù)關(guān)系不大
為探尋相關(guān)答案,筆者和研究團隊收集了北京某高校某學院2015年—2020年間所有碩士研究生的數(shù)據(jù),并對這些學生入學前提交的原始本科成績單、2015年—2020年研究生入學考試數(shù)據(jù),以及其入學后學業(yè)表現(xiàn)數(shù)據(jù)進行了分析。
結(jié)果發(fā)現(xiàn),推免生的平均GPA要高于統(tǒng)考生,但在同類型碩士生中,本科學校的層次不影響其學業(yè)表現(xiàn)。原“985工程”高校統(tǒng)考學生在研究生階段的平均GPA為83.62,原“211工程”高校統(tǒng)考學生的平均GPA為82.24,而“雙非”高校統(tǒng)考學生平均GPA為82.26。近似的對比關(guān)系也出現(xiàn)在三種類型高校的推免生中。
可以看出,上述數(shù)值與學生的本科院校層次的相關(guān)性非常弱。同時,雖然推免生在學業(yè)表現(xiàn)上要高于統(tǒng)考生,但兩者在科研表現(xiàn)上卻無顯著差異。其原因可能是由于獲得推免資格的學生在本科階段學業(yè)優(yōu)異,因此在研究生階段比統(tǒng)考生更擅長拿高分。
從平均GPA與畢業(yè)論文答辯分數(shù)的關(guān)系上看,來自不同層次高校的學生仍無明顯差異。然而,如果單獨分析推免生的科研表現(xiàn),會發(fā)現(xiàn)來自原“211工程”高校的推免生中,有學術(shù)論文發(fā)表或競賽得獎經(jīng)歷的學生比例顯著高于來自原“985工程”高校的推免生——后者在本科階段有獲獎經(jīng)歷的學生占比為80.7%,前者則高達98.2%。
這與常理似乎并不一致。
究其原因,可能是由于原“985工程”高校對來自原“211工程”高校推免生的要求更為嚴格,學生需同時擁有優(yōu)異的學業(yè)成績和科研獲獎經(jīng)歷才能通過篩選,而這些因素都對學生的科研潛力具有顯著影響。反之,原“985工程”高校對推免生,特別是本校生源的推免生條件較為寬松。
如果將研究生考研分數(shù)細分為各個單科,會發(fā)現(xiàn)研究生階段的平均績點與其入學前的所有考試因素均無顯著關(guān)系,但大學英語四級分數(shù)與研究生復試的面試分數(shù)越高的碩士生,越傾向于在畢業(yè)論文答辯中獲得高分。
這可能由于畢業(yè)論文的答辯涉及多方面因素,除學生查閱文獻與寫作能力外,也受到學生臨場發(fā)揮和表達能力的影響。因此,研究生面試中取得高分可在一定程度上幫助該生在答辯環(huán)節(jié)獲得更好表現(xiàn),而英語能力有助于學生在論文寫作時的文獻查閱。
同時,這也能在相當程度上說明,統(tǒng)考學生的考研分數(shù)并不能保證其在研究生階段取得更好成績。
此外,碩士研究生在科研方面的表現(xiàn)依然與其入學考試各單科成績無關(guān),只與學生在本科階段的各項表現(xiàn)有關(guān)。那些在入學考試中取得高分的統(tǒng)考學生,雖然會在研究生階段獲得更高的GPA,但在科研能力或綜合學術(shù)創(chuàng)新能力上,其表現(xiàn)并不強于入學成績較低的學生。
縮小初試占比,更重本科學業(yè)考查
通過上述研究,我們發(fā)現(xiàn)當前的研究生選拔機制重知識、輕實踐創(chuàng)新的現(xiàn)象依然很明顯,通過考試分數(shù)篩選出的學生與當前的研究生培養(yǎng)教育宗旨也并不吻合。與此同時,學生在本科階段的學業(yè)表現(xiàn)卻對其研究生階段表現(xiàn)有著至關(guān)重要的影響,尤其是本科獲獎經(jīng)歷與大學英語四級成績。
此外,正如前文所言,目前本科學校競爭性在推免生群體中還出現(xiàn)了“反向作用”——具備科研潛力的學生比例在原“211工程”高校群體中更高,這一點也需要引起我們的注意。
基于上述研究結(jié)果,筆者認為要提升研究生的學科表現(xiàn),需從以下方面進行政策調(diào)整。
首先,改革研究生入學考試內(nèi)容,增加綜合能力考查,促進初試命題的統(tǒng)一性。當前的研究生入學考試更注重對基礎(chǔ)知識和通識知識的考查,容易導致高分考生只會考試,不會做學術(shù)研究。因此,在命題時增加專業(yè)能力和創(chuàng)新能力試題尤為重要。同時,初試中眾多高校采取自命題形式,難以保證筆試環(huán)節(jié)的公平性與科學性,應逐步采取國家統(tǒng)一初試命題、復試由各校自行組織的統(tǒng)分結(jié)合形式。
其次,縮小初試分數(shù)占比,采取多種形式的考核策略。研究生入學考試的目的是選拔專業(yè)能力與科研潛力強的學生,但這些能力在筆試分數(shù)中無法得到全面反映。研究發(fā)現(xiàn),面試表現(xiàn)更好的學生易獲得更高的論文答辯分,這與學生的表達溝通能力相關(guān)。高校應在復試中更多體現(xiàn)出多樣性和自主性選拔,使用多種策略考查學生專業(yè)能力,比如在復試中增加學生外文文獻閱讀、現(xiàn)場實驗操作以及學術(shù)匯報等。
最后,加大對學生本科學業(yè)表現(xiàn)的考查。當前,各高校一般會在復試環(huán)節(jié)要求學生提交本科成績單及獲獎經(jīng)歷,但該制度往往流于表面。反觀國外,相關(guān)材料往往在申請環(huán)節(jié)就提交給學校,這種做法值得借鑒。