英語考試研究-5期 -語言測試與性別研究綜述

上傳人:卷*** 文檔編號:123293138 上傳時間:2022-07-22 格式:DOC 頁數(shù):17 大?。?9KB
收藏 版權(quán)申訴 舉報 下載
英語考試研究-5期 -語言測試與性別研究綜述_第1頁
第1頁 / 共17頁
英語考試研究-5期 -語言測試與性別研究綜述_第2頁
第2頁 / 共17頁
英語考試研究-5期 -語言測試與性別研究綜述_第3頁
第3頁 / 共17頁

下載文檔到電腦,查找使用更方便

15 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《英語考試研究-5期 -語言測試與性別研究綜述》由會員分享,可在線閱讀,更多相關(guān)《英語考試研究-5期 -語言測試與性別研究綜述(17頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、 語言測試與性別研究綜述以及對國內(nèi)語言測試的建議 請審稿成果出來后盡快告知 謝謝! 中國教育學會外語教學專業(yè)委員會 陶百強 摘 要:語言測試領(lǐng)域中的性別視角研究在國外研究成果頗多且廣泛應用于語言測試實踐,國內(nèi)在此方面理論研究很少,在實踐上,缺少從性別這一社會語言學視角審視國內(nèi)語言測試項目。本文試圖對國外語言測試與性別研究進行較系統(tǒng)的綜述,最后,提出了消除語言測試中的性別歧視現(xiàn)象的建議以及有待進一步研究的課題。 核心詞:語言測試;項目功能差別;測試偏頗性;性別歧視;性別平等 Abstract: This paper reviews foreign and domestic s

2、exism research and practice in language testing and reveals that China lags behind in this sociolinguistics perspective in both theoretical study and practice. Some tentative suggestions to fight sexism in language testing and further research topics for Chinese language testing scholars are suggest

3、ed to conclude the paper. Key words: language testing, DIF, test bias, sexism, gender equity 作者注:本論文摘要于11月在北京外國語大學舉辦的語言測試國際研討會上進行宣讀。 1. 引言 語言與性別研究在20世紀中葉進入社會語言學領(lǐng)域系統(tǒng)研究時期,60年代晚期西方婦女解放運動推動了西方語言與性別歧視研究,如20世紀70年代出版了三部力作:Male/Female Language((Key, 1975), Language and Women's Place (Lakoff, 1975

4、), Difference and Dominance (Thorne & Henley, 1975) (Ansary & Babaii, )。TESOL Quarterly 第3期出版了Gender and TESOL專輯??梢姡⒄Z教育中的性別因素已引起國際學術(shù)界廣泛關(guān)注。 教科書里的性別文化作為一種隱性課程資源較早引起關(guān)注,西方學者對教科書中的性別歧視現(xiàn)象研究始盛行于20世紀70年代,嗣后,西方學者在課堂教學、評估領(lǐng)域也進行了性別歧視現(xiàn)象研究。語言測試是語言教育中的重要環(huán)節(jié),但語言測試領(lǐng)域的性別視角研究滯后于教科書研究。語言與性別研究專家Sunderland()覺得人們對測試中的性別因

5、素的審查比對教材中存在的性別歧視現(xiàn)象的審查少得多。但國外在語言測試與性別方面研究仍相對較多,而國內(nèi)研究少見。 2. 國外教育測試領(lǐng)域中的性別因素研究 測量中的偏頗性問題早在19就引起了學者的關(guān)注,發(fā)現(xiàn)用比奈-西蒙智力測量量表測量小朋友智商時,來自社會經(jīng)濟地位高的家庭的小朋友智商遠高于來自社會經(jīng)濟地位低的 (Eels et al., 1951)。測試偏頗性影響測試效度,性別是導致測試偏頗性的因素。教育測試領(lǐng)域中的性別因素始終受到心理測量學者的關(guān)注,測試開發(fā)者盡量保證試題不因受試者的性別、種族、年齡等浮現(xiàn)偏頗性,測試開發(fā)者在試測階段征求專家意見或進行數(shù)據(jù)分析以消除偏頗性……導致語言測試偏頗性

6、、影響語言測試受試者受到不平等看待的因素之一的性別問題不僅是技術(shù)問題,同步也是道德或政治問題(Brown & McNamara, )。 Thurstone & Chave (1929)及Glaser (1994,1952)是較早研究不同受試者對測試的反映不一致的學者,就試題偏頗性(test bias)或項目功能差別(DIF, differential item functioning)進行了定量研究(引自Brown & McNamara, )。[注:Hambleton等(1991:110,引自Stage,1997)對項目功能差別(DIF)下了一種被心理測量學界廣泛接受的定義:“如果具有相似能力

7、但來自不同群體的受試者答對某題的概率不同,則此題顯示了項目功能差別”。筆者注:此定義的局限性在于僅針對選擇性反映題而沒納入建構(gòu)性反映題如寫作。] Diamond ( 1976)指出測試偏頗性的兩大本源,即測試內(nèi)容和對測試成果的使用。Dwyer ( 1976)提出從兩方面審視測試中的性別偏見:一是性別角色刻板化和性別歧視;二是題型、試題情境以及其她測試技術(shù)方面,前者波及社會價值觀,后者波及心理測量技術(shù)層面。Childs (1990)提出從三方面審視試題中的性別偏頗性:與否含對某性別冒犯性的素材或提法,與否含某性別也許更熟悉的內(nèi)容,試題中人物的性別分布與否失衡或存在性別角色刻板化。 3. 國外語

8、言測試與性別研究 國外20世紀60年代就有研究從社會語言學的視角審視語言測試,如Coffman (1961,引自Wood,1993:169)發(fā)目前SAT語言測試部分,女性在波及人際關(guān)系的題得分較高,而男性在波及技術(shù)和機械方面的題得分較高。20世紀70年代代表性的語言測試與性別方面的研究有Wood(1978)刊登在Educational Studies的論文Sex differences in answers to English language comprehension items. 20世紀80年代,隨著語言測試成為應用語言學中一門獨立的重要學科(Bachman,L. F

9、. personal communication),大量研究波及受試者特性如其文化背景、母語、種族、性別、認知風格等與語言測試成績的關(guān)系,語言測試與性別研究增多,如Farhady (1982, 引自Bachman 1990:278)發(fā)現(xiàn)性別﹑專業(yè)背景﹑種族等和多項語言能力之間有很大聯(lián)系。Zeidner (1987, 引自Bachman 1990:278)研究了以色列大學入學英語測試中由種族、性別和年齡導致的測試偏頗性。在20世紀90年代,語言測試與性別研究繼續(xù)引起關(guān)注,如Bachman (1990:291)在專著Fundamental Considerations in Language Te

10、sting第七章效度之Test bias一節(jié)中論述了語言測試中的性別因素,建議語言測試開發(fā)和使用者考慮受試者文化背景﹑背景知識﹑學習風格、母語﹑種族﹑性別和年齡等也許導致測試偏頗性的因素。此間,出名語言與性別研究專家Sunderland(1994,1995)在Language Testing Update刊登兩篇有影響的論文Gender and Language Testing: Any Connection? Preliminary Explorations和Gender and Language Testing。在21世紀,在口語測試與性別研究中引入會話分析,如O’Sullivan (,

11、引自Brown & McNamara, )以及語篇分析理論,如O’Sullivan (, ibid),研究發(fā)現(xiàn)當對話者是女性時受試者語言精確性較高,但是語言復雜性(complexity)不受影響,但總體上性別對受試者言語無明顯影響。 下文從語言測試成績性別差別、內(nèi)容或話題、測試任務、評分等四方面進行回憶。 3.1 語言測試成績性別差別 語言測試成績的性別差別是初期語言測試與性別研究重要課題。 Maccoby & Jacklin (1974,引自Sunderland, ) 聲稱在母語學習和運用方面,女性天生比男性強。許多研究證明兩性在語言能力上存在性別

12、差別(Maccoby & Jacklin, 1974; Thorne et al., 1983; Tannen, 1990) ,似乎一致覺得女性在一般語言能力上比男性強(Maccoby & Jacklin, 1974; Denno, 1982; Cole, 1997),但是具體到某項語言技能上卻并非如此,Hyde and Linn (1988, 引自Jie Lin & Fenglan Wu,)進行了一項大規(guī)模語言能力性別差別調(diào)查后發(fā)現(xiàn),女性一般在讀、說、寫和總體語言能力上稍占優(yōu)勢,但差別很小,故Hyde & Linn覺得語言能力方面的性別差別不復存在。但是,美國ETS研究400次測試和數(shù)百萬考

13、生后發(fā)現(xiàn),與30年前相比,女性在語言方面的優(yōu)勢猶存(Cole, 1997,同上)。 21世紀初仍有此方面研究,如Takala &?Kaftandjieva ()運用項目反映理論研究了第二語言詞匯測試和受試者性別的關(guān)系,發(fā)現(xiàn)盡管有些題目有助于女性或男性,但是詞匯測試在總體上未顯性別差別。美國公平公開測試中心對大學入學測試中的性別偏頗性進行了研究,發(fā)現(xiàn)高中女生在SAT語言測試部分比男生低3分;在1999-GRE測試中,女性在三部分平均得分都低于男性,語言部分低9分(The National Center for Fair & Open Testing,)。 對于語言成績的性別差別,雖

14、然進行了諸多研究甚至從生物學的角度研究,但迄今沒有定論。筆者覺得,對于兩性在語言能力方面的差別的初期研究成果(女性在語言方面有優(yōu)勢)對女性產(chǎn)生皮格馬利翁效應(Pygmalion effect)從而也許導致女性的語言平均成績高于男性。 3.2 內(nèi)容或話題 語言測試的試題內(nèi)容(content)或話題(topic)對不同性別受試者的得分有明顯影響,按照圖式理論,內(nèi)容圖式很大限度上影響受試者的閱讀和聽力理解能力,許多研究者發(fā)現(xiàn)語言測試題中存在“女性話題”或“男性話題”。Coffman (1961,引自Wood,1993:169)發(fā)目前SAT語言測試部分,對波及人際關(guān)系話題的

15、試題女性得分較高,而男性在波及技術(shù)、機械方面的題得分較高。Donlon (1973)研究覺得SAT語言測試部分的實踐和科學類話題測試題對男生顯得容易,而與人際關(guān)系、人文學科或美學有關(guān)的試題對女生容易。經(jīng)項目反映分析,Wood (1978)發(fā)現(xiàn)男生對一篇有關(guān)一男子回憶在鐵道邊度過的童年的短文有關(guān)試題的得分高于以一種女孩在舞會上的痛苦經(jīng)歷為話題設計的試題得分,對另一測試的研究發(fā)現(xiàn)女生在一篇有關(guān)一14歲女孩的短文有關(guān)試題得分較高,而男生在有關(guān)克里米亞戰(zhàn)爭的題材得分較高。Doolittle & Welch (1989,引自Brantmeier,)發(fā)既有關(guān)人文科學話題的閱讀理解短文,女性得分比男生高,有

16、關(guān)科學話題的閱讀理解短文女生得分比男生低。Kunnan (1990, 引自Brown & McNamara, )運用Rasch項目反映模型分析了一項大學英語分班測試中的多選題,發(fā)現(xiàn)20%的閱讀、聽力、語法與詞匯試題有助于男生。Bugel & Buunk (1996, 引自Brantmeier,) 研究了2980名荷蘭高中生在全國外語考試中的性別差別,發(fā)現(xiàn)男生在做多選式閱讀理解題時,在激光﹑溫度計﹑火山、汽車和足球類話題得分較高,而女生在有關(guān)助產(chǎn)士、傷心故事、家庭主婦的困境等話題得分較高。Brantmeier()研究了中級水平的以西班牙語為外語的29名男性和49名女大學生的閱讀成績和短文話題的關(guān)

17、系,發(fā)現(xiàn)對于拳擊話題的閱讀短文,男生體現(xiàn)明顯比女生好,但女生在有關(guān)一種失意的家庭主婦的話題上體現(xiàn)明顯比男生好;Brantmeier的研究也顯示含性別傾向的話題對高水平的語言學習者的閱讀理解能力的影響沒有明顯的性別差別。 3.3 測試任務 1) 測試題型 有關(guān)兩性在測試題型上的差別研究集中在多選和短文寫作題。Wood (1993:171)發(fā)現(xiàn)O Level for the London Board測試男女生通過率差別由1971年的22.2%(女性領(lǐng)先)下降到1977年的10.0%(女性領(lǐng)先),下降幅度最大的年份是1972年,研究發(fā)現(xiàn)因素是在1972年引入了多選題,闡

18、明多選題有助于男生。Murphy (1978,1982,引自Wood,1993:171-172)確認了以上發(fā)現(xiàn),多選題似乎有助于男生而不利于女生,而短文寫作題有相反效應;Murphy提到女生寫作時筆跡整潔(neatness)有助于女生得分。Bolger & Kellaghan (1990)比較了15歲男女生在基于同樣大綱的原則化多選測試和自由應答題上的得分差別,發(fā)現(xiàn)前者對男生有利,由于她們大膽猜想不會答的題,但女生一般空下不會答的題(注:SAT實行選錯懲罰原則,選錯倒扣0.25分),有關(guān)男生在多選題得分高于女生的因素,有的學者(Angoff,1987;Albanese,1988)歸因于男生喜冒

19、險而進行猜想但是女生不樂意猜想而寧愿空題。 但Brantmeier ()研究發(fā)現(xiàn)男女在多選式閱讀理解題得分幾乎相似,但女性在written recall題型得分比男性高(短文話題熟悉限度對兩性相似)。題型對不同性別的不同效應在語言測試特別是在高厲害關(guān)系測試(high-stakes testing)實踐中意義重大,測試開發(fā)者應在有助于男生的選擇性反映題(selective response items)如多選題和有助于女生的建構(gòu)性反映題(constructed response items)如寫作題之間謀求平衡,以求測試公平。 2)測試技能 有關(guān)兩性在不同語言技能上的體現(xiàn),許多研究覺得女性

20、在寫作和口語方面超過男性 ((Hyde & Linn ,1988;Jenkins & Cheshire, 1990, 引自Sunderland, ; Sunderland ,1995; Cole, 1997)。有關(guān)女生寫作測試成績高的因素,Murphy(引自Wood,1993:171-172)提到女生寫作時筆跡整潔有助得分,Morris (1998:219,引自Sunderland,)研究發(fā)現(xiàn)女生寫作時比男生更遵循題目規(guī)定。在聽力方面,研究者(Boyle,1987;Markham,1988,引自Sunderland, )發(fā)現(xiàn)男性外語學習者的單詞辨認能力比女性強,然而,Bacon (1992,i

21、bid)的研究發(fā)現(xiàn)男女在真實聽力測試任務中的體現(xiàn)不存在性別差別。 男女在不同語言技能上的體現(xiàn)讓語言測試設計者可通過調(diào)節(jié)測試中語言技能題所占權(quán)重來減少性別差別,如美國在1997年在高中畢業(yè)生參與的SAT預備考試(Preliminary Scholastic Assessment Test)中引入寫作題,從而明顯縮小了男女得分差別, 由4.5分縮小到2.7分(AAUW, 1998: 5)。 3.4 評分 在重交際和重體現(xiàn)教學思想影響下發(fā)展起來的行為測試(performance test),多由考官觀測受試者完畢任務的狀況,采用整體評估方式,按照一種綜合語言水平量表給應試者擬

22、定級別(韓寶成,)。Shohamy (1991)覺得口試評估波及諸多變量,如考官、考官和受試者的關(guān)系、個性、性別、話題等。Bull & Stevens (1978,引自Meighan,1981:122)甚至研究了女性外貌對寫作評分的影響。如何保證具有較高效度的行為測試評估具有較高的評分員信度是語言測試研究者關(guān)注的,考官、受試者的性別以及其間的交互作用與否影響語言測試評估且是如何影響的,始終廣為測試界研究。 1)考官性別 Locke (1984,引自Brown & McNamara, ) 進行了一項小規(guī)模實驗以研究評分員性別對男生英語口試成績的影響,發(fā)現(xiàn)口試考官的性別對在英國學習的

23、阿拉伯男生的成績有明顯影響——男考官給分比女考官高。Carroll (1991,ibid)的研究成果也如此。但也浮現(xiàn)了相反研究結(jié)論,發(fā)現(xiàn)女性考官給分比男性考官高(Porter & Shen,1991; O’Sullivan,;ibid),也許受試者的文化背景等其她社會文化因素導致了矛盾的研究成果,Porter & Shen研究對象來自不同國家,Locke的研究對象都是阿拉伯人。O’Neil (1985,引自Greatorex & Bell, )發(fā)現(xiàn)教師給與自己性別相似的學生給分較低。 2)受試者性別 為了提高寫作測試的評分信度,引入了盲判程序(blind marking)

24、,但某些對盲判的研究表白性別因素仍在起作用,如Spear (1984,引自Greatorex & Bell, )發(fā)現(xiàn)教師對覺得是由男生完畢的任務予以較高的級別。盲判仍不能排除受試者性別對評分的影響,由于從筆跡可猜想性別,Woods (1991,ibid)發(fā)現(xiàn)書寫清晰、整潔可增長得分。Carroll (1991, 引自Brown & McNamara, )發(fā)現(xiàn)男性和女性口試考官給男性受試者的給分比女性受試者高。 由于21世紀前的研究大多孤立研究性別對語言測試評分的影響,而沒有同步把其她影響受試者得分的因素以及因素間的交互影響納入研究,這也許是導致20世紀某些研究成果不一致的重要因素。

25、如下二項運用了多因子Rasch分析軟件的性別與口試研究,未發(fā)現(xiàn)性別對口試有明顯影響。O'Loughlin ()研究了性別對口試的影響,讓男女各8名受試者參與兩遍雅思(IELTS)模擬口試,一遍由女性擔任考官,另一遍由男性任考官。對錄音的口試內(nèi)容進行會話分析如重疊(overlaps)、打斷(interruptions)和最簡回應(minimal responses);同步,用多因子Rasch分析軟件對4名評分員(2男2女)對32份口試成績以及評分員、受試者的性別因素進行分析,會話分析以及數(shù)據(jù)分析均顯示性別對口試成績無明顯影響, 但性別因素與其她因素如受試者的年齡等交互作用也許對評分影響較大。Ec

26、kes ()運用多因子Rasch分析工具研究了德福考試(TestDaF)寫作和口語部分的評分因素,從總體上看,女性受試者在兩部分的得分比男性高但未達明顯水平,評分員群體沒有體現(xiàn)性別偏見,同步發(fā)現(xiàn)女性在口試部分的得分優(yōu)勢更強,因素也許是受試者的性別通過聲音特性傳達給了評分員。 4. 國內(nèi)語言測試與性別研究現(xiàn)狀及建議 4. 1 國內(nèi)語言測試與性別研究現(xiàn)狀 國內(nèi)從20世紀80年代開始引介語言與性別歧視研究, 如Whitcut(1984)、楊永林(1987,1988),90年代后來,國內(nèi)浮現(xiàn)大量簡介英語語言中性別歧視的論文,如劉家榮,1991;黃維合,1993;苗興偉,1995;劉在良,19

27、96;李福印﹑楊樺,1997;廖學全,1997;劉建達,1998;劉曉天,;劉漢杰,;趙凌,;王學信,等(引自陶百強,a)。國內(nèi)大陸學者對教科書中的性別歧視研究始于20世紀90年代,如朱曉斌(1994,引自陳雨亭,;曾天山,1995)。后來,教材里的性別歧視研究漸增(如史靜寰,;李祖祥,;楊潔﹑呂改蓮,;曲雯,;朱韶暉,;張潔﹑楊永林,;陶百強,a)。 可見,國內(nèi)在語言教育領(lǐng)域的性別歧視研究集中在語言層面和教科書層面,在國內(nèi)學術(shù)期刊網(wǎng)和維普資訊網(wǎng)進行篇名、核心詞和摘要檢索后發(fā)現(xiàn),國內(nèi)缺少語言測試與性別方面的系統(tǒng)和實證研究,雖然有性別和英語測試成績關(guān)系的研究,如袁鳳識、肖德法()發(fā)目前男女課堂

28、體現(xiàn)與四級成績關(guān)系方面有一定的性別差別;張彬、杜翠琴()運用定量研究措施,探討了性別因素與CET4成績間的關(guān)系,研究表白:性別與英語學習成績之間明顯有關(guān),女生的成績明顯高于男生;劉旭東、 田家莉和薛素萍()研究發(fā)現(xiàn), 男女大學生CET4成績存在明顯性差別; 高考英語成績、主干課程成績和性別與CET4)績存在有關(guān)性;肖德法、向平()對3月PETS口試成績的性別差別進行了記錄分析, 成果顯示女性的成績明顯高于男性, 呈極其明顯性差別,但在分級別記錄上, 在一級B和一級上達明顯性水平, 在二至四級上未達明顯性水平。 國內(nèi)的語言測試(重要是英語測試)方面的專著未專列章節(jié)論述語言測試中的性別

29、偏頗性,據(jù)筆者所知,僅李筱菊(1997:287))編著的《語言測試科學與藝術(shù)》提到“避免有偏頗性或太專門的內(nèi)容”。但某些論文(劉慶思, 1993;周勝、傅繼華,1994)提到了避免語言測試中的性別偏頗性。陶百強(b)在《有關(guān)〈一般高中英語課程原則〉(實驗)的建議》一文中建議把性別平等作為貫穿教材編寫、課堂教學、測試等領(lǐng)域里的一條原則寫進基本英語教育課程原則,以體現(xiàn)教育民主和教育平等。 4.2 消除語言測試中性別歧視的建議 國外語言測試與性別研究應用在語言測試領(lǐng)域,盡量消除語言測試的性別偏頗性,以保證測試效度和信度,Kunnan(:3)甚至提出了新概念——平等建構(gòu)效度

30、(equal construct validity)以保證受試者語言測試成績不受性別、民族/種族、專業(yè)背景、母語、文化等影響。結(jié)合國外的研究和實踐,建議在考試大綱和命題指引細則制定、試題開發(fā)和設計、評分、考后分析等環(huán)節(jié)系統(tǒng)考慮以消除語言測試中的性別偏頗性。 在考試規(guī)范的制定方面,世界出名測試機構(gòu)制定了含性別視角的大綱性文獻,如美國教育測試服務中心的ETS Standards for Quality and Fairness (Educational Testing Service,), ETS Fairness Review Guidelines (Educational Testing S

31、ervice,),ETS International Principles for Fairness Review of Assessment ();英國雅思考試中心的IELTS Handbook , 國際語言測試協(xié)會(International Language Testing Association, ILTA)在3月于加拿大召開的國際語言測試協(xié)會年會上通過Code of Ethics for ILTA以及國際語言測試協(xié)會7月22日于加拿大渥太華舉辦的語言測試研究研討會上通過The Draft ILTA Code of Practice。國內(nèi)在教育評估和語言測試總體規(guī)范制定方面欠缺,建議中

32、國心理學會和外語教學學術(shù)機構(gòu)聯(lián)合研制適合國內(nèi)國情的教育和語言測試指引大綱。在缺少總體指引綱要的狀況下,語言測試開發(fā)機構(gòu)可在考試大綱或命題細則中納入性別平等等體現(xiàn)公平性的條款,在高厲害關(guān)系測試中更應如此,以培養(yǎng)命題和審題專家和評分員等在進行專業(yè)作業(yè)時兼顧測試環(huán)節(jié)中也許浮現(xiàn)的性別歧視或偏頗。 在試題設計方面,應從題型、內(nèi)容或話題及語言等方面考慮,且增長敏感和公平問題審題程序。在定量和定性研究題型對兩性的影響的基本上,在測試中平衡有助于男性的題型和有助于女性題型的權(quán)重。在內(nèi)容上,從兩性浮現(xiàn)頻次、性別角色(職業(yè)和家庭角色)、聽力文本會話分析、試題內(nèi)容或話題等角度考慮性別平等,避免浮現(xiàn)性別刻板化內(nèi)容,

33、如在閱讀理解測試部分應含男性和女性感愛好的題材。在語言方面,從標記性問題、成對構(gòu)造的詞序、通稱構(gòu)造等方面避免在語言上體現(xiàn)性別歧視,如不用man等通稱人類而改用humans等。 在審題方面,增長敏感和公平問題審題程序,受過系統(tǒng)培訓的審題人負責審查試題在內(nèi)容和語言等方面與否含敏感問題或有違公平,以保證測試平等公正地看待所有受試者,不管其性別、民族、種族、社會經(jīng)濟地位、宗教信奉等。如TOEFL有嚴格的審查程序,以杜絕性別歧視等敏感問題,曾于1984—1987年期間供職于美國教育測試服務中心的Bonny Norton Peirce描述了TOEFL試題開發(fā)中的審題程序(The review proce

34、ss),當時試題大概通過6位左右測試開發(fā)專家審查。一方面,試題需經(jīng)測試專家審題(Test Specialist Review, TSR);然后,試題進入TOEFL協(xié)調(diào)專家(TOEFL coordinator)審題程序, 其中兩位專家負責審查文體問題,尚有一位“敏感問題”審查專家(sensitivity reviewer)負責消除試題中任何潛在的如性別歧視等敏感問題(Peirce,1994:45-46)。Peirce提到自己在審查一篇閱讀理解語篇時把“Therefore many farmers are tenants and much of the land is owned by banks

35、, insurance companies, or wealthy businessmen”中的businessmen換為了business people(ibid: 47)。 在評分方面,測試評閱機構(gòu)邀請語言與性別研究領(lǐng)域的專家對評分員進行培訓,且制定嚴格科學的評分原則,實行雙人評分(double marking)。特別是在口語測試中,應避免考生語言能力以外的因素如性別和外貌等干擾評分員信度。 在考后分析方面,運用現(xiàn)代記錄措施或軟件進行性別DIF檢測分析,常用工具有Simultaneous Item Bias Test [SIBTEST,只能對0、1計分測試題(dichotomo

36、usly scored items)如選擇題進行分析]、ConQuest以及Logistic回歸分析軟件[可對非0、1計分測試題(polytomously scored items)如寫作題進行分析]。目前的DIF檢測工具幾乎都需要測試后的大樣本進行分析,因此在建立在試測小樣本基本上的性別DIF模型尚未開發(fā)出來前,對測試進行考后分析的作用只是改善此后的測試,并將性別DIF分析成果反饋給該測試的審題人將有助于審題人反思審題工作。 5. 結(jié)語 本文回憶了國外語言測試與性別研究,雖然國外語言測試界早在20世紀80年代就大量研究語言測試中受試者特性對語言測試的影響,但國內(nèi)在語言測試與性別

37、理論研究領(lǐng)域還較落后,或沒有引起注重,語言測試Gender DIF方面的實證研究更少,望本文能起拋磚引玉之效,引起學者對語言測試領(lǐng)域中也許存在的性別偏頗性進行理論和實證研究,并從其她社會語言學角度審視國內(nèi)的語言測試理論和實踐,以保證國內(nèi)諸多高厲害關(guān)系語言測試的效度和對所有受試者的公平公正性。 參照文獻 1 AAUW. Gender Gaps: Where Schools Still Fail Our Children [M]. Washington, DC: American Association of University Women Educational Foundati

38、on, 1998. 2 Albanese, M. A. The Projected Impact of the Correction for Guessing on Individual Scores. Journal of Educational Measurement, 1988,25(2):149-157. 3 Angoff, W. H. Philosophical Issues of Current Interest to Measurement Theorists [Z]. Research Report 87-33, Princeton, NJ: Educational Tes

39、ting Service, August 1987. 4 Ansary H & E Babaii. Subliminal Sexism in Current ESL/EFL Textbooks [J]. Asian-EFL-Journal, March . 5 Bachman,L. F. Fundamental Considerations in Language Testing [M]. Oxford: Oxford University Press, 1990. 6 Bolger, N., & Kellaghan, T. Method of Measurement and Gend

40、er Differences in Scholastic Achievement [J]. Journal of Educational Measurement, 1990,27(2):165-174. 7 Brantmeier, C. Does gender make a difference? Passage content and comprehension in second language reading [J]. Reading in a Foreign Language, , 15(1): 1-23. 8 Brantmeier, C. Gender, violence-or

41、iented passage content and second language reading comprehension [J]. The Reading Matrix, , 4 (2):1-19. 9 Brown,A., & McNamara, T. “The Devil is in the Detail”: Researching Gender Issues in Language Assessment [J]. TESOL Quarterly, , 38 (3):524-538. 10 Childs, R. A. Gender Bias and Fairness [Z]. W

42、ashington DC: ERIC Clearinghouse on Tests Measurement and Evaluation. American Institutes for Research. ERIC Identifier: ED328610,1990. 11 Cole, N. S. The ETS gender study: how females and males perform in educational setting [Z]. Princeton, NJ: Educational Testing Service, 1997. 12 Diamond E. E.

43、Minimizing sex bias in testing [J]. Measurement and Evaluation in Guidance, 1976(9):28-34. 13 Donlon, T. F. Content Factors in Sex Differences on Test Questions [Z]. Research Memorandum 73-28, Princeton, NJ: Educational Testing Service, 1973. 14 Dwyer, C. A. Test content and sex differences in rea

44、ding [J]. The Reading Teacher, 1976 (29): 20-24. 15 Eckes,T. Examining Rater Effects in TestDaF Writing and Speaking Performance Assessments: A Many-Facet Rasch Analysis [J]. Language Assessment Quarterly, , 2(3), 197–221. 16 Educational Testing Service. ETS Standards for Quality and Fairness[Z].

45、Princeton, NJ: Author, . 17 Educational Testing Service. ETS Fairness Review Guidelines[Z]. Princeton, NJ: Author, . 18 Educational Testing Service. ETS International Principles for Fairness Review of Assessment [Z]. Princeton, NJ: Author, . 19 Eels, K., Havighurst, R.J., Herrick, V.E., & Tyler,

46、R.W. Intelligence and cultural differences [M]. Chicago: University of Chicago Press,1951. 20 Greatorex, J. & Bel, J. F. Does the gender of examiners influence their marking? [Z] Paper presented at the conference Learning Communities and Assessment Cultures: Connecting Research with Practice. Organ

47、ised by the EARLI Special Interest Group on Assessment and Evaluation and the University of Northumbria, August . 21 Hyde, J. S., & Linn, M. C. Gender differences in verbal activity: A meta-analysis [J]. Psychological Bulletin, 1988 (104): 53-69. 22 Jie Lin & Fenglan Wu. Differential Performance

48、 by Gender in Foreign Language Testing [Z]. Chicago: Paper presented at the annual meeting of NCME in Chicago, . 23 Kunnan, A. J. Fairness and justice for all [A]. In A. J. Kunnan (ed.) Fairness and Validation in Language Assessment: Selected Papers from 19th Language Testing Research Colloquium,

49、Orlando, Florida [C]. Cambridge: Cambridge University Press, :1-14. 24 Linn, M. C., De Benedictis, T., Delucchi, K., Harris, A., & Stage, E. Gender Differences in National Assessment of Educational Progress Science Items: What Does “Don’t Know” Really Mean? [J]. Journal of Research in Science Teach

50、ing, 1987, 24(3): 267-278. 25 Linn, M. C.& Hyde, J. S. Gender, mathematics, and science [J]. Educational Researcher, 1989,18 (8):17-19, 22-27. 26 Meighan, R. A Sociology of Educating [M]. Eastbourne, East Sussex: Holt, Rinehart and Winston Ltd., 1981. 27 O'Loughlin,K. The impact of gender in oral

51、 proficiency testing [J]. Language Testing, ,19(2):169-192. 28 Peirce, B. N. The Test of English as a Foreign Language: Developing items for reading comprehension. In Hill, C & K. Parry (eds.) From Testing to Assessment: English as an International Language. New York: Longman. 1994: 39-60. 29 Shoh

52、amy, E. The Hebrew Speaking Test: An Example of International Cooperation in Test Development and Validation [J]. AILA Review, 1991(7): 83-95. 30 Stage, C. Equity Issues in Education and Assessment—Do Males and Females with Identical Test Scores Solve Test Items in the Same Way? [Z]. 23rd Annual Co

53、nference June 1997 Durban South Africa. International Association for Educational Assessment, 1997. 31 Sunderland, J. Gender and Language Testing: Any Connection? Preliminary Explorations [J]. Language Testing Update, 1994 (16): 46-56. 32 Sunderland, J. Gender and Language Testing [J]. Language Te

54、sting Update, 1995(17): 24-35. 33 Sunderland, J. State of the art review article: Gender, language and language education [J]. Language Teaching, ,33(4):203-223. 34 Takala S., & Kaftandjieva, F. Test fairness: a DIF analysis of an L2 vocabulary test [J]. Language Testing, , 17(3):323-340. 35 Th

55、e National Center for Fair & Open Testing. Gender Bias in College Admissions Tests [Z]. Cambridge, MA: National Center for Fair & Open Testing. Available: . March 7, . 36 Wood, R. Sex differences in answers to English language comprehension items [J]. Educational Studies, 1978.4(2): 157 – 165. 3

56、7 Wood, R. Assessment and Testing: A Survey of Research [M]. Cambridge : Cambridge University Press, 1993. 38 陳雨亭.國內(nèi)中小學教科書中性別不平等的社會學分析[J].現(xiàn)代教育科學, (3):40-42. 39 韓寶成. 語言測試的新進展:基于任務的語言測試[J]. 外語教學與研究, , (5): 352-358. 40 李筱菊. 語言測試科學與藝術(shù)[M]. 長沙:湖南教育出版社,1997. 41 李祖祥.現(xiàn)行小學語文教材中的性別偏見[J]. 蒙自師范高等??茖W校學報,, 2(

57、3): 41-44. 42 劉慶思.談談高考英語試卷中的閱讀理解題[J]. 試題研究,1993(下半年,總382):1-3. 43 劉旭東、 田家莉和薛素萍. 大學英語四級成績多因素影響分析[J]. 中北大學學報(社會科學版), (4). 44 曲雯. 掃盲教材中職業(yè)角色的性別分析[J]. 教育與職業(yè),(6):16-18. 45 史靜寰.教材與教學:影響學生性別觀念及行為的重要媒介[J]. 婦女研究論叢,(2):32-36. 46 陶百強. 國內(nèi)高中英語教科書中的性別歧視現(xiàn)象研究[D]. 重慶:西南大學學位論文,a. 47 陶百強. 有關(guān)《一般高中英語課程原則》(實驗)的建議[J

58、]. 基本教育外語教學研究, b, (3): 56-57. 48 肖德法、向平.性別與PETS口試成績研究[J]. 山東外語教學, (1):54-56. 49 楊潔﹑呂改蓮.社會性別刻板印象的直接映射——對小學語文教材人物的性別分析[J]. 陜西師范大學學報(哲學社會科學版), , 31 (4):109-115. 50 袁鳳識、肖德法.課堂體現(xiàn)性別差別與四級成績的關(guān)系研究[J]. 外語與外語教學, (8):22-25. 51 曾天山.論教材文化中的性別偏見[J]. 西北師大學報(社會科學版),1995b,32 (4):34-39. 52 張彬、杜翠琴.性別與英語學習成績間的關(guān)系研究[J]. 社科縱橫, ,19 (1):127-128. 53 張潔﹑楊永林. 小學英語教材建設中的語言性別歧視現(xiàn)象研究[J]. 清華大學教育研究,, 24 (S1):73-76. 54 周勝、傅繼華. 測試與緊張[J]. 外語教學與研究,1994(3):43-46. 55 朱韶暉.對《小學藏語文》教材圖片中存在的性別問題的思考[J]. 青海民族研究,,14 (4):90-92.

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!