時間:2021年07月14日 分類:教育論文 次數:
摘要:本文通過在線寫作平臺批改網收集不同大學學生的作文文本,自建語料庫,探索不同英語水平的大學生英語作文中的詞塊使用,并將結果與本族語料庫LOCNESS對比。結果顯示,整體來說,普通大學的學生使用的詞塊多于重點大學的學生和本族語大學生。
關鍵詞:語料庫詞塊大學生英語作文
1引言
詞塊是本族語語言使用的一個明顯特征。由于計算機能夠自動提取文本中的詞塊(二詞詞塊,三詞詞塊),研究者們紛紛使用這一方法來比較學習者和本族語作文中詞塊的使用數量、結構特征和話語功能(DeCock,2000;Hyland,2008;Chen&Baker,2010;Adel,2012)。
英語教學論文:“三教”改革背景下高職院校基礎英語金課建設路徑探究
DeCock(2000)比較了本族語和非本族語本科生論文中的詞塊頻率。她發現,非本族語學生使用的二至四詞詞塊更多,而且頻繁使用某些特定詞塊。Chen和Baker(2010)比較了本族語學生論文寫作、非本族語學生論文寫作和本族語專家發表的學術論文中的詞塊。他們發現,非本族語學生使用的名詞詞塊少于本族語學生和本族語專家,介詞詞塊少于本族語專家伹多于本族語學生,本族語和非本族語學生使用的動詞詞塊普遍多于本族語專家。
另外,他們發現,詞塊數量會隨著語言水平的升髙而增加,這與DeCock(2000)的發現相反,他們的解釋是,DeCock(2000)的研究沒有排除重疊詞塊和跟主題相關的詞塊。值得注意的是,學術論文與大學生論文寫作屬于不同的文體,學術論文中使用的詞塊可能不同于大學生論文中的詞塊,因此將這兩者比較不能完全說明大學生論文所用的詞塊過多或過少的問題。
Adel(2012)基于自建的斯德哥爾摩大學英語語料庫,比較了瑞典語學生和英語本族語學生作文中四詞詞塊的使用,結果發現本族語學生作文中的詞塊使用數量更多,種類更多。就語言水平與詞塊使用的關系,也有學者進行了研究。Staples等(2013)收集托福考試的作文,按照分數將其分為低、中、高水平三個部分,結果發現,低水平學習者使用了更多的詞塊。他們的研究表明,低水平學習者更依賴程式性的語言,這也證實了二語習得的一個理論,即早期階段學習者傾向于記憶詞塊,漸漸可以自己構建語言(Ellis,2002)。
而丁言仁,戚焱(2005)基于自建大學生口筆語語料庫對詞塊與口語和寫作水平之間關系的探究,結果發現詞塊對于口語和寫作成績具有很強的預測力,水平髙的學生往往能夠借用更多的詞塊。前人的研究得出了不同的結論。本族語與非本族語學生在詞塊使用上到底有什么區別?非本族語者掌握的詞塊比本族語者少還是多?掌握大量詞塊能否作為本族語學生寫作與非本族語學生寫作的一個重要差異?另外,語言水平與詞塊的使用到底有什么關系?低水平學生使用的詞塊多于還是少于高水平學生?這些問題都值得深入探究。因此,本文在前人研究的基礎上,利用網絡平臺,將學生提交的作文建成語料庫,從結構和功能兩個角度,比較重點大學、普通大學學生與本族語大學生的詞塊使用情況。
2研究設計
2.1
研究問題
1)重點大學學生使用詞塊的結構和功能與普通大學學生使用詞塊的結構和功能有何區別?2)中國大學生使用詞塊的結構和功能與本族語學生使用詞塊的結構和功能有何區別?2.2研究材料本文收集了學生通過批改網平臺(www_pigai.org)提交的作文,共2000篇,其中,普通大學1〇〇〇篇,共184972詞;重點大學1000篇,共240381詞。建成語料庫。
然后,我們將結果與魯汶本族語作文語料庫(LONCESS)作比較。 Chen(2013)啟示我們選取參照語料庫時要考慮語言變體、語類、語域等因素。因此我們選取LONCESS為參照語料庫,因為LONCESS包含的是英國和美國大學生的作文,由于英國大學生的作文有一部分是文學性的文章,因此本文選取美國大學生的作文,它們全部都是議論文,與中國大學生的作文在題材上有可比性。所選美國大學生的議論文176篇,共149574詞。
參照前人研究詞塊的方法,將詞塊按照結構和功能進行分類。將詞塊按照結構分為三類:名詞詞塊、介詞詞塊和動詞詞塊(Chen&Baker,2〇10),名詞詞塊和介詞詞塊又分為名詞/介詞后面帶of和不帶of兩種,動詞詞塊是帶動詞的任何詞塊(如inordertomake)。根據實際情況,將動詞詞塊分為兩大類:含主動動詞的詞塊和含被動動詞的詞塊。含主動動詞的詞塊包括名詞(代詞)+動詞、therebe句型、連詞+小句、疑問詞+小句等幾種。
隨后,參照Biber等人的分類法,將詞塊按照功能分為三類:銜接功能詞塊(說明上下文邏輯關系的銜接詞,如ontheotherhand)、態度功能詞塊(表明作者或他人態度的詞塊,如somepeopleareworried)和指示功能詞塊(指示實體或抽象的物體,如isoneofthe,alargenumberof)(Biberetal,2004)
2.3研究工具本文研究工具為語料庫分析軟件AntConc的N-gram提取四詞詞塊,因為四詞詞塊的意義和功能都較為完整。大型語料庫的頻率分割點為20-40次每百萬詞(如Biberetal,2004),文本經過反復嘗試,把頻率分割點設定為40次每百萬詞,以涵蓋典型詞塊,轉化為絕對頻率就是8次(普通大學),10次(重點大學),4次(美國大學)。
分布范圍通常是出現在3-5個文本中(Biber&Barbieri,2007)或占文本的10°/。(Hyland,2008)。提取四詞詞塊后進行人工過濾,篩掉跟主題相關的詞塊(如loweringthedrinkingage)、包含專有名詞(如intheUnitedStates)的詞塊以及不能表達完整意義和功能的詞塊,之后將詞塊按照結構和功能進行整理分類。
2.4研究過程
要回答前面提出的兩個問題,我們用AntConc的N-gram提取四詞詞塊。首先統計詞塊類符,即語料庫中出現的不同詞塊的個數,然后計算起形符,即詞塊在語料庫中出現的次數,再計算其相對頻率,即詞塊出現的原始頻率/語料庫總詞數XI000000,最后將數據加以比較。
3研究結果首先,我們比較了三個語料庫中詞塊的使用頻率, 普通大學作文中有154個詞塊,重點大學作文中有139個詞塊,美國大學作文中有105個詞塊。總體來看,普通大學使用的四詞詞塊數量和種類多于重點大學學生和本族語學生。這一結果和Staples等(2013)的研究結果一致,他們認為,程式性語言是低水平學習者使用的主要語言手段(Staplesetal,2013)。
下面,我們從結構方面來考察詞塊使用的模式。括號外的是詞塊的類符數,括號里的是詞塊形符的相對頻率。三個語料庫有一個共同點:動詞詞塊的使用頻率都高于名詞詞塊和介詞詞塊,兩個中國大學生作文語料庫中的動詞詞塊甚至高于名詞詞塊和介詞詞塊之和,普通大學生作文中的動詞詞塊最多。由此可見,本族語和非本族語大學生寫作都以動詞詞塊為主。Chen和Baker(2010)認為,動詞詞塊為主的寫作是不成熟寫作的標志(轉引自潘瑤,2016)。
因為相比以動詞為主的小句式寫作,以名詞和介詞短語為主的短語式寫作更便于信息的壓縮和整合,更利于增強語篇的靈活和抽象概念的表達(潘墦,2016:120)。這在一定程度上表明,非本族語大學生和本族語大學生在論文寫作上都不成熟,當然,非本族語大學生更為嚴重。就名詞詞塊來說,本族語大學生使用的名詞詞塊種類更豐富,有34種,普通大學有23種,重點大學16種。
在三個語料庫中,帶of的名詞詞塊使用頻率都低于不帶of的名詞詞塊,在普通大學生作文中,of前使用的名詞從多到少依次是:development,majority,way;在重點大學生作文中,of前使用的名詞只有一個,是:advancement;在本族語大學生作文中,of前使用的名詞從多到少依次是:invention,end,rest,majority,beginning,middle,question,use,advent;可見,就theN+of+N結構來說,本族語大學生使用的名詞更為豐富。
就介詞詞塊來說,帶of的介詞詞塊使用頻率都低于不帶Of的名詞詞塊,在兩個中國大學生作文語料庫中,使用最多的帶Of介調詞塊都是Withthedevelopmentof,可見這個詞塊已經植根于中國大學生腦海中,成為中國大學生寫作的萬能開篇第一句。就動詞詞塊來說,中國大學生和本族語大學生使用的動詞詞塊都多于名詞和介詞詞塊,普通大學學生使用的動詞詞塊最多。
兩組中國學生使用的動詞詞塊的種類和數量均高于本族語學生,在某些類別的動詞詞塊中,這一特征尤為突出。比如,我們發現,兩組中國學生都更多地使用第1、2人稱+動詞,第3人稱+動詞,動詞(代詞)+名詞、therebe句型和動詞短語。但兩組中國學生使用的被動動詞詞塊在種類和數量上要少于本族語學生。就功能分布來說,普通大學生和重點大學生用的態度詞塊的種類和頻率都是最高的;本族語大學生用的指示詞塊的頻率和種類最多。在銜接詞塊的使用上,普通大學生和重點大學生非常接近。銜接詞塊的種類不多,伹頻率非常高。普通大學生主要使用四種銜接詞塊:ontheotherhand,ontheonehand,lastbutnotleast,inthefirstplace。
重點大學生所用的銜接詞塊與普通大學生類似,只是沒有使用inthefirstplace。本族語大學生只用了1個銜接詞塊:ontheotherhand。普通大學生和重點大學生所用的態度詞塊多是引用別人的觀點,如somepeopleworry/fear/think/welcomethat,然后進而表明自己的觀點,如Iagreewiththat/Idon’tthink/Ibelievethatthe等。本族語大學生所用的表示態度的詞塊主要是表達自己的觀點,如Iwouldliketo/Ifeelthatthe/Ifeelthatif,表達另!j人觀點的詞塊僅有一個:manypeoplefeelthat。
普通大學生和重點大學生所用的指示詞塊多是表示數量的詞塊,如alotofthings/time/people等。本族語大學生所用的指示詞塊除了表示數量,還有一部分表示抽象事物,如asaresultof,inthecaseof和時間,如atthebeginningof,attheendof等。正如Chen和Baker(2010:40)所述,指示詞塊在學術寫作中出現的頻率非常高(62%),而大學生不太常用這類詞塊。由于語域差異,大學生在作文中可能不會用到太多指代抽象事物的詞塊。
4討論和結論
本文通過自建作文語料庫,考察了中美大學生議論文詞塊的結構和功能差異。我們發現,詞塊與寫作水平并沒有直接的關系,并不是說,詞塊用得越多,作文就寫得越好。就詞塊的數量和種類來說,普通大學的學生使用的各類詞塊均多于重點大學的學生。除了名詞詞塊以外,中國大學生使用的動詞和介詞詞塊均多于本族語學生。
這也證實了Ellis的假設:即低水平二語學習者嚴重依賴程式化語言,隨著他們水平的提髙,他們朝著自我構建的語言發展(Ellis,2002,p.145)。就詞塊的結構來說,三類大學生都擅長使用動詞短語,沒有意識到名詞短語和介詞短語在論文寫作中的重要作用。
論文寫作屬于正式文體,大學生應該更多使用名詞和介詞短語。另外,中國大學生傾向于使用固定搭配詞塊,如withthedevelopmentof,itisuniversallyacknowledgedthat。很顯然,這些詞塊的使用與學生的背誦有很大關系。就詞塊的功能來說,我們發現,普通大學和重點大學的學生都過度使用銜接詞塊和態度詞塊,而少用表達抽象意義的指示詞塊。
針對中國大學生寫作詞塊運用的一些問題,我們提出以下建議:
(1)寫作中不要盲目照搬詞塊。現在,很多學生的開篇第一旬都是Withthedevelopmentof,不管這是否與主題有關。教師可以多給學生看一些本族語大學生的作文,了解多種開篇方式。(2)減少態度詞塊。寫作中直接闡明自己的觀點,不要過多地寫別人的看法。
(3)減少銜接詞塊。教師要告訴學生表面的銜接是建立在深層的連貫基礎上的,濫用連接詞不能實現深層的連貫,教師還可提供給學生多種銜接方式(重復、上下義等),而不是只用first,second,lastbutnotleast來銜接語篇。(4)適當增加表達抽象意義的指示詞塊(如theextenttowhich,intermsof,onthebasisof等),由于指示詞塊主要是名詞和介詞詞塊,多用這些詞塊可以增加作文中名詞化的比例,符合寫作這一正式文體的規范。總的來說,寫作教學應幫助學生漸漸從機械背誦詞塊過渡到創造性地使用語言上來。
參考文獻 :
[1]Adel,A.&B.Erman.2012.Recurrentwordcombinationsinacademicwritingbynativeandnon?nativespeakersofEnglish:Alexicalbundlesapproach.EnglishforSpecificPurposes,(2):81-92
[2]Biber,D.,&Barbieri,F.2007.Lexicalbundlesinuniversityspokenandwrittenregisters.EnglishforSpecificPurposes,(26):263-286
[3]Biber,D.,S.Conrad&V.Cortes.2004.Ifyoulookat...:Lexicalbundlesinuniversityteachingandtextbooks.AppliedLinguistics,(3):371-405
[4]ChenMeilin.2013.OveruseorunderuseAcorpusstudyofEnglishphrasalverbusebyChinese,BritishandAmericanuniversitystudents[J].InternationalJournalofCorpusLinguistics18:3418-442
[5]Chen,Y.&P.Baker.2010.LexicalbundlesinLIandL2academicwriting.LanguageLearningandTechnology,(2):30-49
作者:趙晴