英語(yǔ)學(xué)習(xí) 學(xué)英語(yǔ),練聽(tīng)力,上聽(tīng)力課堂! 注冊(cè) 登錄
> 英語(yǔ)學(xué)習(xí) > 英語(yǔ)學(xué)習(xí)方法 >  內(nèi)容

英語(yǔ)學(xué)習(xí)|英語(yǔ)視頻新聞?wù)Z料庫(kù)的構(gòu)建

所屬教程:英語(yǔ)學(xué)習(xí)方法

瀏覽:

2022年01月20日

手機(jī)版
掃描二維碼方便學(xué)習(xí)和分享

【摘要】建設(shè)英語(yǔ)視頻新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)對(duì)于英語(yǔ)的學(xué)習(xí)者具有重要的意義和價(jià)值。結(jié)合語(yǔ)料庫(kù)語(yǔ)言學(xué)理論,從語(yǔ)料庫(kù)的代表性、語(yǔ)料庫(kù)的規(guī)模、語(yǔ)料的抽樣、語(yǔ)料的標(biāo)記、語(yǔ)料的賦碼等幾個(gè)方面探討了英語(yǔ)視頻新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)的建設(shè)程序,提出了一些關(guān)于建設(shè)該類語(yǔ)料庫(kù)的方法和思路。

【關(guān)鍵詞】英語(yǔ)新聞 抽樣 賦碼 語(yǔ)料庫(kù)

語(yǔ)料庫(kù)是真實(shí)語(yǔ)言材料的集合,通常都村粗在計(jì)算機(jī)里,具有信息量大、信息復(fù)雜等特點(diǎn)。作為人們經(jīng)常接觸的語(yǔ)言材料,新聞的內(nèi)容能夠反映社會(huì)生活,新聞?wù)Z言具有強(qiáng)烈的時(shí)代性,對(duì)日常生活用語(yǔ)的使用有著重要的意義,也可以說(shuō)是標(biāo)準(zhǔn)語(yǔ)言,能夠體現(xiàn)現(xiàn)代英語(yǔ)發(fā)展特征和社會(huì)趨勢(shì)。以英語(yǔ)新聞作為選材來(lái)源,建立一個(gè)視頻新聞?wù)Z料庫(kù)并進(jìn)行不同目的的研究具有深遠(yuǎn)的意義和十分重要的價(jià)值。

一、建設(shè)新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)的目的

近幾年來(lái),國(guó)外在新聞?dòng)⒄Z(yǔ)方面的研究有了長(zhǎng)足的進(jìn)步,關(guān)于新聞?dòng)⒄Z(yǔ)的特點(diǎn)及在國(guó)內(nèi)新聞報(bào)道的研究,近幾年來(lái)國(guó)內(nèi)許多著作和論文體現(xiàn)的較多,近年來(lái),國(guó)外在相關(guān)領(lǐng)域已經(jīng)建成了報(bào)刊新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù),例如:路透社報(bào)刊新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù),它存在的主要目的是研究報(bào)刊新聞?dòng)⒄Z(yǔ)。因此,建立一個(gè)用來(lái)分析和研究新聞?dòng)⒄Z(yǔ),提高新聞?dòng)⒄Z(yǔ)的研究能力,提高英語(yǔ)播音主持專業(yè)英語(yǔ)新聞教材的編寫(xiě)和教學(xué)水平的新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù),具有重要的意義。新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)應(yīng)該具有豐富的功能,包含大量的材料,如:視頻新聞?dòng)⒄Z(yǔ)文本、語(yǔ)音文件等。

二、英語(yǔ)新聞聽(tīng)力教學(xué)語(yǔ)料庫(kù)的設(shè)計(jì)原則

語(yǔ)料庫(kù)的設(shè)計(jì)是所有工作的第一步,也是語(yǔ)料庫(kù)建設(shè)中最重要的一個(gè)環(huán)節(jié),設(shè)計(jì)的質(zhì)量會(huì)關(guān)系到語(yǔ)料庫(kù)的質(zhì)量并在一定程度上影響后續(xù)相關(guān)語(yǔ)料庫(kù)的研究。設(shè)計(jì)階段要對(duì)問(wèn)題進(jìn)行全面分析,通常來(lái)說(shuō)要全面考慮,必須充分考慮語(yǔ)料庫(kù)的規(guī)模、內(nèi)容、語(yǔ)料樣本,下面就語(yǔ)料庫(kù)的設(shè)計(jì)原則進(jìn)行闡述。

1.語(yǔ)料庫(kù)的代表性原則。語(yǔ)料庫(kù)建設(shè)的首要原則是代表性原則,它是區(qū)分語(yǔ)料庫(kù)與語(yǔ)料檔案庫(kù)的一個(gè)重要標(biāo)志。一般來(lái)說(shuō),視頻新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)的主要特征是有限的語(yǔ)料樣本能夠最大限度地反映新聞?dòng)⒄Z(yǔ)。因此,這就要求建庫(kù)者應(yīng)該收集盡量豐富的各種形式的文本,這樣在一定程度上可以保證語(yǔ)料庫(kù)的總體特征,提高語(yǔ)料庫(kù)的代表性。

2.語(yǔ)料庫(kù)規(guī)模適度性原則。通常來(lái)說(shuō),語(yǔ)料庫(kù)的規(guī)模要盡量大,這樣可以涵蓋更加豐富的內(nèi)容,但在事實(shí)上操作難度很大,其規(guī)模會(huì)受到很多影響因素的限制。因此,日常管理過(guò)程中,建庫(kù)者是運(yùn)用統(tǒng)計(jì)學(xué)的原理,以語(yǔ)料代表性和合理分配樣本比例為基礎(chǔ),通過(guò)一定比例的樣本從總體上反映語(yǔ)言學(xué)特征,這樣就可以不必片面追求規(guī)模,同樣達(dá)到比較理想的效果。

語(yǔ)料庫(kù)的規(guī)模有四個(gè)層次,分別是:詞次、庫(kù)文本數(shù)量、層間樣本數(shù)量和庫(kù)樣本容量。各層次之間的比例要從平衡的角度進(jìn)行合理分配。綜上所述,隨著科學(xué)技術(shù)的進(jìn)步,應(yīng)用現(xiàn)代化的互聯(lián)網(wǎng)和多媒體技術(shù),可以實(shí)現(xiàn)建立100萬(wàn)詞次容量的廣播新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù),這一規(guī)模就可以完全滿足研究廣播新聞?dòng)⒄Z(yǔ)的需要。

三、語(yǔ)料抽樣

語(yǔ)料庫(kù)自身也存在著矛盾,應(yīng)用過(guò)程中發(fā)現(xiàn)無(wú)盡的語(yǔ)言事實(shí)和有限的語(yǔ)料樣本之間的矛盾是永遠(yuǎn)無(wú)法解決的,語(yǔ)料庫(kù)常見(jiàn)的研究方法是用有限的語(yǔ)料代表整體語(yǔ)言事實(shí)。要盡最大限度的解決這個(gè)問(wèn)題,必須在確定規(guī)模的基礎(chǔ)上根據(jù)統(tǒng)計(jì)學(xué)理論進(jìn)行科學(xué)抽樣,使建成的語(yǔ)料庫(kù)達(dá)到總體效度的標(biāo)準(zhǔn)。

英語(yǔ)視頻新聞?wù)Z料庫(kù)的語(yǔ)料全部從英語(yǔ)新聞選取,語(yǔ)料庫(kù)的建設(shè)目的是為主流標(biāo)準(zhǔn)英美新聞?wù)Z言的研究提供數(shù)據(jù),所以采取英語(yǔ)報(bào)道中的材料。

1.等距抽樣。語(yǔ)料庫(kù)建設(shè)者必須充分考慮所手機(jī)的內(nèi)容要具有多樣性,這樣抽樣時(shí)才具有代表性。當(dāng)新聞報(bào)道遇到重要新聞熱點(diǎn)事件時(shí),如奧運(yùn)會(huì)或者恐怖襲擊等,在一段時(shí)期當(dāng)中新聞報(bào)道將會(huì)用大量篇幅覆蓋該主題,這就會(huì)使抽樣在平衡性上造成偏差。這樣在一段時(shí)間內(nèi)占某一新聞事件將不會(huì)對(duì)語(yǔ)料選取的多樣性和均衡性造成影響,但是從現(xiàn)代統(tǒng)計(jì)學(xué)的觀點(diǎn)來(lái)看,其隨機(jī)指定的方法未免缺乏科學(xué)性和精確性。為了達(dá)到更好的代表性和平衡性,可以采取統(tǒng)計(jì)學(xué)中的等距抽樣的方法,做好樣本排列順序和樣本抽樣間距的設(shè)計(jì)。

2.分層抽樣。分層抽樣是“按照總體已有的某些特征,將總體分成幾個(gè)不同部分,每一部分稱為一層,然后再分別在每一部分中進(jìn)行簡(jiǎn)單隨機(jī)抽樣?!痹诜謱映闃又?,各層子樣本方差可能會(huì)小于總體方差,具有較好的均勻性,可以得到較高的精度,分層抽樣可以減少誤差,提高精度。

3.語(yǔ)料的預(yù)處理、添加文本頭標(biāo)記和文本的結(jié)構(gòu)標(biāo)記。進(jìn)行抽樣后的語(yǔ)料還不能直接加入預(yù)料庫(kù),之前需要進(jìn)行加工和標(biāo)識(shí)。目前常用的方法是在Wordsmith 軟件中撰寫(xiě)命令語(yǔ)句,再導(dǎo)入抽樣后的語(yǔ)料進(jìn)行處理,方便快捷地就可以完成預(yù)處理的工作。

根據(jù)語(yǔ)料庫(kù)建設(shè)的通識(shí)做法,需要對(duì)每篇語(yǔ)料加注文本頭,以提供這篇語(yǔ)料的有關(guān)基本信息。文本頭的標(biāo)記提供包括語(yǔ)料的來(lái)源、收集時(shí)間等七個(gè)方面的基本信息。標(biāo)記的方法可以參照研究者的需要進(jìn)行。

四、語(yǔ)料的賦碼

抽樣語(yǔ)料不經(jīng)過(guò)賦碼只能被稱作生語(yǔ)料。使用生語(yǔ)料庫(kù)只能進(jìn)行制定詞頻表或借助語(yǔ)料庫(kù)檢索軟件對(duì)特定詞的詞頻、用法和搭配加以研究,不能完全發(fā)揮語(yǔ)料庫(kù)在新聞?dòng)⒄Z(yǔ)研究方面的潛力。經(jīng)過(guò)賦碼的語(yǔ)料庫(kù)則具有更廣泛的研究?jī)r(jià)值。

語(yǔ)料庫(kù)的賦碼是對(duì)語(yǔ)料添加語(yǔ)言特征碼的過(guò)程。語(yǔ)料庫(kù)的賦碼有兩種:詞性賦碼和句法賦碼。詞類賦碼目前已可以自動(dòng)進(jìn)行,對(duì)不受限制的語(yǔ)料進(jìn)行自動(dòng)賦碼的準(zhǔn)確率已可達(dá)到96%以上的準(zhǔn)確率,基本上可以滿足語(yǔ)言研究和應(yīng)用的需要。而對(duì)語(yǔ)料進(jìn)行自動(dòng)句法賦碼的準(zhǔn)確率還不高,還沒(méi)有達(dá)到應(yīng)用的程度,對(duì)語(yǔ)料的句法賦碼到目前為止還必須采取計(jì)算機(jī)軟件協(xié)助下的人工賦碼方法 。

英語(yǔ)新聞報(bào)道內(nèi)容豐富,形式多樣,語(yǔ)言靈活,詞語(yǔ)、句法活用情況頻繁。就其英語(yǔ)視頻新聞而言,文本的賦碼不可能達(dá)到絕對(duì)的準(zhǔn)確率,但經(jīng)過(guò)努力可以保證準(zhǔn)確率達(dá)到90%以上,基本達(dá)到后期研究的需要。

五、英語(yǔ)新聞?wù)Z料庫(kù)的應(yīng)用

新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)的建設(shè)和應(yīng)用還需要很長(zhǎng)時(shí)間的探索。嚴(yán)格意義上來(lái)講,“語(yǔ)料庫(kù)本身并不包含和語(yǔ)言相關(guān)的新信息,但基于語(yǔ)料庫(kù)的檢索引擎給我們提供了觀測(cè)舊信息的新視角?!蓖ㄟ^(guò)語(yǔ)料庫(kù)軟件檢索功能,將調(diào)研語(yǔ)料庫(kù)中所有詞按照詞頻高低進(jìn)行排列。通過(guò)頻率詞表除可以觀察不同新聞?wù)Z篇的特點(diǎn),能夠掌握詞匯的頻率等信息,進(jìn)而計(jì)算出選詞指數(shù)。利用語(yǔ)料庫(kù)軟件的文本索引功能對(duì)整個(gè)新聞?wù)Z料庫(kù)進(jìn)行檢索,可以呈現(xiàn)出英語(yǔ)新聞報(bào)道的規(guī)律。

六、結(jié)語(yǔ)

當(dāng)今社會(huì),新聞編輯和文化研究能力只所以得到進(jìn)一步提高,主要取決于英語(yǔ)視頻新聞?wù)Z料庫(kù)及相應(yīng)檢索軟件的發(fā)展和進(jìn)步為其研究提供了一個(gè)新的平臺(tái)。

多媒體技術(shù)從技術(shù)和應(yīng)用角度能夠?yàn)樾侣剰臉I(yè)者、新聞教學(xué)和英語(yǔ)學(xué)習(xí)者提供非常便捷的服務(wù)。借助一些語(yǔ)料庫(kù)檢索軟件,可以快速了解英語(yǔ)新聞詞匯和語(yǔ)篇特征,解析新聞?dòng)⒄Z(yǔ)中的常見(jiàn)詞匯、常用語(yǔ)言的連接關(guān)系。此外,新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)與新聞文本對(duì)應(yīng)的視頻文件還有很多作用,可以提供查詢服務(wù),提供借閱服務(wù),還可以為編寫(xiě)新聞?dòng)⒄Z(yǔ)教材提供了大量豐富的素材,教材編寫(xiě)者還可以通過(guò)軟件的查詢功能實(shí)現(xiàn)快速選取語(yǔ)料庫(kù)中需要的材料,而且還能根據(jù)語(yǔ)料庫(kù)樣本的統(tǒng)計(jì)特征控制所選材料的難易程度,進(jìn)而促進(jìn)新聞?dòng)⒄Z(yǔ)的研究。

參考文獻(xiàn):

[1]Kennedy,Graeme.An Introduction to Corpus Linguistics[M].New York:Longman,1998.

[2]韓寶成.外語(yǔ)教學(xué)研究中的統(tǒng)計(jì)學(xué)[M].北京:外語(yǔ)教學(xué)與研究出版社,2000.

[3][英]霍斯頓.應(yīng)用語(yǔ)言學(xué)中的語(yǔ)料庫(kù)[M].北京:世界圖書(shū)出版公司北京公司,2006.

[4]李曉娜.多模態(tài)話語(yǔ)分析南寧國(guó)際民歌藝術(shù)節(jié)海報(bào)[J].安徽文學(xué)(下半月),2010(12).

[5]王立非,文艷.應(yīng)用語(yǔ)言學(xué)研究的多模態(tài)分析方法[J].外語(yǔ)電化教學(xué),2008(03).

作者簡(jiǎn)介:郭文正(1979-),河南鄭州人,文學(xué)碩士,平頂山學(xué)院外國(guó)語(yǔ)學(xué)院副教授。


用戶搜索

瘋狂英語(yǔ) 英語(yǔ)語(yǔ)法 新概念英語(yǔ) 走遍美國(guó) 四級(jí)聽(tīng)力 英語(yǔ)音標(biāo) 英語(yǔ)入門(mén) 發(fā)音 美語(yǔ) 四級(jí) 新東方 七年級(jí) 賴世雄 zero是什么意思孝感市雍豪府(體育館路)英語(yǔ)學(xué)習(xí)交流群

網(wǎng)站推薦

英語(yǔ)翻譯英語(yǔ)應(yīng)急口語(yǔ)8000句聽(tīng)歌學(xué)英語(yǔ)英語(yǔ)學(xué)習(xí)方法

  • 頻道推薦
  • |
  • 全站推薦
  • 推薦下載
  • 網(wǎng)站推薦