日韩有码亚洲专区|国产探花在线播放|亚洲色图双飞成人|不卡 二区 视频|东京热av网一区|玖玖视频在线播放|AV人人爽人人片|安全无毒成人网站|久久高清免费视频|人人人人人超碰在线

首頁 > 文章中心 > 古漢語

古漢語

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇古漢語范文,相信會(huì)為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

古漢語范文第1篇

關(guān)鍵詞:偏義復(fù)詞;特點(diǎn);作用

中圖分類號(hào):H109.2 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-5312(2013)08-0211-01

一、古漢語偏義復(fù)詞成因分析

從對(duì)我國(guó)傳統(tǒng)語言學(xué)的研究中不難發(fā)現(xiàn)古人在遣詞造句以表情說理時(shí)往往用語寬緩不迫,偏義復(fù)詞這種兩個(gè)語素并用卻只有一個(gè)語素表義的方法切合了古人的語用習(xí)慣,因而古書中就有大量的偏義復(fù)詞現(xiàn)象。古人在行文時(shí)明明可以用一個(gè)單音詞就可以表達(dá)意思,卻偏兩個(gè)語素連用且其中一個(gè)語素只是作為陪襯,”這種用法并不是古人沒有道理肆意為之,而確實(shí)是古人為追求行文不迫,音節(jié)舒緩,句式整齊的表達(dá)效果而有意而為。

(1)有孫母未去,出入無完裙。(杜甫《石壕吏》)

(2)陟罰臧否,不宜異同。(諸葛亮《出師表》)

例一中“出入”偏“出”義,即是說,出門時(shí)沒有合適的衣服。這是五言詩中為求字?jǐn)?shù)匹配和韻律的需要而加了“入”字,實(shí)則“入”字并不表意。例二也都如此。由此可見,古人行文多用字?jǐn)?shù)相等,結(jié)構(gòu)相當(dāng)?shù)木渥觼磉_(dá)到一種音節(jié)協(xié)調(diào)、對(duì)稱之美,偏義復(fù)詞的大量使用正是切合了古人的語用習(xí)慣。

在上古時(shí)期,單音節(jié)詞還是能滿足人們交際表達(dá)的需要的。然而,到了西周、春秋時(shí)期,單音節(jié)詞的構(gòu)詞方式已經(jīng)遠(yuǎn)不能滿足人們的對(duì)新詞的需求了。偏義復(fù)詞是以單音節(jié)詞連用為基礎(chǔ)而逐漸發(fā)展起來的。可以說,如果沒有雙音節(jié)詞連用的構(gòu)詞方式,也不會(huì)出現(xiàn)偏義復(fù)詞。只是偏義復(fù)詞在構(gòu)詞時(shí)與復(fù)合詞中其他類型有所不同。偏義復(fù)詞是兩個(gè)語素聯(lián)合而成,但其構(gòu)成方式不是簡(jiǎn)單的二者意義的融合或者相加構(gòu)成新義,而是其中一個(gè)單音節(jié)詞在構(gòu)詞的新詞中占據(jù)全部意義,而另一個(gè)單音節(jié)詞則只是虛化成了只表示語法意義。因而偏義復(fù)詞實(shí)際上是由一個(gè)表示詞匯意義的單音節(jié)詞加上一個(gè)沒有詞匯意義只有作為構(gòu)詞成分的語法意義的單音節(jié)詞組合而成。因此不難看出,古人行文修辭上的需要以及漢語雙音詞化的過程都促成了偏義復(fù)詞的產(chǎn)生。

二、偏義復(fù)詞的特點(diǎn)

偏義復(fù)詞特點(diǎn)可從其組合方式和表達(dá)意義兩方面分析。

從組合方式上看,偏義復(fù)詞有兩個(gè)特點(diǎn):一是詞序組合的不固定性;二是語素組合的不穩(wěn)定性。古漢語偏義復(fù)詞是以兩個(gè)單音節(jié)詞組合為基礎(chǔ),它和其他雙音節(jié)合成詞一樣,經(jīng)歷臨時(shí)性的組合到凝成詞的發(fā)展變化。這類偏義復(fù)詞的陪襯語素,只有在特定的語言環(huán)境中才能顯露出來,一旦脫離了具體的語言環(huán)境,其臨時(shí)性即會(huì)消失,恢復(fù)其固有的詞匯意義。有時(shí)會(huì)顛倒語素的順序而組成不同的詞。如:“我有親父母,逼迫兼弟兄?!保ā犊兹笘|南飛》)和“今君相楚二十余年,而王無子,即百歲后將更立兄弟?!保ā妒酚?春申君列傳》)此二例中“弟兄”、“兄弟”都是偏義復(fù)詞,前一例偏義于“兄”,后一例偏義于“弟”。

從偏義復(fù)詞的詞匯意義上看,其具有以下幾方面的特征:詞義的隨意性、狹義性、模糊性。古漢語偏義復(fù)詞因其組合的不凝固性遂導(dǎo)致了其詞義的隨意性。有時(shí)偏義于前一個(gè)語素,有時(shí)有偏義于后一個(gè)語素。而具體偏義那個(gè)語素,就需要在具體的語境中來分析。偏義復(fù)詞也是復(fù)合詞的一種,屬于聯(lián)合式復(fù)合詞。兩個(gè)單音節(jié)語素的組合只是其中一個(gè)承載了全部詞匯意義,另一個(gè)則不表意。因此,它必然有一個(gè)特殊的特點(diǎn),即是它的詞義比構(gòu)成它的兩個(gè)語素的詞義要窄,偏義復(fù)詞的這種特點(diǎn)使得它對(duì)構(gòu)成的詞有限定作用,其狹義性也主要是通過偏義復(fù)詞的陪襯語素的限定作用來體現(xiàn)的。構(gòu)成偏義復(fù)詞的兩個(gè)單音節(jié)語素本身就表意模糊、靈活,而將兩個(gè)單音節(jié)詞放在一起后,由于詞義的限制作用,表意反而比較明確了。但是也正是由于偏義復(fù)詞這種只有一個(gè)語素表義,另一語素不表義的特殊用法,如不在具體的語言環(huán)境中,其表意也是不甚清楚的。

三、偏義復(fù)詞的作用

1、作為一種修辭手段,古漢語偏義復(fù)詞起到了湊足字?jǐn)?shù)、協(xié)調(diào)音節(jié)、舒緩語氣、整齊句式的作用,增強(qiáng)了行文的音樂美。

日出東南隅,照我秦氏樓。(《陌上?!罚?/p>

則祠蚩尤,釁鼓旗。(《史記?封禪書》)

上述例子中,“東南”偏指“東”,“南”只是用來協(xié)調(diào)音節(jié);“鼓旗”偏指“鼓”,連及“旗”,只是為了和上下文相對(duì)應(yīng)。偏義復(fù)詞的陪襯語素在兼顧準(zhǔn)確表義和形式、韻律和諧方面,起到了很好的平衡作用。

2、偏義復(fù)詞可使表達(dá)含蓄、委婉。等級(jí)森嚴(yán)的封建社會(huì),人們迫于種種原因,在表達(dá)自己意思的時(shí)候,忌諱直接說出來。文人們便常用隱晦、委婉、含蓄的方式來表達(dá)。

小結(jié):總之,偏義復(fù)詞形成和發(fā)展的過程紛繁復(fù)雜,作為語言的一種現(xiàn)象,它必然受文化的制約和影響。作為思維的工具,它一定在思維的作用下發(fā)揮作用。古代漢語的偏義復(fù)詞至今受人青睞,又具有如此旺盛的生命力,正是因?yàn)樗哂胸S富、獨(dú)特而重要的語言表達(dá)效果。

古漢語范文第2篇

【關(guān)鍵詞】文言文教學(xué) 雞肋 語言文字 情感

《語文課程標(biāo)準(zhǔn)》明確指出:在語文學(xué)習(xí)過程中,要讓學(xué)生逐步形成積極的人生態(tài)度和正確的價(jià)值觀,提高文化品位和審美情趣。要讓學(xué)生認(rèn)識(shí)中華文化的豐厚博大,吸收民族文化智慧。

錢夢(mèng)龍先生曾經(jīng)感慨地說:“文言文教學(xué)是語文教學(xué)改革的一個(gè)‘死角’”。教材中所選的文言篇章是千古傳誦、文質(zhì)兼美的佳作,在新課改中我們應(yīng)盡力從音韻、形式、情理角度去展示古漢語的美,讓甘如醴酪的美文在學(xué)生心中綻放成璀璨之花。

一、音韻之美

朱熹說過:“大抵觀書須先熟讀,使其言皆若出于吾之口;繼以精思,使其意皆若出于吾之心,然后可以有得也”。葉圣陶先生也說,吟誦能“傳出文字的情趣,暢發(fā)讀者的興趣” 。讀,可以突出形象思維,感悟課文內(nèi)容;讀,可以鑒賞再創(chuàng)造。文言文教學(xué)要做到每堂課都能聽到讀書聲,或老師范讀,或聽名家范讀,或?qū)W生朗讀。 “讀”并不僅是為了活躍課堂氣氛,更是為了把握文言文的音韻神韻。

首先是要求讀準(zhǔn)字音,特別要求掌握通假字、古今字、異讀與破讀。例如“數(shù)”,在“范增數(shù)目項(xiàng)王”句中讀“shuò”,意思是“多次、屢次”;而“數(shù)罟不入池”中讀“cù”意為“密”。又如通假字,“天下云集響應(yīng),贏糧而景從”中“景”通“影”;“君子生非異也,善假于物也”的“生”通“性”。

其次是讀準(zhǔn)句讀節(jié)奏。要求在語言層面上通讀文言文,做到正確停頓,恰當(dāng)理解。如《廉頗藺相如傳》“相如前進(jìn)缶”一句,應(yīng)是“相如/前/進(jìn)缶”,而非“相如/前進(jìn)/缶”;《師說》中的“師道之不傳也久矣!欲人之無惑也難矣”,正確斷句應(yīng)是“師道之不傳也/久矣,欲人之無惑也/難矣”。

再次是要讀出語氣和語勢(shì)。這樣有利于體會(huì)文言文的感情和氣勢(shì),表現(xiàn)出抑揚(yáng)頓挫、跌宕起伏的節(jié)奏感。如《赤壁賦》中“白露橫江,水光接天??v一葦之所如,凌萬頃之茫然”,可以讓學(xué)生邊讀想象:清風(fēng)明月,水色一天;朦朧迷離,羽化登仙。讀《陳情表》中的“但以劉日薄西山,氣息奄奄,人命危淺,朝不慮夕”時(shí)體會(huì)李密的如泣如訴。

古人云:“松聲、澗聲、琴聲、鶴聲……皆聲之至清者,而讀書聲為最?!痹谖难晕慕虒W(xué)過程中,只有對(duì)課文反復(fù)朗讀,才能讓文言文中的無聲語言變成聲情并茂的語言藝術(shù)。

二、形式之美

古人作文很重視文章的形式美,所謂“言而無文,行而不遠(yuǎn)”說的就是這個(gè)。在謀篇布局上或似《阿房宮賦》駢散錯(cuò)落的句式;或似《六國(guó)論》一般正反論述,深入淺出。

在遣詞造句上或似“蜀山兀,阿房出”般高度凝練,6個(gè)字概括了無限深廣的內(nèi)容,而從“?!钡健俺觥钡倪^程,更給讀者留下了馳騁想象的廣闊空間。 特殊句式更是文言文美的體現(xiàn),對(duì)特殊句式的了解也有助于現(xiàn)代漢語的學(xué)習(xí)。如許多成語是從古文演變而來的,如:草木皆兵(判斷句)、古為今用 (被動(dòng)句)、滄海(之)一粟(省略句)、唯利是圖(唯圖利。賓語前置)、生于憂患,死于安樂(于憂患生,于安樂死。狀語后置)……通過學(xué)習(xí),學(xué)生對(duì)成語中的古文知識(shí)點(diǎn)有了全面的了解,對(duì)成語的掌握將更好。

在修辭手法上多用比喻、對(duì)仗、排比、對(duì)偶等讓文章增色不少。如“明星熒熒,開妝鏡也;綠云擾擾,梳曉鬟也;渭流漲膩,棄脂水也;煙斜霧橫,焚椒蘭也”,其中既有排比,又有對(duì)偶和比喻,間接寫出宮中美人之多。

三、情理之美

高中語文課程標(biāo)準(zhǔn)把語文課程性質(zhì)界定為“工具性與人文性的統(tǒng)一”,這是對(duì)語文課程性質(zhì)的認(rèn)識(shí)的歷史性總結(jié)和升華。語文的工具性早已經(jīng)得到了普遍的認(rèn)可。語文的人文性,亦是由該學(xué)科的自身特點(diǎn)所決定。文言文大多是作者“披情入文”的嘔心之作。其中有“茍利國(guó)家生死以,豈因禍福避趨之”的愛國(guó)熱情,有“窮則獨(dú)善其身,達(dá)則兼濟(jì)天下”的仁愛之道,有“積善成德,而神明自得,圣心備焉”的善心德行。學(xué)習(xí)這些文言作品,就是聆聽圣哲先賢的濟(jì)世忠告,體會(huì)中國(guó)古代文人的超然、曠達(dá)、淡泊、寧?kù)o,領(lǐng)略集大成者的才華、品德、襟抱與睿智。

文言文經(jīng)歷了上千年的錘煉,載負(fù)著璀璨的華夏文明,是我們民族精神內(nèi)涵的源頭活水。它之所以能久傳不衰,在于有著永恒的藝術(shù)魅力和無盡的美學(xué)價(jià)值。語文老師肩負(fù)著歷史的責(zé)任和使命,要盡力去發(fā)掘文本中美的因素,讓這些古代文化之精華在教學(xué)中大放異彩,讓古漢語之花璀璨于歷史星河中。

【參考文獻(xiàn)】

1.杜草甬 《葉圣陶論語文教育》河南教育出版社,1986.

2.秦訓(xùn)剛 蔣紅森《高中語文課程標(biāo)準(zhǔn)教師讀本》華中師范大學(xué)出版社,2003.

3.劉永康 翟啟明《中學(xué)語文教學(xué)論》天地出版社2001年.

古漢語范文第3篇

我相信這種說法,因?yàn)檫@是專家靠資料統(tǒng)計(jì)得出的結(jié)論。但是如何將這100個(gè)常見的別字糾正過來?如何把這100個(gè)別字糾正了,再把現(xiàn)在出版物上別字總量的另一半也減少下來,或者說把別字減少到最低限度,恐怕仍然是個(gè)問題。我的看法是,我們的記者、編輯、校對(duì)倘若能夠在繁忙的工作之余,抽空鉆研點(diǎn)古漢語乃至古文字知識(shí)不失為減少錯(cuò)別字的一個(gè)途徑。就拿這最常見的100個(gè)別字來說吧。

粗看這些別字,有不少錯(cuò)得很荒唐,比如說“大拇指”的“拇”字,稍有點(diǎn)古漢語常識(shí)的都會(huì)知道,這是個(gè)形聲字,從“手”“母”聲(《說文》:“拇,將指也?!蔽覀児们也蝗ス芩?。大拇指是長(zhǎng)在手上的(腳上當(dāng)然也有“拇指”),咋也不能寫成“姆”。又如“一鼓作氣”,把“鼓”寫成“股”。稍讀過些古書的人都該知道古文名篇《曹劌論戰(zhàn)》吧,這篇古文講了古代一個(gè)有名的戰(zhàn)例,同志在他的著名的軍事理論著作《中國(guó)革命戰(zhàn)爭(zhēng)的戰(zhàn)略問題》一文中還引用過它,中學(xué)課本中也選用過它?!耙还淖鳉?,再而衰,三而竭”是張口就來的,“鼓”是擂鼓,是名詞用作動(dòng)詞,跟那個(gè)作“大腿”用的“股”字有什么關(guān)系?

荒唐歸荒唐,錯(cuò)誤還是照常發(fā)生了,該有什么辦法?這就說明鉆研點(diǎn)古漢語乃至古文字知識(shí)或者抽空讀一點(diǎn)古文有多重要了。其實(shí)我們不必在理論上有很深的造詣,花很多時(shí)間去研究古人認(rèn)定的漢字的六種造字方法或者古漢語語法知識(shí)什么的,粗知一些,相信也會(huì)減少一些差錯(cuò)的。比如“舶來品”的“舶”?!安皝砥贰本褪菑膰?guó)外進(jìn)口的物品,“舶”是大船,從國(guó)外進(jìn)來得用船。而“泊”的本義該是“湖澤”、“沼澤”,沒有外來的意思?!八沙凇钡摹俺凇保緛硎侵咐瓭M的弓再松弛下來。把弓弦繃在弓上面叫“張”,由這個(gè)意義引申為把弓拉開,張弓時(shí),弦被越拉越緊,所以“張”有了“緊”的意思,“弛”則與之相對(duì),指“松”,《禮記》中說,“一張一弛,文武之道也”。而“馳”則是“車馬疾行”,“松弛”寫成“松馳”,意思不正好反了?再如“針砭”?!搬槨?,本字作“钅咸”,是指縫紉用的工具,引申為“用針刺”,成為中醫(yī)上的醫(yī)療用具?!绊尽笔且环N石針,用石塊制的尖石或石片,用以治癰疽、除膿血,為中醫(yī)最古的醫(yī)療工具,有了金屬后,就主要用“針”為醫(yī)療工具了?!搬槨?、“砭”都是用來治病的,于是同義詞連用,成為一個(gè)詞“針砭”,后引申為“規(guī)勸”、“告誡”、“指出錯(cuò)誤”的意思來,與那個(gè)作“損減”、“抑制”意思的“貶”字根本不是一回事?!俺銎洳灰狻钡摹捌洹保艥h語中是個(gè)無指代詞,意為“他的”,指對(duì)方,戰(zhàn)爭(zhēng)中用計(jì)謀必要出敵方意料之外方為好計(jì),“其”寫成“奇”就大錯(cuò)特錯(cuò)了?!熬狻?、“震撼”、“遷徙”、“宣泄”都是同義詞連用,把“粹”換成“萃”、“撼”換成“憾”、“徙”換成“徒”、“宣”換成“渲”就不是了,意思也大不對(duì)了。類似這些個(gè)字、詞,不寫錯(cuò)或者一時(shí)拿不準(zhǔn)問個(gè)為什么,然后糾正過來,不需要高深的理論知識(shí)吧?

粗知古漢語常識(shí)能解決一些問題,但若能在閑暇之余往深處鉆一鉆,或者讀點(diǎn)古代的文化典籍,也許是一件不錯(cuò)的事,沒準(zhǔn)還能有點(diǎn)“小發(fā)現(xiàn)”讓人欣喜不已。比如:

“安裝”?!鞍惭b”的“安”字常被錯(cuò)寫成“按”,表面上看,“安裝”不得用手嗎?于是把“安裝”寫成“按裝”似乎順理成章了?!鞍惭b”不能寫成“按裝”,許多人會(huì)想,“安裝”怎么就和“安定”、“安全”、“平安”的“安”連在一起了呢?其實(shí),認(rèn)真分析一下“安裝”的“安”字,還真讓人不得不佩服古人看問題看得遠(yuǎn)、看得深,辦事認(rèn)真,而且注重結(jié)果,講求效果,不像“今人”那樣短視,重形式,輕效果?!鞍惭b”是“安”的本義的引申?!鞍惭b”的本義是“安居”、“居處”?!墩f文》:“宀,交覆深屋也。象形,從女在宀中?!薄板病笔且凰孔樱艜r(shí)男子下地干活,女子在家操持家務(wù),這才像個(gè)家,這才讓人感到“安定”、“安寧”。由此引申,“安”有了“安全”、“安定”、“穩(wěn)定”、“安逸”等意思。《漢語大辭典》把“安”字列了11個(gè)意思后,到第12個(gè)列出了個(gè)“安裝、設(shè)置”??梢哉f,在古人看來,你“安裝”一個(gè)什么東西,哪怕擺放一件家具或什物,你得給擺穩(wěn)當(dāng)了,不能擺不穩(wěn),那樣不安全,給人不安定的感覺,我盡管注重工作的方式方法,但更看重結(jié)果、效果。從“安裝”的“安”字不能寫成“按”,足可以看出我們的古人辦事的嚴(yán)肅勁、認(rèn)真勁來。

古漢語范文第4篇

詞異讀的成因。其中通用假借、古今字、外來語及古書注解相沿而致是主要原因,而“破讀”所致也是重要

原因。本文還對(duì)古漢語異讀字的異讀音,進(jìn)行了分類,并舉例加以說明。

關(guān)鍵詞古漢語異讀字分類

***

古漢語中的某些字詞要異讀,原因是很多的。其中,由于通用假借、古今字、外來語以及古書注解相沿

所致則是一個(gè)重要原因。其現(xiàn)象有如下幾種:

1.通假字的本義和假借義讀音不用。在古漢語的書面語言里,常有這樣的情形:本來有的字不用,卻用

另一個(gè)字來代替,造成讀者的不同。如“信”字,其本義是表示“誠(chéng)實(shí)”、“信任”、“的確”、“任意”

、“使者”等意思,讀xìn。

例信而見疑,忠而被謗,能不怨乎?(《史記·屈原賈生列傳》)

自可斷來信,徐徐更謂之。(《玉臺(tái)新詠·古詩為焦仲卿妻作》)

但有時(shí)卻假借為“伸展”、“伸張”的意思,即與“伸”同義,讀為shēn。

例狼欣然從之,信足先生。(馬中錫《中山狼傳》)

是故不爭(zhēng)天下之交,不養(yǎng)天下之權(quán),信己之私,威加于敵,故其城可拔,其國(guó)可隳隳(《孫子·九地

》)

又如“歸”字,其本義是表示“返回”、“歸還”、“女子出嫁”、“歸附”等意思,讀guī。

例執(zhí)訊獲chǒu@①,薄言還歸。(《詩經(jīng)·小雅·出車》)

余既為此志,后五年,吾妻來歸,時(shí)至軒中,從余問古事,或憑幾學(xué)書。(歸有光《項(xiàng)脊軒志》)

江表英豪咸歸附之,已據(jù)有六郡,兵精糧多,足以立事。(《資治通鑒·赤壁之戰(zhàn)》)

但又假借為“饋”,即贈(zèng)送的意思,讀kuì。

例陽貨欲見孔子,孔子不見。歸孔子豚。(《論語·陽貨》)

2.古今字由于其分工不同,讀音亦不盡相同。在上古時(shí)代,特別是先秦時(shí)代,漢字的數(shù)量比后世要少得

多,一個(gè)字往往要表示幾個(gè)不同的含義,這就造成某些字“兼職”過多的現(xiàn)象。譬如“說”字,就兼任“解

說”、“講”、“言論”、“勸說”、“喜悅”等義項(xiàng)。當(dāng)其表達(dá)“解說”、“講”、“言論”等意思時(shí),

讀shuō。

例請(qǐng)說之。吾從北方聞子為梯,將以攻宋。(《墨子·公輸》)當(dāng)其表達(dá)“勸說”的意思時(shí),讀shuì

。

例公子患之,數(shù)請(qǐng)魏王,及賓客辯士說王萬端。(《史記·魏公子列傳》)

而當(dāng)其表達(dá)“喜悅”的意思時(shí),通“悅”,讀作yué。

例學(xué)而時(shí)習(xí)之,不亦說乎?(《論語·學(xué)而》)

為了避免一字兼職太多,后來才造了“悅”字,分擔(dān)了“喜悅”的義項(xiàng)。

再如“責(zé)”字,本為“債”字,讀zhài。

例公說,使有司寬政、毀關(guān)、去禁、薄斂、已責(zé)。(《左傳·昭公二十年》)

誰習(xí)計(jì)會(huì),能為文收責(zé)于薛者乎?(《戰(zhàn)國(guó)策·馮諼客孟嘗君》)

當(dāng)其在兼任“索取”、“要求”、“譴責(zé)”、“處罰”等義項(xiàng)時(shí),則讀zè。

例里胥猾黠,假此科斂丁口,每責(zé)一頭,輒傾數(shù)家之產(chǎn)。(《聊齋志異·促織》)

抑又聞之,古者重冠禮,將以責(zé)成人之道,是圣人所尤用心者也。(柳宗元《答韋中立論師道書》)

梁客辛垣衍安在?吾請(qǐng)為君責(zé)而歸之?。ā稇?zhàn)國(guó)策·魯仲連義不帝秦》)

后來,由于有了“債”字,就將該條義項(xiàng)區(qū)分出來。

又如“賈”字,兼有“買賣”、“商人”、“價(jià)錢”、賈姓等義項(xiàng)。表示“買賣”、“商人”等意思時(shí)

,讀gǔ。

例商農(nóng)工賈,不敗其業(yè)。(《左傳·宣公十二年》)

年長(zhǎng)色衰,委身為賈人婦。(白居易《琵琶行》)

表示“價(jià)錢”之義,讀jià。

例有美玉于斯,韞@②而藏諸?求善賈而沽諸?(《論語·子罕》)

表示姓氏,讀jiǎ。

后來由于有了“價(jià)(jià@③)字,才分擔(dān)了“價(jià)錢”這一義項(xiàng)。

3.許多人名、地名、物名保留了古代的讀音,與今音異讀。如“食”、“其”等,在用于人名時(shí),“讀yì,“其”讀jī。

例信引兵東,未渡平原,聞漢王使酈食其已說下齊,韓信欲止。(《史記·淮陰侯列傳》)

“射”在用于古代鐘名時(shí),讀yì。

例噌@④者,周景王之無射也,kuǎn@⑤坎鏜@⑥者,魏莊子之歌鐘也。(蘇軾《石鐘山記》)

在用作草名時(shí),讀yè。

例西方有木焉,名曰射干,莖長(zhǎng)四寸,生于高山之上,而臨百仞之淵。(《荀子·勸學(xué)》)

“房”在作古宮名時(shí),讀páng。

例六王畢,四海一,蜀山兀,阿房出。(杜牧《阿房宮賦》)

4.有些來自外族語言的國(guó)名、人名、姓氏名等,讀音也較為特殊。如“大宛”是古西域的國(guó)名,“宛”

則讀作yuān。

例大宛聞漢之饒財(cái),欲通不得,見騫,喜,問欲何之。(《漢書·張騫傳》)

“可汗”,是對(duì)古鮮卑、突厥、回紇等少數(shù)民族的君長(zhǎng)的稱呼,讀kèhán。

例可汗問所欲,木蘭不用尚書郎;愿馳千里足,送兒還故鄉(xiāng)。(《樂府詩集·木蘭詩》)

“氏”,漢代西域有大月氏、小月氏?!笆稀弊xzhī。

例(張)騫以郎應(yīng)募,使月氏,與堂邑氏胡奴甘父,俱出隴西。(《史記·大宛列傳》)

又如漢代對(duì)匈奴王后稱“閼氏”,“氏”讀zhī。

例及衛(wèi)律所將降者,陰相與謀劫單于母閼氏歸漢。(《漢書·李廣蘇建傳》)

古漢語某些字詞異讀的另一個(gè)重要原因,是由于“破讀”所致。所謂“破讀”(亦稱“讀破”),就是

用改變一個(gè)字詞的讀音來表示不同的意義或者不同的詞性。這實(shí)際上是詞義引申發(fā)展的結(jié)果。語言中的某一

個(gè)字詞,當(dāng)其產(chǎn)生了新的意義或新的語法作用時(shí),為了在讀音上有所區(qū)別,并使之表達(dá)得更加明確,就把這

個(gè)字詞讀為另一種讀音,以表示差異。這種現(xiàn)象,概括起來有如下兩類:

1.有的字詞的不同含義,是用不同的讀音來加以區(qū)分的。如“殷”字,在表示“眾多”、“富裕”、“

深厚”等意思時(shí),讀yīn。

例劉璋@⑩弱,張魯在北,民殷國(guó)富而不知存恤。(陳壽《隆中對(duì)》)

書中情意甚殷,即長(zhǎng)者之不忘老父,知老父之念長(zhǎng)者深也。(宗臣《報(bào)劉一丈書》)

當(dāng)其表示“震動(dòng)”的意思時(shí),讀作yìn。

例熊咆龍吟殷巖泉,lì@⑦深林兮驚層巔。(李白《夢(mèng)游天姥吟留別》)

當(dāng)表示“赤黑色”時(shí),則讀Yān。

例自始合而矢貫余手及肘,余折以御,左輪朱殷,豈敢言?。。ā蹲髠鳌こ晒辍罚?/p>

再如“惡”字,在表示“罪過”、“兇惡”、“壞人”等意思時(shí),讀è。

例不幸呂師孟構(gòu)惡于前,賈余慶獻(xiàn)諂于后,予羈縻不得還,國(guó)事遂不可收拾。(文天祥《〈指南錄〉

后序》)

失時(shí)不雨,民且狼顧,歲惡不入,請(qǐng)賣爵子,既聞耳矣,安有為天下阽危者若是而上不驚者?(賈誼

《論積貯疏》)

噫!渫惡吏忍于鬻獄,無責(zé)也。(方苞《獄中雜記》)

當(dāng)表示“討厭”、“憎恨”等意思時(shí),讀wù。

例好逸惡勞,亦猶夫人之情也。(黃宗羲《原君》)

死亦我所惡,所惡有甚于死者,故患有所不避也。(《孟子·告子上》)

而當(dāng)表示“怎”、“如何”等意思時(shí),則讀wù。

例以小易大,彼惡知之?(《孟子·梁惠王上》)

2.有的字詞的不同詞性,也是靠不同的讀音來予以區(qū)分的。這里有幾種情況:其一是名詞改換為動(dòng)詞時(shí)

所造成的不同讀音。譬如:

“王”字在充當(dāng)名詞時(shí),表示“帝王”、“諸侯王”的意思,就讀wáng。

例上胡不法先王之法?(《呂氏春秋·察今》)

而當(dāng)其充當(dāng)動(dòng)詞、表示“成就王業(yè)”、“旺盛”等意思時(shí),則讀wàng。

例以力假仁者霸,霸必有大國(guó);以德行仁者王,王不待大。(《孟子·公孫丑上》)

不蘄畜乎樊中——神雖王,不善也。(《莊子·養(yǎng)生主》)

又如“度”字,在作名詞、并表示“計(jì)量長(zhǎng)短的標(biāo)準(zhǔn)”、“限度”、“法制”、“氣度”、“度過”等思時(shí),讀dù。

例已得履,乃曰:“吾忘持度?!狈礆w取之。(《韓非子·外儲(chǔ)說左上》)

生之有時(shí)而用之亡度,則物力必屈。(賈誼《論積貯疏》)

衡下車,治威嚴(yán),整法度,陰知奸黨名姓,一時(shí)收禽,上下肅然,稱為政理。(《后漢書·張衡傳

》)

在作動(dòng)詞、并表示“計(jì)量”、“揣測(cè)考慮”等意思時(shí),讀duó。

例試使山東之國(guó)與陳涉度長(zhǎng)挈大,比權(quán)量力,則不可同年而語矣。(賈誼《過秦論》)

詩云:“他人有心,予忖度之?!薄蜃又^也。(《孟子·梁惠王上》)

其二是形容詞改作動(dòng)詞、名詞時(shí)造成的不同讀音。如:

“好”字,在充當(dāng)形容詞、并表示“美好”、“友好”等意思時(shí),讀hǎo。

例不如叔也,洵美且好。(《詩經(jīng)·鄭風(fēng)·叔于田》)

若備與彼協(xié)心,上下齊同,則宜撫安,與結(jié)盟好。(《資治通鑒·赤壁之戰(zhàn)》)

在充作動(dòng)詞,表示“喜好”的意思時(shí),讀hào。

例王之好樂甚,則齊國(guó)其庶幾乎?(《孟子·梁惠王上》)

再如“臭”字,在充當(dāng)形容詞,表示與“香”相對(duì)的意思時(shí),讀chòu。

例一薰@⑧,十年尚猶有臭。(《左傳·僖公四年》)

在作名詞,表示“氣味”時(shí),讀xiù。

例所謂誠(chéng)其意者,毋自欺也,如惡惡臭,如好好色。(《禮記·大學(xué)》)

其三是主動(dòng)詞改作被動(dòng)詞時(shí)造成的不同讀音。如“見”字,在作主動(dòng)詞、且表示“看見”、“召見”等

意思時(shí),讀jiàn。

例一日不見,如三秋兮。(《詩經(jīng)·王風(fēng)·采葛》)

在表示被動(dòng)、作“引見”義,或作“顯現(xiàn)”時(shí),讀xiàn。

例初,齊豹見宗魯于公孟,為驂乘馬。(《左傳·昭公二十年》)

臏至,龐涓恐其賢于己,疾之,則以法刑斷其兩足而黥之,欲隱無見。(《史記·孫子吳起列傳》

關(guān)于古漢語異讀字的異讀音,大抵來講,有四種不同類型。

一類是韻母相同,聲母不相同。如“乘”字,在表示“駕”、“坐”、“趁”的意思時(shí),讀chéng。

例二子乘舟,汛汛其景。(《詩經(jīng)·邶風(fēng)·二子乘舟》)

而在代表“車輛”和作“四”的代稱時(shí),讀shèng。

例于是為長(zhǎng)安君約車百乘,質(zhì)于齊,齊兵乃出。(《戰(zhàn)國(guó)策·觸龍說趙太后》)

鄭商人弦高將市于周,遇之,以乘韋先牛十二犒師。(《左傳·僖公三十二年》)

再如“虧”字,在表示“減少”、“毀壞”的意思時(shí),讀kuī。

例不虧不崩,不震不騰。(《詩經(jīng)·魯頌·bì@⑨宮》)

芳與澤其雜糅兮,唯昭質(zhì)其猶未虧。(屈原《離騷》)

而當(dāng)表示“差異”的意思時(shí),同“詭”,讀guǐ。

例其時(shí)已與先王之法虧矣,而曰此先王之法也,而法之。(《呂氏春秋·察今》)

第二類是聲母相同,韻母不同。如“讀”字,在表示“誦讀”的意思時(shí),讀dú。

例又尚論古之人,頌其詩,讀其書,不知其人可乎?(《孟子·萬章下》)

而表示“句讀”(即不足一句,讀時(shí)須稍有停頓之處)的意思時(shí),則讀dòu。

例彼童子之師,授之書而習(xí)其句讀者,非吾所謂傳其道解其惑者也。(韓愈《師說》)

又如“泛”,在表示“漂浮”、“廣泛”的意思時(shí),讀fàn。

例余感焉,以杜君之言泛訊之,眾言同,于是乎書。(方苞《獄中雜記》)

而在表示“覆、翻”的意思時(shí),讀fěng。

例大命將泛,莫之振救。(賈誼《論積貯疏》)

第三類是聲調(diào)不同。如“創(chuàng)”字,當(dāng)表示“始造”、“首創(chuàng)”的意思時(shí),讀作chuàng。

例先帝創(chuàng)業(yè)未半,而中道崩殂。(諸葛亮《出師表》)

在表示“創(chuàng)傷”的意思時(shí),讀chuāng。

例夫身中大創(chuàng)十余,適有萬金良藥,故得無死。(《史記·魏其武安侯列傳》)

第四類是聲、韻母均不同。如“罷”字,在表示“停止”、“罷免”等意思時(shí),讀bà。

復(fù)請(qǐng)之,吾輩無生理,而主讞者亦各罷去。(方苞《獄中雜記》)

當(dāng)表示“困?!钡囊馑迹ā捌!?,讀作pí。

例庶民罷敝,而宮室滋侈。(《左傳·昭公三年》)

又如“女”字,在表示女性的意思時(shí),讀nǚ。

例不聞爺娘喚女聲,但聞燕山胡騎鳴啾啾。(《樂府詩集·木蘭詩》)

在表示“以女嫁人”的意思時(shí),讀nü。

例堯之于舜也,使其子九男事之,二女女焉。)《孟子·萬章下》)

而在作人稱代詞時(shí),則通“汝”,讀作rǔ。

例三歲貫女,莫我肯顧。(《詩經(jīng)·魏風(fēng)·伐檀》)

一些常見的異讀字,因其流傳的歷史久遠(yuǎn),而且有的已進(jìn)入現(xiàn)代漢語的書面或口頭語之中,有了較廣泛

的群眾基礎(chǔ);同時(shí)許多工具書和古書的注本中,也都注明了它的讀音,因此應(yīng)按傳統(tǒng)的習(xí)慣去讀。而那些較

為少見的、也未保留在現(xiàn)代漢語中的異讀字,或者人民群眾已改讀為一般讀音的字詞,就應(yīng)按照現(xiàn)在的習(xí)慣

去讀。我們今天不必耗費(fèi)精力去研討它的舊讀音,以免給學(xué)習(xí)者造成不必要的麻煩。如山東費(fèi)縣的“費(fèi)”,

舊讀為bì,現(xiàn)已改讀為fèi;“葉公好龍”的葉,舊讀為shè,今一般讀為yè。再如“暴露”的暴,傳統(tǒng)

的讀音本應(yīng)是pù,但現(xiàn)已約定俗成,讀作bào,就不必固執(zhí)舊讀了。

(作者單位:蘭州鐵道學(xué)院社科部責(zé)任編輯:孟恩)

字庫(kù)未存字注釋:

@①原字為酉加鬼,為左右結(jié)構(gòu)。

@②原字為匚加賣,為半包圍結(jié)構(gòu)。

@③原字為價(jià)的繁體字。

@④原字為口加肱的右半部,為左右結(jié)構(gòu)。

@⑤原字為穴下加款,為上下結(jié)構(gòu)。

@⑥原字為革加搭的右半部,為左右結(jié)構(gòu)。

@⑦原字為忄加栗,為左右結(jié)構(gòu)。

@⑧原字為艸加犭加酉,為上下結(jié)構(gòu)。

古漢語范文第5篇

關(guān)鍵詞:語料庫(kù)建設(shè)中古漢語語料標(biāo)注語料檢索

一、 前言

自20世紀(jì)80年代始,中古漢語研究取得了長(zhǎng)足進(jìn)展。然而遺憾的是,古漢語語料庫(kù)的建設(shè)遠(yuǎn)遠(yuǎn)地落后于研究的進(jìn)展。綜觀國(guó)內(nèi)外研究現(xiàn)狀,要么對(duì)中古的語料收錄不多,要么沒有進(jìn)行精細(xì)加工。(董志翹2011)中古時(shí)期是漢語的質(zhì)變期,中古漢語的研究對(duì)于理清漢語語音、詞匯、語法等的發(fā)展脈絡(luò)有著不可或缺的作用?,F(xiàn)今語料庫(kù)中收錄的中古語料十分不足,而未做分詞標(biāo)注等深層加工又在很大程度上減弱了語料庫(kù)的整體使用價(jià)值。為使中古漢語研究不斷走向縱深,并有更加整體定性的研究方法和多層面的分析角度,建設(shè)深加工的研究型中古漢語語料庫(kù)十分必要。

中古時(shí)期的語言面貌與現(xiàn)代很不相同,兩者在語料庫(kù)的構(gòu)建上也必然存在差別。一方面,無論在語言學(xué)理論,還是語料庫(kù)理論上,針對(duì)現(xiàn)代漢語的研究均更為成熟。特別是在分詞標(biāo)準(zhǔn)、語法標(biāo)注類別等方面,現(xiàn)代漢語成果頗多,不僅有權(quán)威的分詞規(guī)范出版,句法分析、格語法、框架語法等多種語法研究也產(chǎn)生了大量研究成果。中古漢語及其語料庫(kù)構(gòu)建理論的相關(guān)研究則還很薄弱,尚有待進(jìn)一步探索。另一方面,中古漢語語料庫(kù)在構(gòu)建技術(shù)上還比較落后,自動(dòng)分詞、自動(dòng)標(biāo)注的相關(guān)研究相對(duì)滯后,這不僅加大了人工操作的工作量,也不利于提高分詞、標(biāo)注的一致性,為語料庫(kù)的構(gòu)建質(zhì)量埋下了隱患。除此之外,由于中古漢語只存留在文獻(xiàn)中,并不會(huì)出現(xiàn)在日常交際中,這使得語料庫(kù)在構(gòu)建目的、加工方法、加工層級(jí)上與現(xiàn)代漢語語料庫(kù)也有所不同。中古漢語語料庫(kù)的構(gòu)建目的較為單一,主要服務(wù)于漢語史研究和古漢語學(xué)習(xí),這就要求在構(gòu)建時(shí)更加注重傳統(tǒng)句法、古代特殊語法、特殊語用現(xiàn)象的標(biāo)注,以及疑難字的解析、與現(xiàn)代漢語的對(duì)譯等。

中古漢語研究型語料庫(kù)主要收錄從東漢到隋的傳世文獻(xiàn)37本,除此之外還有匯集的詩歌雜帖及出土的中古文獻(xiàn)。收錄原始語料的庫(kù)容約1000萬字(化振紅2014),加工后的庫(kù)容將大大擴(kuò)展,包括書籍庫(kù)、句子庫(kù)、詞匯庫(kù)、疑難字庫(kù)、義項(xiàng)庫(kù)、編碼庫(kù)六大不同層級(jí)的子庫(kù)。語料庫(kù)采用開源的MySQL數(shù)據(jù)庫(kù)[1]對(duì)語料信息進(jìn)行存取,本文擬就語料庫(kù)構(gòu)建的相關(guān)問題,進(jìn)行較深入說明。

二、 語料庫(kù)構(gòu)建原則及方法

(一) 語料庫(kù)構(gòu)建目標(biāo)及原則

中古漢語研究型語料庫(kù)是基于中古漢語書面語的共時(shí)專語語料庫(kù),在建立語料庫(kù)之初首先要明確的是語料庫(kù)構(gòu)建的目標(biāo)和原則。

中古漢語語料庫(kù)建設(shè)的主要目標(biāo)有: 1) 提供經(jīng)過校勘的中古文獻(xiàn)已校注的電子版;2) 為中古各種詞匯、語法、搭配等語言現(xiàn)象提供可進(jìn)行統(tǒng)計(jì)的平臺(tái);3) 為中古文獻(xiàn)提供可靠的釋義,為機(jī)器翻譯、語言學(xué)習(xí)領(lǐng)域提供基礎(chǔ)材料;4) 為中古漢語語言研究提供大量好的語言實(shí)例。

中古漢語語料庫(kù)設(shè)計(jì)遵循的總原則是: 1) 語料庫(kù)的設(shè)計(jì)和建設(shè)在系統(tǒng)的理論語言學(xué)原則指導(dǎo)下進(jìn)行;2) 語料庫(kù)語料的構(gòu)成有明確的語言學(xué)理論指導(dǎo),按照一定比例收集語料,而不是中古文獻(xiàn)的簡(jiǎn)單堆砌;3) 中古漢語研究型語料庫(kù)作為中古時(shí)期語言運(yùn)用的樣本,須采用科學(xué)的方法確定各種語料的比例,使語料具有代表性;4) 語料加工時(shí)采用自動(dòng)和人工相結(jié)合的方式;5) 語料庫(kù)中語料以電子文本形式儲(chǔ)存并且可以方便快捷地通過計(jì)算機(jī)對(duì)語料進(jìn)行各種處理。

(二) 語料庫(kù)模塊劃分

在明確構(gòu)建目的和原則的基礎(chǔ)上,初步確立了語料庫(kù)構(gòu)建所涉及的幾個(gè)模塊,具體如圖1所示:

圖1中“語料選取及整理”“語料加工”是針對(duì)具體語料進(jìn)行的工作,是把選定、加工后的語料整合起來,以一定方式存儲(chǔ)在數(shù)據(jù)庫(kù)中?!罢Z料庫(kù)管理及使用”是提供管理和使用該數(shù)據(jù)庫(kù)的平臺(tái),針對(duì)構(gòu)建好的語料庫(kù)設(shè)計(jì)管理、檢索系統(tǒng),以便為研究者提供共享服務(wù)。這三大模塊在語料庫(kù)構(gòu)建中都至關(guān)重要,其中“語料選取及整理”是基礎(chǔ),“語料加工”是核心,這兩者屬語料庫(kù)本體層,決定了語料庫(kù)構(gòu)建的質(zhì)量?!罢Z料庫(kù)管理及使用”屬語料庫(kù)應(yīng)用層,決定了語料庫(kù)的功能和用戶體驗(yàn)。這里先介紹本體層的兩個(gè)環(huán)節(jié)。

(三) 語料選取及分類

語料是構(gòu)成語料庫(kù)的基礎(chǔ),語料的選取是影響語料庫(kù)質(zhì)量的重要因素。中古語料庫(kù)所收錄的絕大多數(shù)為東漢至隋朝時(shí)期的文I,在選取語料時(shí)要遵循代表性、平衡性、關(guān)聯(lián)性與區(qū)別度、特色性四大原則,(化振紅2014)以保證對(duì)中古時(shí)期語言事實(shí)的覆蓋率。入庫(kù)的語料如表1所示:

由于影響語言全貌的內(nèi)在因素有很多,單純從某一特征來界定語料庫(kù)的代表性、平衡性是不夠的,薩默斯主張采用一種“廣泛的客觀定義的文本類型”(Leech 1991),基于該理論,本文主張從多個(gè)角度采用多種特征突出語料的區(qū)別度,如成書時(shí)代、作者、作者地域、類型、出土/傳世文獻(xiàn)、語體等,這就使得對(duì)語料庫(kù)平衡性的界定突破了簡(jiǎn)單的線性描述。中古語料庫(kù)在收錄語料時(shí),在確保語料規(guī)模的基礎(chǔ)上,盡量均衡語料所具備的各種特征,并保證各種特征的值在所有特征值中不是獨(dú)一份的(除“作者”外),從而提高語料庫(kù)的代表性和平衡性。

中古時(shí)期的文獻(xiàn)雖然以文言為主,但古白話已經(jīng)開始興起,文獻(xiàn)中的口語成分在數(shù)量上雖然比不上文言成分,其增量也十分可觀。然而文獻(xiàn)中的口語成分與書面語成分并不是截然分開的,而是相互混雜、難以剝離的,比如,不少漢譯佛經(jīng)的受眾是廣大勞動(dòng)人民,為了便于傳播,其口語化程度更深;農(nóng)書、醫(yī)書強(qiáng)調(diào)實(shí)用性,口語性也較為突出,等等?;谥泄艥h語的這一特點(diǎn),再加上目前市面上已有的文獻(xiàn)情況,中古語料庫(kù)確定各種語料的大致收錄比例如表1,其中官修正史和漢譯佛典類語料現(xiàn)存最多,也最具代表性,因此收錄數(shù)量也分別為最多、次多;其次分別是出土文獻(xiàn)、筆記小說、詩歌等。

除此之外,對(duì)語料的加工方式及層次也進(jìn)行了分類。標(biāo)記型指對(duì)分詞后的語料僅進(jìn)行句法層面的標(biāo)注,加工層級(jí)較淺;標(biāo)注型指對(duì)分詞后的語料進(jìn)行句法、語義、語用等方面的標(biāo)注,加工層級(jí)較深;而自動(dòng)型指僅借助中古漢語分詞軟件對(duì)語料進(jìn)行分詞的粗加工。從表1可以看出,目前中古漢語語料庫(kù)中絕大多數(shù)為深加工語料,標(biāo)注型與標(biāo)記型語料的比例將近1∶6。

(四) 語料加工

語料庫(kù)作為一種研究資源,其價(jià)值不能僅僅通過規(guī)模來衡量,語料庫(kù)更重要的價(jià)值在于通過加工給語料庫(kù)帶來的“附加”價(jià)值。這種“附加”價(jià)值就是對(duì)語料庫(kù)進(jìn)行多種有用語言信息的加工標(biāo)注,以擴(kuò)展語料庫(kù)的語言信息含量,從而對(duì)語言研究做出更大貢獻(xiàn)。生語料庫(kù)[2](尤其是漢語)包含的詞法和句法等信息非常少,因此其應(yīng)用價(jià)值也就相對(duì)有限。分詞是漢語語料庫(kù)建設(shè)的基礎(chǔ)性工作,也是進(jìn)行語料標(biāo)注的前提,而詞是從句子中提取出來的。因此,中古語料庫(kù)語料加工流程包括斷句、分詞、標(biāo)注三個(gè)部分,具體如圖2所示。

圖2中,斷句是把文本拆成長(zhǎng)短合宜的句子,并對(duì)句子進(jìn)行篇章、書籍頁碼等相關(guān)信息的標(biāo)注;分詞是把斷句后的句子根據(jù)中古時(shí)期語言的實(shí)際使用情況拆分為詞語;標(biāo)注是對(duì)拆分后的詞語進(jìn)行詞性、句法、義項(xiàng)、按語等相關(guān)信息的標(biāo)注。中古語料庫(kù)中的斷句過程相對(duì)簡(jiǎn)單,不贅述,這里主要介紹分詞和標(biāo)注兩大部分。

1. 分詞

漢語的詞沒有形式上的標(biāo)記,因而分詞對(duì)于漢語來說是一件麻煩事。為了確保分詞的正確性和一致性[3],首先需要確立分詞規(guī)范。中古漢語分詞的難點(diǎn)已有專文論述(化振紅2014),分詞規(guī)范的細(xì)則也將另文闡釋。中古漢語語料庫(kù)的分詞采取人工分詞和自動(dòng)分詞兩種方法。人工分詞是逐句手工錄入,并參考上下文對(duì)句子結(jié)構(gòu)以詞為單位分析判斷并逐條錄入,非常耗費(fèi)人力和物力。自動(dòng)分詞采用CRF分詞模型(陳晴2005),在模版中加入古漢語音韻、構(gòu)字等信息,以提高分詞正確率,詳情另有專文論述(石民,李斌,陳小荷2010)。需要指出的是該論文的實(shí)驗(yàn)對(duì)象是先秦文獻(xiàn),先秦文獻(xiàn)與中古文獻(xiàn)存在一定差異,再加上中古文獻(xiàn)內(nèi)部本身存在著很大的區(qū)別度(陳小荷,馮敏萱,徐潤(rùn)華等2013),自動(dòng)分詞的準(zhǔn)確率不是很高,目前僅在80%~90%,但已成倍提高了人工分詞的效率。現(xiàn)今仍需通過提高分詞一致性、細(xì)化分詞規(guī)范、調(diào)整訓(xùn)練數(shù)據(jù)等方法進(jìn)一步提高分詞的準(zhǔn)確率。

2. 標(biāo)注

為了能夠從語料庫(kù)中抽取出更多有用信息,必須對(duì)語料進(jìn)行標(biāo)注。語料庫(kù)是供許多帶著不同目的的用戶使用的。數(shù)字化手段讓研究者能從多角度對(duì)多層次帶標(biāo)注語料進(jìn)行數(shù)據(jù)挖掘,大大拓展了語言研究的深度和廣度,有些研究目的甚至連語料庫(kù)設(shè)計(jì)者都不曾想到過。因此,語料庫(kù)的多層次標(biāo)注很重要。中古語料的標(biāo)注應(yīng)遵循兩個(gè)基本原則:

一是語料加工分為篇、章、句、詞四個(gè)層級(jí),由大到小對(duì)這幾個(gè)層級(jí)進(jìn)行標(biāo)注。

二是標(biāo)注資源具有復(fù)用性。語料庫(kù)的標(biāo)注昂貴且耗時(shí),如果能復(fù)用就物有所值了。為保證語料庫(kù)的復(fù)用性,需使每本文獻(xiàn)、每層標(biāo)注信息有足夠的獨(dú)立性,改變某文獻(xiàn)、某層的標(biāo)注信息不會(huì)對(duì)其他語料產(chǎn)生影響。

黃昌寧等(2002)指出,目前語言各層面的標(biāo)注發(fā)展很不平衡。發(fā)展較快的有詞匯層、句法層、語音層和音位層等,今后應(yīng)重點(diǎn)加強(qiáng)語義層和語用層的標(biāo)注。(黃昌寧,李涓子2002)由于中古時(shí)期漢語的語音系統(tǒng)與今天相比有很大不同,語音標(biāo)注困難很大且并沒有很強(qiáng)的實(shí)用性。語料庫(kù)的標(biāo)注取決于語料庫(kù)的整體設(shè)計(jì)及具體研究目的,同時(shí)也是一個(gè)重要的檢索依據(jù)。(梁茂成,李文中,S家金2010)中古語料庫(kù)的標(biāo)注信息宜涵蓋篇章、詞匯、句法、語義、語用各層,并對(duì)文獻(xiàn)中涉及的疑難字以圖片格式進(jìn)行收錄標(biāo)注。據(jù)此,中古語料庫(kù)中的標(biāo)注從大到小包括以下五個(gè)方面。

(1) 語篇標(biāo)注。語篇標(biāo)注包括文本來源、版本、朝代、作者等相關(guān)信息。如果語料源于書籍,該書籍的版本、頁碼信息等也會(huì)標(biāo)注出來。篇章書籍信息是古文獻(xiàn)、古漢語研究專家進(jìn)行相關(guān)研究的基本信息。語篇標(biāo)注和??焙蟮奈墨I(xiàn)構(gòu)成中古語料庫(kù)中獨(dú)立的書籍庫(kù)。

(2) 句子標(biāo)注。句子標(biāo)注是把語篇中的句子標(biāo)記上文本自身的信息,以便管理者統(tǒng)一管理語料庫(kù)中的語料。常用的文本信息包括行分割符、行數(shù)、章、節(jié)、段落等,中古語料庫(kù)中選取“章節(jié)段句”這四層信息組成編碼對(duì)句子進(jìn)行標(biāo)注,形成句子標(biāo)記。該標(biāo)注信息屬于篇章層,但在詞匯層會(huì)自動(dòng)生成詞匯所從屬句子的句子標(biāo)記,從而使詞匯層可以獨(dú)立于句子層。該標(biāo)記不僅方便語料庫(kù)管理者統(tǒng)一管理語料,而且是詞匯和句子進(jìn)行關(guān)聯(lián)的中介,為檢索詞匯時(shí)可以查詢到上下文信息提供了條件。句子標(biāo)注連同句子形成了句子庫(kù)。

(3) 詞匯標(biāo)注。詞匯標(biāo)注是指對(duì)詞匯從語法地位、詞性、釋義、用法四個(gè)方面進(jìn)行標(biāo)注,分別稱為“句法標(biāo)注”“詞性標(biāo)注”“義項(xiàng)標(biāo)注”“用法標(biāo)注”。其中詞的句法、詞性、用法標(biāo)注信息均為封閉類,如表2所示:

由表2可知,句法標(biāo)注、詞性標(biāo)注屬于句法層;用法標(biāo)注的層次比較復(fù)雜,大部分屬于語用層,其中“古今字”“通假字”“假借字”屬于漢字層面;義項(xiàng)標(biāo)注屬于語義層。義項(xiàng)標(biāo)注后的詞條匯總形成了義項(xiàng)庫(kù),句法、詞性、用法標(biāo)注信息與詞匯共同形成了詞庫(kù)。

詞匯標(biāo)注中,尤其值得一提的是語義層的義項(xiàng)標(biāo)注,它在中古語料庫(kù)的構(gòu)建中是一項(xiàng)十分重要的基礎(chǔ)性工作。如果把古漢語中每個(gè)詞的現(xiàn)代意義搞清楚,基本語義也就理解了。義項(xiàng)標(biāo)注信息和中古文獻(xiàn)信息形成了古今平行對(duì)比語料,因此,義項(xiàng)標(biāo)注在中古語料庫(kù)中是重中之重。為了提高義項(xiàng)標(biāo)注的速度,避免把時(shí)間過多地花費(fèi)在查閱相關(guān)資料上,中古語料庫(kù)中設(shè)立了通用義項(xiàng)庫(kù),義項(xiàng)庫(kù)的構(gòu)成如圖3所示:

中古語料庫(kù)中的義項(xiàng)庫(kù)目前共包括不重復(fù)的541456條義項(xiàng),隨著語料庫(kù)構(gòu)建過程中自擬義項(xiàng)的增加和其他相關(guān)研究成果的錄入,義項(xiàng)庫(kù)的庫(kù)容仍會(huì)進(jìn)一步增加。

(4) 按語標(biāo)注。傳世文獻(xiàn)在流傳過程中不可避免地會(huì)產(chǎn)生一些訛誤,甚至?xí)霈F(xiàn)不同的文本;再加上時(shí)代的限制和編纂者認(rèn)識(shí)上的局限,詞典對(duì)古代文獻(xiàn)的釋義、對(duì)最早文獻(xiàn)的引例也難免會(huì)有所疏漏。這種在對(duì)文本標(biāo)注時(shí)需要特別說明的信息可放在按語中。按語信息可以避免研究者重復(fù)前人已進(jìn)行過的工作,對(duì)研究工作會(huì)起到一定輔助作用。

(5) 疑難字標(biāo)注。中古文獻(xiàn)中存在著一些現(xiàn)代字庫(kù)中不支持的字,還有一些出土文獻(xiàn)中的字尚未能完全辨識(shí)。針對(duì)這些疑難字,語料庫(kù)專門設(shè)置疑難字庫(kù),以圖片的形式存儲(chǔ),并對(duì)該疑難字進(jìn)行編號(hào),通過編號(hào)可定位到該疑難字的上下文信息及語義信息。

使用Access進(jìn)行標(biāo)注的主界面設(shè)計(jì)圖如圖4所示:

綜上可知,中古研究型語料庫(kù)由其所包含文本的書籍、句子、詞匯、義項(xiàng)、疑難字信息(分別對(duì)應(yīng)于上圖中的“shuji、juzi、cihui、yixiang、quezi”五張表)組成,包含書籍庫(kù)、句子庫(kù)、詞匯庫(kù)、義項(xiàng)庫(kù)、疑難字庫(kù)五大子庫(kù)。此外,為了方便語料庫(kù)的管理和使用,語料庫(kù)中還設(shè)有用戶信息庫(kù)。

三、 檢索管理系統(tǒng)研發(fā)

語料庫(kù)不僅是文本的集合,它還應(yīng)該具有良好的存儲(chǔ)、擴(kuò)展、檢索、反饋、修正等性能,以便各種研究人員都能從中得到自己所需要的信息。為方便語料庫(kù)的管理和使用,我們針對(duì)中古語料庫(kù)研發(fā)了檢索管理系統(tǒng),其功能如圖5所示。

(一) 管理系統(tǒng)

管理系統(tǒng)是提供給語料庫(kù)內(nèi)部成員使用以便操作和管理語料庫(kù)的頁面管理系統(tǒng)。它主要提供了書籍和疑難字的增加、刪除、查詢功能。書籍的管理功能是以已加工的語料作為對(duì)象按書籍為單位進(jìn)行的,包括書籍庫(kù)、句子庫(kù)、詞匯庫(kù)、義項(xiàng)庫(kù)。對(duì)疑難字的管理直接以疑難字庫(kù)為單位,每個(gè)疑難字的記錄中又有它所對(duì)應(yīng)的語料及篇章段信息。如果需要對(duì)單個(gè)語料中的標(biāo)注信息進(jìn)行更改維護(hù),無須直接操作語料庫(kù)中的數(shù)據(jù),只要在未導(dǎo)入的語料版本中直接通過Access數(shù)據(jù)庫(kù)進(jìn)行修改,確認(rèn)無誤后再次導(dǎo)入數(shù)據(jù)庫(kù)即可。

(二) 檢索系統(tǒng)

語料庫(kù)建立之后將提供給研究者使用,使他們能夠訪問語料庫(kù)內(nèi)容,對(duì)相關(guān)語言現(xiàn)象進(jìn)行分析研究。檢索系統(tǒng)是實(shí)現(xiàn)語料庫(kù)共享的必要條件,也是語料庫(kù)應(yīng)該向用戶提供的基本工具。基于檢索系統(tǒng)在語料庫(kù)研發(fā)中的重要地位,中古語料庫(kù)檢索系統(tǒng)滿足以下幾個(gè)條件。

1. 檢索條件多樣化

檢索條件設(shè)置得是否適宜、專業(yè),這直接決定了語料庫(kù)的用戶功能適用性,也影響著使用者對(duì)整個(gè)檢索系統(tǒng)的使用體驗(yàn)。由圖5可知,中古語料庫(kù)具有五種主要的查詢方式:

(1) 標(biāo)記型查詢。檢索條件是同一詞的詞形、詞性、句法三種信息的組合。

(2) 標(biāo)注型查詢。檢索條件是同一詞的詞形、句法、義項(xiàng)三種信息的組合。

(3) 組合查詢。檢索條件是兩個(gè)不同詞的邏輯關(guān)系組合,包括相鄰、同句、或、非四種邏輯關(guān)系。其中“相鄰”指這兩個(gè)選定的詞處于同一句子語料中的相鄰位置;“同句”指它們處于同一句語料,但不是相鄰位置;“或”指檢索結(jié)果中包含這兩個(gè)選定詞中任何一個(gè);“非”指檢索結(jié)果中包含前一個(gè)選定詞但不包含后一個(gè)選定詞。

(4) 對(duì)比查詢。檢索條件是同一或不同的兩個(gè)詞的詞形、句法、書籍信息的組合。用于對(duì)同一詞的不同句法地位或所在文獻(xiàn)(或者不同詞的不同句法地位或所在文獻(xiàn))進(jìn)行對(duì)比檢索。

(5) 疑難字查詢。檢索條件為書籍、疑難字編號(hào)兩種信息的組合。

除了這五種基本檢索功能外,中古語料庫(kù)還實(shí)現(xiàn)了檢索結(jié)果是否附加上下文信息的可選項(xiàng)。還可以針對(duì)詞的不同特征選擇不同的查詢范圍,如高頻詞可以選擇某本專書查詢來減小用例的查詢范圍,低頻詞可以選擇全語料庫(kù)查詢來擴(kuò)大用例的查詢范圍。

2. 結(jié)果出方便快捷,且易于保存

中古語料庫(kù)檢索系統(tǒng)的輸出結(jié)果以網(wǎng)頁形式呈現(xiàn),可直接保存為文本。

3. 解讀清晰易懂

檢索系統(tǒng)頁面上不存在語料庫(kù)設(shè)計(jì)時(shí)所使用的內(nèi)部編碼(如用法碼“RM01”代表用法“姓加名”),內(nèi)部編碼均以轉(zhuǎn)碼形式轉(zhuǎn)換為自然詞匯,符合使用者的操作習(xí)慣,不需要研究者再去過多學(xué)習(xí)語料庫(kù)操作規(guī)范,且轉(zhuǎn)碼后整個(gè)檢索系統(tǒng)的頁面顯得更加清晰易懂。

4. 具有開放性和可維護(hù)性

整個(gè)語料庫(kù)通過檢索系統(tǒng)實(shí)現(xiàn)開放性,通過數(shù)據(jù)庫(kù)維護(hù)或管理系統(tǒng)實(shí)現(xiàn)可維護(hù)性。用戶在使用檢索系統(tǒng)時(shí)如需交流意見,可在頁面上直接進(jìn)行反饋,反饋信息會(huì)以郵件的形式發(fā)送給語料庫(kù)管理員,由管理員收集整理后提交給語料庫(kù)維護(hù)專業(yè)人員進(jìn)行討論和回復(fù)。

四、 中古語料庫(kù)的應(yīng)用

(一) 漢語史研究

中古語料庫(kù)最基本的服務(wù)對(duì)象是漢語史研究人員。由于在語篇、句子、詞匯等多個(gè)層面對(duì)文獻(xiàn)進(jìn)行了標(biāo)注,它可以支持多種檢索方式,漢語史研究人員利用這些檢索結(jié)果可以進(jìn)行特定的語言學(xué)研究,例如以下四個(gè)方面的應(yīng)用:

第一,使用中古語料庫(kù)中最基本的句法、義項(xiàng)、特定句式、詞性、疑難字查詢、統(tǒng)計(jì)功能,以輔助相關(guān)的語言學(xué)研究及語文教學(xué)。

第二,根據(jù)不同的研究目的,可對(duì)句法、義項(xiàng)、詞性三個(gè)條件變換各種組合進(jìn)行查詢、統(tǒng)計(jì),可用以輔助對(duì)中古時(shí)期特定詞匯、句法的研究。

第三,根據(jù)字詞的使用頻率統(tǒng)計(jì)結(jié)果,大致確定中古時(shí)期常用詞的范圍,然后結(jié)合句法、義項(xiàng)、語用查詢來研究常用詞在句法成分、語義等方面的應(yīng)用、變化情況。

第四,檢索同一詞匯、句法結(jié)構(gòu)在各個(gè)文獻(xiàn)中的使用情況,以對(duì)不同類別、時(shí)期、作者的文獻(xiàn)語言風(fēng)格進(jìn)行對(duì)比研究。

(二) 中古漢語詞典編纂

中古漢語語料庫(kù)收錄了大批中古時(shí)期的文獻(xiàn),為詞典編纂提供了大量可供篩選的例證。此外,語料庫(kù)中對(duì)每個(gè)詞進(jìn)行了詞性、句法、義項(xiàng)等方面的標(biāo)注,標(biāo)注時(shí)主要采用人工方法,在參考各種權(quán)威中古漢語詞典的基礎(chǔ)上,對(duì)各個(gè)詞的義項(xiàng)、用法及例證進(jìn)行考證、補(bǔ)充、修正,此外還對(duì)人名、地名、稱號(hào)、離合式詞等進(jìn)行了語用標(biāo)注。這些標(biāo)注信息可以提供中古時(shí)期每個(gè)詞匯各個(gè)層面的統(tǒng)計(jì)信息,為中古漢語斷代詞典的編纂提供了直接依據(jù),專家只需根據(jù)分詞情況對(duì)檢索到的例證進(jìn)行篩選,不僅為詞項(xiàng)賦義提供了客觀標(biāo)準(zhǔn),也保證了詞典可以真實(shí)反映中古時(shí)期的語言面貌,同時(shí)也大大減少了詞典編纂人員的工作強(qiáng)度、縮短了編纂周期。

(三) 語言教學(xué)及文化研究

中古漢語語料庫(kù)可以直接或間接用于中古文獻(xiàn)的教學(xué)。不僅老師可以利用語料庫(kù)向?qū)W生展示某些特定語法范疇、詞匯在中古時(shí)期的使用情況,學(xué)生也可以自己利用語料庫(kù)來檢索詞的用法、搭配、詞義間的細(xì)微差別等,也就是所謂的數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)。這種學(xué)習(xí)方法不僅能為學(xué)生營(yíng)造一個(gè)真實(shí)的語境,而且能提供一種探索語言的手段,對(duì)教學(xué)的意義是顯而易見的。

除此之外,中古漢語語料庫(kù)收錄了中古時(shí)期多個(gè)領(lǐng)域(如歷史、宗教、醫(yī)學(xué)、農(nóng)業(yè)等)的多本專書,并對(duì)這些書做了???、分詞、標(biāo)注,這就為相關(guān)領(lǐng)域的文化研究提供了可靠的電子檢索資源。

五、 結(jié)語

中古漢語研究型語料庫(kù)是我國(guó)第一個(gè)針對(duì)中古時(shí)期文獻(xiàn)的斷代專語語料庫(kù),目前在該語料庫(kù)建設(shè)中仍不可避免地存在一些問題,隨著分詞規(guī)范進(jìn)一步細(xì)化、分詞一致性的提高、對(duì)中古詞匯特點(diǎn)的深入了解、自動(dòng)分詞正確率的提升,這些問題也將逐步得到解決。該語料庫(kù)目前已應(yīng)用于中古時(shí)期專書、詞匯、語法等方面的研究,并產(chǎn)生了一些成果。隨著語料庫(kù)的構(gòu)建完成并實(shí)現(xiàn)共享,詞典編纂、歸納性語法、語義搭配等相關(guān)應(yīng)用研究不難預(yù)見,而更深層次的語言研究及其他專項(xiàng)應(yīng)用研究也等待諸位同仁共同來發(fā)掘。

附注

[1]MySQL是一N開放源代碼的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),具有速度快、可靠性高和適應(yīng)性強(qiáng)等優(yōu)點(diǎn)。在不需要事務(wù)化處理的情況下,MySQL是管理內(nèi)容最好的選擇。

[2]生語料指收集以后未經(jīng)加工的語料,生語料庫(kù)指收錄生語料的數(shù)據(jù)庫(kù);與此相對(duì),熟語料指經(jīng)過加工的語料。

[3]在保持語義同一性的前提下,結(jié)構(gòu)體在語料庫(kù)中的分合是否始終一致,如“豬肉”是否始終保持為一個(gè)整體,或者始終分開。(孫茂松1999: 90―93)

參考文獻(xiàn)

1. 陳晴.基于條件隨機(jī)場(chǎng)的自動(dòng)分詞技術(shù)的研究.東北大學(xué)碩士學(xué)位論文.2005.

2. 陳小荷,馮敏萱,徐潤(rùn)華等.先秦文獻(xiàn)信息處理.北京: 世界圖書出版公司,2013.

3. 董志翹.為中古漢語研究夯實(shí)基礎(chǔ)――“中古漢語研究型語料庫(kù)”建設(shè)瑣議.燕山大學(xué)學(xué)報(bào),2011(1).

4. 國(guó)家技術(shù)監(jiān)督局.信息處理用現(xiàn)代漢語分詞規(guī)范.北京: 中國(guó)標(biāo)準(zhǔn)出版社,1993.

5. 化振紅.深加工中古漢語語料庫(kù)建設(shè)的若干問題.西南大學(xué)學(xué)報(bào),2014(3).

6. 黃昌寧,李涓子.語料庫(kù)語言學(xué).北京: 商務(wù)印書館,2002.

7. 梁茂成,李文中,許家金.語料庫(kù)應(yīng)用教程.北京: 外語教學(xué)與研究出版社,2010.

8. 石民,李斌,陳小荷.基于CRF的先秦漢語分詞標(biāo)注一體化研究.中文信息學(xué)報(bào),2010(2).

9. 孫茂松.談?wù)劃h語分詞語料庫(kù)的一致性問題.語言文字應(yīng)用,1999(2).

相關(guān)期刊更多

古漢語研究

CSSCI南大期刊 審核時(shí)間1-3個(gè)月

湖南師范大學(xué)

語言學(xué)論叢

CSSCI南大期刊 審核時(shí)間1-3個(gè)月

教育部

勵(lì)耘語言學(xué)刊

CSSCI南大期刊 審核時(shí)間1個(gè)月內(nèi)

北京師范大學(xué)文學(xué)院