錄組詞拼音 錄組詞組( 二 )


文章插圖
字頻統計中,考慮到虛字和實字的不同屬性和闡釋功能,二者通常被分別計算 。虛詞在漢語史等領域的研究中經常被作為特征數據使用,同時也是作品風格比對的標志性參數,虛詞的使用比重本身便構成不同作者間的風格標識 ?!拔褰洝敝校瑓⒄蘸笫馈拔墓P之辨”,《詩》為有韻之文,因而與其他幾部書相比,高頻詞中實詞比重更大,古人“實字多則健,虛字多則弱”的詩論觀點或濫觴于此 。以高頻字的虛實映射“文筆之辨”的 *** 可推及后世,普遍而言,在詩歌與詞曲等文體中,實詞作為高頻詞的概率大于散文文體 。
作為“五經”中成書年代最早的《尚書》,其虛字運用特征同樣保存了上古漢語的流變痕跡 。《尚書》中頻次居首者是極具上古色彩的虛詞“惟”,這不僅與其中許多篇目的記言性質有關,也體現了早期漢語與后來“之乎者也于”時代的分野 。以相同視角觀照近古作品,可以窺見漢語史上的另一重大變革 。對話是小說中的重要元素,表達說話行為的動詞自然享有高頻地位,在《三國演義》與《聊齋》中體現為“曰”,而《西游記》和《水滸傳》中則體現為“道”,這是后一組作品文言色彩減弱的重要標志 。而真正的白話轉型發生在《紅樓夢》身上,“的”首次取代語法功能相同的“之”而上榜,成為第二高頻詞 ?!都t樓夢》中居首的高頻詞是另一個極具白話特征的虛詞“了”,這也是《水滸傳》中的之一高頻詞 。
與虛詞相反相成的實詞是文獻內容和主題的映射,其背后涉及反映觀念史演變的重大命題 。同樣以“五經”為例,《詩》《書》《禮》《易》《春秋》中的之一高頻實詞分別為“我”“王”“人”“象”“子” 。《詩經》具有最強的主體抒 *** 彩,恰如《毛詩序》所謂“以一國之事,系一人之本” ?!渡袝窞樯瞎湃弁醯?、謨、訓、誥、誓、命等文獻記載,以記錄“王”之言行為核心 ??鬃右浴翱思簭投Y”來約束人,“禮”是人內在品質的外化,因此談“禮”不基于人則會失去根基 。“象”作為《周易》的解讀對象是不言自明的 ?!肮耪哜覡奘现跆煜乱玻鰟t觀象于天,俯則觀法于地,觀鳥獸之文與地之宜,近取諸身,遠取諸物,于是始作《易》八卦,以垂憲象 ?!薄墩f文解字序》中的這段話,說明“象”不僅是《周易》的關鍵,也是漢字造字觀念及中華文化思維的體現 。《春秋左傳》中首位高頻字為“子”,其中包含第二人稱單數與諸侯國君稱謂雙重意義 。后者是《春秋》敘事的核心所在,孔子作《春秋》,正是為了以微言大義記錄“禮樂征伐自諸侯出”的非常時代,作為編年體史書,各諸侯國君臣的秩序與道德選擇構成了其潛在的緯線 。
用數據來表征“詩分唐宋”
錢鐘書《談藝錄》以“詩分唐宋”開篇,影響甚廣 。此說實承續前人而來,宋代嚴羽論詩便有“本朝人尚理,唐人尚意興”之說 。唐宋詩之別在于體格性分,相對較為玄妙 。通過量化分析,可對其語言層面的特征作出細致把握 。通過對《全唐詩》五萬七千余首和《全宋詩》二十五萬四千余首的詞頻統計顯示,居于前十位的高頻詞分別為:不知、何處、萬里、千里、不見、不可、白云、今日、春風、不得(《全唐詩》);不知、春風、平生、不可、萬里、千里、人間、不見、十年、何處(《全宋詩》 。下文中詞頻位序將在括號中注出,故不再一一說明) 。
將統計擴展至前一百位,有關唐宋詩風之辨的許多命題都能夠在語詞的褶皺中被展開 。作為嚴羽論斷的例證,在前一百位中,唐詩里比興尚意的寫景語匯更居前列,如排名第7的“白云”與第11的“明月”,雖只是詞匯片段,唐人氣象儼若可見 。作為參照,這兩個意象在《全宋詩》詞頻統計中分別降至19與23位 。嚴羽“本朝尚理”的觀點同樣能在統計數據中獲得佐證:宋詩中“平生”(第3位)、“人間”(第8位)等哲思人生的“理語”排位較唐代(分別居于第30、13位)又有上升 。另一點值得玩味的是,宋人雖崇尚自守慎獨、內求于心的理學,詩中卻不乏唐人所極少寫到的“功名”(36)、“富貴”(78),而唐詩中常見的“惆悵”(15)、“相思”(22)等與“理語”相對的“情語”在宋詩詞頻列表中跌出了前一百位 。
唐詩偏重空間,而宋詩偏重時間 。敻絕的宇宙意識和無垠的空間,從《全唐詩》詞頻前五位中(不知、何處、萬里、千里、不見)可見一斑 。日本漢學家吉川幸次郎曾提出,唐詩是凝視著人生貴重瞬間的燃燒,所注視的只是對象的頂點 。而宋詩是時間性的,詩人視人生為漫長的持續 。以語詞的統計來衡量這一觀點,唐詩排序更高的時間詞是“今日”(8),時空與情感凝注于此一點,而宋詩中居首的是“十年”(9),繼而是“今日”(12)與“百年”(20) 。吉川將“燃燒與持續”的說法推進至意象選用的對比方面,夕陽是燃燒的景象,雨是持續的景象,于是有了“唐人寫夕陽宋人寫雨”的經典論斷 。詞頻統計恰也驗證了這點,《全唐詩》詞頻居于前列的“落日”(55)、“日暮”(59)、“夕陽”(69),在宋詩中都排在九十位之后 。

推薦閱讀