![]()
江西地名研究
關注我們,獲取更多地名資訊
摘要:解析文學作品中的空間信息并進行空間可視化分析,為文學研究提供了一個新的視角,對于理解文學作品具有重要的參考價值。本文嘗試利用2類方法解析古詩詞文本空間信息,即“基于古今地名關系的明確定位法”和“方位推測定位、近似替代定位、時空推測定位等近似地名定位方法”;設計了能表達古詩詞作者、詩詞文本、詩詞地名和相關地理空間信息的數據庫,以唐李白詩詞為例,收集詩詞967首,對其中563首的創作地、所描述的地名或景觀進行了空間定位,初步建成了詩詞地理數據庫。在GIS中,對于李白詩詞創作的地點、詩詞中描述的地名及作者聯想到的地名等位置信息進行地理制圖,并歸納分析其空間分布特征,能清晰展現李白的創作空間和詩詞文本表征的空間分布格局。研究表明:應用GIS技術對文學作品進行空間分析是可行的,從地理空間視角研究古詩詞等文學作品具有重要價值。
關鍵詞:古詩詞文本;空間信息解析法;詩詞地理數據庫;文本可視化;GIS
1 引言
文學地理學中地理空間的研究為文學研究提供了一種新的視角,對于更深入地理解與分析文學作品具有重要價值。過去的文學研究側重時間維度,對空間維度重視不夠,中國文學史在相當大程度上忽視了地域問題、家族問題,以及作家的人生軌跡問題。文學地理學作為一門有機的融合文學與地理學研究,以文學為本位、文學空間研究為重心的新興學科,已受到學者的廣泛關注,研究視角也從傳統的關注文學家的地理分布、文學作品的地域特點與地域差異等方面,開始向注重文學作品中所構建的地理空間發展,并強調文學作品的景觀描寫及其意義,關注作家、流派、文學史演變與地理環境的關系,以及不同群體空間表達的對比等。
從地理空間的視角研究文學作品,定量化解析文本中的空間信息是一項繁雜的工作。目前,僅有少數學者從定量分析的角度研究文學作品的地域分布及發展變化,或通過文學作品中的空間詞組出現頻率統計其分布特征。尚永亮等認為,統計與計量分析只能作為傳統歷史文化研究的一種輔助和補充,它不可能成為文學地理學研究的主流方法,這主要是因普通的統計計量分析缺少空間單元的分析模型,這就要求這些方法及理論一定要實現空間化。隨著地理信息系統(GIS)學科體系的日臻完善,空間綜合的人文科學研究可從地理信息的角度來整合、表達多種人文信息。通過科學解析文學作品中的空間表達信息,GIS可用于處理文本與非文本材料等定性數據,從時間和空間2個維度上提供多種觀看文學作品的切口和視點。
古詩詞作為中國古典文學中不可缺少的一部分,其文學與藝術價值不言而喻,而其地理空間信息的研究,不僅為傳統的文學地理學研究提供了新的視角,而且為文學地理學研究中引入GIS等新技術和平臺提供了新的參考。本文收集唐李白詩詞,嘗試解析詩詞文本中的空間信息,建立相關的地理空間數據庫,并進行地圖制圖和空間分析,為文學地理學研究中引入GIS技術和方法提供思路。
2 古詩詞文本的空間信息解析
2.1 古詩詞文本的空間信息
古詩詞文本中蘊含大量的地理空間信息,通過對大量古詩詞的閱讀,可將其中的空間信息劃分為3種類型:(1)作者個人相關的空間信息,指作者的籍貫、居住地和游歷地等;(2)詩詞創作地點相關的空間信息,指作者創作某詩詞的具體位置和所處環境;(3)詩詞文本描述的空間信息,指詩詞文本中描寫地點、地域、景觀等的空間信息,既包括作者創作時直接觀察到的地域景觀信息,也包括聯想到的創作地以外的空間信息,這些信息多以地名的方式出現在作品中。本文將創作地、描述地及“景觀名稱”統稱為“地名”。
為便于建立詩詞地理數據庫,地名信息還需要具體劃分地名的類型及其空間尺度,例如,地名分類中的自然與人文地名劃分,自然地名中的山、水、植被地名的劃分等;尺度表達可以分為跨越較大距離或區域范圍的地域地名和較小的地域地名。大尺度地名在時空數據庫中一般以線和多邊形的形態表達,如河流中的黃河、長江,政區中的河南、河北等;小尺度地名在數據庫中一般以點形態表達,如天臺山、西靈塔等。
古詩詞中涉及到的空間信息多種多樣,包括作者的空間信息,以及創作每一首詩詞所處的位置、每首詩詞中作者所描寫的空間信息等。不同的空間信息由于尺度、文獻記載等原因,其定位方法也不盡相同。
2.2 古詩詞文本的空間信息解析
由于古詩詞文本涉及和描述的空間信息類型多樣,對空間信息描述的詳略程度也不同,而且存在古今地名的差異等問題,因此,本文運用了幾類不同的空間信息解析方法以適應各類情況。
依據古今地名的對應關系可進行明確定位,這是因有些古代地名與當代地名具有明確的對應關系,因此,古今地名關系的明確定位法是指根據地圖、文獻資料等前人研究成果,確定古詩詞創作或描述地名的位置信息,并且能夠直接在地圖上定位的方法。如《李白全集》文中所記,“‘彰明逸事’:太白游成都,賦‘春感’詩云云”。可見“春感”一詩創作于成都,通過查閱資料得知古成都即今成都,即可在地圖上直接定位。又如,《李白全集編年注釋》一文所記,公元756年李白創作的“贈王判官時余隱居廬山屏風疊”一詩為李白游黃鶴樓時所作,又有詩中“別黃鶴樓,蹉跎淮海秋”為證,黃鶴樓作為文物保護單位在當今具有明確的坐標位置,可直接定位于地圖上。
基于古今地名的對應關系進行近似定位。在古詩詞文本中,部分描述地名等空間信息由于缺少與當代地名之間的明確對應關系,在相關的歷史地圖等文獻資料中也沒有明確標示,無法確定其準確的空間位置。對于這類詩詞文本,有時可以根據文本中與其他地名的方位、里程等各類空間關系描述信息推測該地名的大概位置,本文中稱為古今地名關系的近似定位法。根據推測時采用的不同定位方法,又可具體劃分為方位推測、近似替代和時空推測定位法。
方位推測定位法是指根據詩詞文本中描述的待推測地名與有明確位置信息的地名的方位和距離關系,來確定推測地名相對位置的定位方法。古人對于地理位置的描述喜歡采用方位里程來確定,如《李白全集》文中記載,李白在公元755年創作的《下涇縣陵陽溪至澀灘》中的“澀灘”地理位置為“《一統志》:澀灘在寧國府涇縣西九十五里,怪石峻立,如虎伏龍蟠”。該文的方位描述雖沒有明確描述其地理坐標,但也可幫助我們推算出澀灘的大致位置:首先,確定詩詞創作時的寧國府涇縣與今天的地名對應關系,進而確定當時涇縣的地理坐標(118.426°E、30.695°N);其次,確定當時的距離單位“里”和今天常用距離單位的準確換算關系;最后,根據澀灘與涇縣的“涇縣西九十 五里”方位關系信息,利用距離公式就可以計算出當時澀灘的經緯度,并定位于地圖上。
近似替代定位法是指在沒有明確的位置對應關系情況下,如果古詩詞文本中有關于地理位置描述的大致范圍或區域,可以采用當今具有明確位置的地域空間近似替代進行定位的方法。這種方法雖然不適用于對地名的精確考證應用,但對于關注的空間尺度較大的文學地理學視角來說,也能夠滿足研究需求。例如,由于古今地名的差異及地方管制范圍的變化,很多地名在古代的范圍和現今的范圍不一致,如“東魯”指魯地,相當于現今山東省,李白“單父東樓秋夜送族弟沈之秦”詩:“沐猴而冠不足言,身騎土牛滯東魯”,此處的“東魯”為大尺度范圍,而又因“東魯在兗州一帶”,故此處以兗州作為東魯的點定位處;自然地名中的山、水空間描述在古詩詞中大量出現,但具體在山的什么方位、位置卻很模糊,例如,山的主峰、次峰、山頂、山腳等,都很少有確切的說明,本文中對于沒有確切方位和位置描述的山體位置,統一采用山體主峰位置作為山體的替代位置;對于水體的定位,就不能取一個統一的點來定位了,因為許多大的河流、湖泊等水系都會流經或占據大范圍的區域,故要根據每首詩的實際情況來確定其位置,如直接描述大型水體的詩詞,可與空間數據庫中對應的線狀或面狀水要素關聯,并標定對應位置,而描述小溪、小湖泊等的小型水體,則可通過臨近地物進行定位,如公元754年李白“宣城清溪”中的清溪,因其題為宣城清溪,故此處清溪的定位就在離宣城較近的地方;對于相同名稱的紀念性地物,也可以根據其坐落的大尺度地名進行近似替代定位,如公元741年李白的“魯郡堯祠送張十四游河北”中的“堯祠”,能確定其在瑕邱縣,但瑕邱縣的堯祠有很多,具體哪一個也無法明確,故此處就以瑕邱縣作為堯祠的定位地點。
時空推測定位法是指對于缺少或不能確定其創作地或描述地名的詩作,以詩詞作者創作的一系列同題材作品為參考基礎,根據其中有明確寫作時間及創作或描述地名等時空信息的作品來推斷其他作品的寫作或描述地名,進而實現推測定位的方法。例如,公元743年李白所作的9首送別詩,時間相近、題材相同,而且李白從公元742年10月開始待詔翰林,故可推斷出此9首送別詩同為李白朝中送人所作,其創作地定位為長安。
3 古詩詞的數據庫建設
古詩詞時空數據庫包括空間數據庫和屬性數據庫,后期可以根據不同的應用需求進行動態的數據表關系設計,實現專題屬性與空間位置的動態鏈接模式。
3.1 空間數據庫
空間數據庫以支撐古詩詞文本的空間表達、可視化和綜合分析為基本目標,涵蓋地形地貌、河流、湖泊等自然要素,以及交通、行政區劃、城市和其他重要地名等社會人文要素。為了較好地滿足古詩詞文本對空間描述的多樣化、多區域、多空間尺度等需求,空間數據庫按照ArcGIS的GeoDatabase數據庫模型建設,包含“歷史地圖數據庫”和“當代基礎地理信息數據庫”2個子庫。空間數據庫中的多數要素類都具有地名屬性項,以滿足詩詞創作地、描述地等內容的空間化表達與地理分析。
歷史地圖數據庫以譚其驤主編的《中國歷史地圖集》為基礎,以保證歷史地理空間表達的科學性和準確性。同時,利用上海復旦大學建設的中國歷史地理信息系統CHGIS4.0中的歷史地名數據,以及互聯網提供的各類信息進行檢驗和補充。當代基礎地理信息數據庫采用測繪科學數據共享網(http://sms.webmap.cn/)發布的1:500萬基礎地理信息數據為數據源。對于《中國歷史地圖集》和CHGIS 4.0未收錄的地名,可參考當代基礎地理信息并利用空間解析法定位,實現歷史地圖數據庫的有效更新和補充。
3.2 屬性數據庫
古詩詞屬性數據庫以《經史子集.李白全集》、安琪、閻奇等主編的《李白全集編年注釋》和筧久美子編著王輝斌譯的《李白年譜》等文獻為主要數據源。在充分考慮古詩詞內容和特點的基礎上,結合地理學關注的對詩詞表征空間描述的需求,在屬性數據庫中設計了4個屬性表:地名-詩句表、詩詞信息表、作者信息表、空間信息表。
“詩詞信息表”作為屬性數據庫中的詩詞基本信息表,以詩詞編碼為主鍵,主要記錄每首詩詞的名稱、作者、創作時間地點、體裁和內容等基本信息。“作者信息表”為包含詩詞屬性數據庫中的作者基本信息,以作者編碼為主鍵,主要記錄作者的姓名、籍貫、主要居住地及生卒時間等基本信息。“地名-詩句表”主要記錄描述地名的詩詞文本內容信息、詩句所屬的詩詞編碼信息等內容,是詩詞文本與地名等空間信息相關聯的主要載體,每個地名對應一句詩詞文本,構成一條記錄。由于每句詩詞文本可能對應多個地名,多個詩詞文本也可描述同一地名,為此該表以地名編碼與詩句作為聯合主鍵。“空間信息表”以地名編碼為主鍵,是對詩詞描述的空間信息的進一步應用解釋,涉及地名的定位方法、可視化表達的空間尺度等內容。
3.3 數據表連接關系
古詩詞文本描述的空間信息類型豐富,一個地名可能有多個詩人創作詩詞,同一詩詞可能描述多個不同地名,同一作者也會在多個地方進行創作等。為方便從不同視角表現詩詞的空間特征,在古詩詞數據庫中設計了多種表格之間的連接關系,包括屬性表之間的連接和空間數據與屬性表的連接。
屬性表之間的連接關系可以方便屬性之間的查詢、統計和分析。如“詩詞信息表”與“地名-詩句表”之間以詩詞編碼為連接,可以建立一對多的關系,方便查詢每一首詩詞描述的各個地名分別出自哪行詩句,以及地名在詩詞文本中的描述方式(直接描述、聯想)等。“空間信息表”與“地名-詩句表”以地名編碼為連接建立一對多的關系,可實現文本描述地名的詩詞統計。
屬性表與空間數據的動態連接可實現詩詞文本的空間可視化,進一步分析詩詞創作空間、描述空間的格局與變化過程,實現不同類型、不同作者和不同時代的詩詞空間對比。例如,通過“詩詞信息表”和“空間信息表”基于地名編碼建立一對多連接,再以地名表達尺度與歷史地圖數據庫對應的地名要素類進行空間連接,實現詩詞創作地可視化(圖1)。鑒此,可進一步實現不同作者、創作時間、體裁等信息的空間分析。詩詞文本空間信息可視化則是基于“地名-詩句表”和“空間信息表”的關系,并與歷史地圖數據庫中適宜尺度的地理要素類建立空間連接實現的。通過屬性表與空間數據的連接,再結合古今地名關系對照表,可基于歷史地圖和當代地圖開展古詩詞空間信息可視化與分析。
![]()
4 李白詩詞的空間信息解析與可視化分析
4.1 詩詞文本的空間信息解析結果
作者綜合多個文獻,共收集李白創作的詩詞967首,其中,通過古今地名關系的明確定位方法和近似定位方法,確定了明確描述空間或創作地信息的詩詞共563首,本文稱為可定位詩詞,部分代表性的詩詞空間信息解析結果如表1所示。在可定位詩詞中,能夠確定創作地點的詩詞有507首,共可確定創作地點120個(大量詩詞是在同一地點所作)。詩詞文本涉及的地名共計252個,其中直接描述詩人所在位置視覺感知的地名共72個,由詩詞創作而聯想到創作地之外的地名共180個。從空間信息解析的來源上看,共有464首詩詞在題目中直接描述了相關地名,占收集到的李白詩詞總量的47.98%,占可定位詩詞的82.42%,252首詩詞在正文中描述了相關地名。從一首詩詞中描述的空間信息數量上看,共有148首詩詞在正文中描述了兩個以上的地名,僅描述單一地名的詩詞有339首。
![]()
4.2 詩詞空間信息可視化與分析
通過詩詞空間信息的可視化表達與進一步的空間分析,不僅能定量化研究作者的詩詞創作空間特征,還可定量研究詩詞體裁、描述的地名、意象空間格局及其演變,展現詩詞作品的地域特征。空間信息可視化與空間分析方法類型豐富,不同的研究內容和研究目標,可選擇不同的可視化與分析方法。本文運用分級統計圖法和核密度分析方法,進行李白詩詞數據的空間信息可視化,并統一采用自然斷裂法來確定屬性值的自然聚類與核密度分析方法中帶寬值的選取。
4.2.1詩詞創作空間與可視化分析
詩詞創作地的分布表現了詩人的創作空間。李白詩詞中具有明確創作地點的共計507首,涉及創作地點共有120個,平均每個地方創作詩詞4首,分布于唐代的13個道(歷史政區),相當于今天的15個省市區。選擇唐代歷史地圖為基礎底圖,采用分級統計圖法和基于詩詞創作數量的加權核密度制圖方法,生成了李白詩詞創作數量及密度分布特征圖(圖2)。總體來看,李白的詩詞創作空間形成了“兩線五核”的分布格局,表現出廣泛分布和局部聚集的典型二元特征,正是他一生游歷的文學家特質和游歷中的重要節點反映。
![]()
創作空間中的“兩線”分別是“西京(今西安)-洛陽-兗州”一線和“江夏-潯(尋)陽(今九江市)-金陵(今南京)”一線。在“五核”中,金陵一核密度最高,范圍最大,涉及金陵、宣州、當涂等地點,李白在此區域共創作詩詞157首,其中,金陵是該核中創作數量最豐富的地點,李白在此共創作詩詞51首。西京、江夏兩核是“五核”中的第二層級。西京一核包括西京、終南山、邠縣等地,李白在該區域創作詩詞共計69首,其中,在西京創作詩詞44首;江夏一核包括江夏縣、安陸和潯(尋)陽等地,李白在該區域共創作詩詞122首,其中在江夏創作詩詞33首。兗州、青蓮鄉為“五核”中最弱的第三層級,2個區域涉及東魯、任城、池州和青蓮鄉等地,平均每地的詩詞創作數量達到3首,創作量較大的兗州等地,達到了21首以上。
4.2.2詩詞文本空間可視化
詩詞文本內涵的空間信息能反映李白詩詞在結構、文風和藝術手法等方面的空間特征,其所表征的文化空間與詩詞創作空間既有緊密聯系,也有明顯差異。李白詩詞文本中共描述了相關地名721次,涉及唐代的215個地名。圖3-6分別展現了李白詩詞文本中創作地范圍內的地物景觀、描述的創作地之外的聯想地、詩詞題目中的地名以及正文中的地名等文化空間格局。總體來看,詩詞文本展現的文化空間基本繼承了創作空間表現的“兩線五核”格局模式,但不同專題又有明顯的自身特色。
![]()
![]()
圖3、4表現了詩詞描述的創作地和聯想地空間分布核密度格局。描述的創作地范圍內的地名分布格局中形成了典型的“兩線一核”模式。“兩線”模式與創作空間的“兩線”明顯耦合;“一核”則是創作空間“五核”中的“金陵核”,其它四核不再明顯。詩詞中聯想地名的分布格局則形成了明顯的“四核”模式,其中,“金陵”、“西京”和“江夏”3個核與創作空間模式中的3核基本一致,另外,新凸顯了“洛陽”一核。聯想地格局比直接描述地層次結構更為豐富,也充分驗證了李白作為浪漫主義詩人的寫作風格。
圖5、6分別表現了李白詩詞文本的標題和正文對地名的使用和描述格局。詩詞文本不同部分表現的文化空間同樣繼承了創作空間表現的“兩線五核”格局,同時也呈現了明顯的專題特點。題目表征的文化空間格局與文本中描述創作地范圍內的地名分布格局基本一致,形成典型的“兩線一核”模式;正文表征的文化空間格局則與詩詞文本中的聯想地分布格局基本一致,形成典型的“四核”模式。從覆蓋范圍看,李白詩詞正文描述的地域空間明顯大于題目中描述的地域范圍,正文中的地名幾乎涉及唐朝各個道,甚至出現在吐蕃地區。
5 結論與展望
5.1 研究結論
通過系統整理、分析古詩詞文本的結構、特征和文本描述方式,本文提出了“基于古今地名關系的明確定位法”和“方位定位、近似替代定位、時空推測定位等近似定位方法”,為古詩詞文本的地理學相關研究提供了空間信息解析的參考視角。以文學地理學多元化研究視角為目標,設計了能夠表達古詩詞作者、詩詞文本、詩詞地名和相關地理空間信息的數據庫,對李白詩詞中創作地、所描述的地名等進行了空間定位,初步建成了詩詞地理數據庫。
李白詩詞文本數據庫的建設及古詩詞空間信息可視化與分析,清晰展現了李白詩詞創作空間的“兩線五核”基本分布格局,以及詩詞文本內容表征的“兩線一核”和“四核”等分布特征。研究顯示了從地理空間視角研究古詩詞等文學作品具有重要價值,也初步證明了應用GIS技術對文學作品進行空間分析的可行性;同時,為傳統文學地理學研究引入GIS等新技術和方法提供了參考,也可為深入分析文學地理景觀的形成機制和演化機理等提供數據基礎。
5.2應用展望
古詩詞文本的空間信息解析和基于GIS的古詩詞可視化分析,對于文學地理學研究有3個層面的應用價值:(1)該方法可方便地應用于古詩詞之外的其他古代、近代和當代文學作品類型,例如散文、小說、游記等;根據不同的文學作品特點,在文本數據庫構建時可采用不同的數據庫結構和屬性關系設計。(2)當眾多古詩詞和文學作品信息進入數據庫后,采用定量、可視化方法開展文學地理的綜合性研究就具備了數據和平臺方面的基礎條件。隨著不同研究團隊(甚至公眾)為古詩詞或其他文學空間數據庫提供標準化的文獻資料,文學地理學家可輕松開展眾多的綜合性研究。例如,李白、杜甫等同時代文學家的行為空間和文學作品表征的景觀地域特征對比,不同文學流派的文學作品信息表征的流派地域特征,不同時期文學家群體作品表征的文學地域性演化等。(3)該方法為開展多學科交叉研究提供了方便交流的表達模式。例如,定量、可視化的文學地理研究可以從空間上表征詩詞創作者所處時代的社會、經濟和文化狀況,這也是歷史、經濟、文化和地理等學科專家所關注的重要學術內容。
總之,古詩詞文本空間解析和可視化分析,為古詩詞文本挖掘與應用的發展做出了一種探索和嘗試,實現了從古詩詞文學作品一般信息的統計學分析擴展到文學內容的空間信息挖掘,為文學地理學研究提供了新的視角,也為其他類型文學作品的地理學研究和歷史、文化地理學等相關學科的研究提供了可參考的案例。
![]()
作者:張建立,李仁杰,傅學慶,張軍海
來源:《地球信息科學學報》2014年第6期
選稿:耿 曈
編輯:汪鴻琴
校對:賀雨婷
審訂:楊 琪
責編:耿 曈
(由于版面有限,文章注釋內容請參照原文)
![]()
微信掃碼加入
中國地名研究交流群
QQ掃碼加入
江西地名研究交流群
歡迎來稿!歡迎交流!
轉載請注明來源:“江西地名研究”微信公眾號
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.