您的位置首页  人文

形容一个地方人文的词语(形容地方人文丰富的词语)这样也行?

  • 来源:互联网
  • |
  • 2023-09-07
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

兴趣是看看小说,也就顺便搞搞学术。

形容一个地方人文的词语(形容地方人文丰富的词语)这样也行?

 

小编说    第 20 届 CLSW会议 (CLSW-2019)将于 2019 年 6月 28 至 30 日在北京召开 ,此外小型研讨会将与CLSW-2019会议同时举行小编在前线也网罗了一些会上颇具亮点的研究内容安利给大家。

    第一篇我们要推出的是与金庸有关的研究《基于计量语言学的金庸作品数字人文研究》,这篇论文从词、句子等多角度来描写金庸作品其独特语言风格,最后结合相关工具,将金庸作品文本计算进行可视化展示,从计量的角度给我们呈现出了金庸笔下的别具一格的江湖地理。

对作者研究方法感兴趣的朋友或是对金庸作品感兴趣的朋友,小编在这里强烈推荐各位亲临会场,与作者面对面“切磋交流”一番基于计量语言学的金庸作品数字人文研究01♪研究动机

近年来学界对作家作品的数字人文研究,在作家作品本身的定性研究上已臻于成熟,基于统计数据的定量研究逐渐兴起,但数量仍较少将定量的分析方法引入到人文社会科学研究领域已经成为一种研究趋势定量分析的研究方法能使我们对作家作品语言风格有更加深刻、科学地认识。

随着计算技术和语料库研究方法的发展,文学作品语言风格的定量分析有了可靠的数据支撑利用计量语言学理论和方法对文学作品的语言风格进行定量研究,是语言风格和数字人文研究的一大进步我们将金庸的十五部小说同《人民日报》以及古龙的小说作为研究对象,建设了金庸作品语料库,通过计量语言学的相关理论和定量分析的方法进行对比研究,寻找金庸作品的语言风格。

02♪研究内容   1.词汇分析金庸小说总体使用频率最高的六类词依次是名词、动词、副词、代词、助词和形容词动词占比高的小说,其动作场景刻画描写的频度更高,由此成为小说的一种特色形容词则多用于描写人物形象、刻画环境场景等,对于形容词总数多的小说可以推测出作者注重对事物的描摹、多关注细节等。

图1 词例token人民日报,数词多,副词、代词少由于报纸中常出现“八届人大常委会”“第30次会议”以及“2980名代表”等序数词、基数词,因此数词数量占比大报纸的叙述重点是说清楚时间、地点、人物,要求指代明确;而小说主要关注流畅推动故事情节的发展,在指称人物时倾向于趋简避繁,体现了语言运用中的省力原则,因而代词数量多于小说。

图2 词型type金庸小说与人民日报相比,在用词上呈现出明显的武侠小说的特性,例如武侠小说副词、代词数量多,动词、形容词、成语种类丰富等特点,展现出了武侠小说描写丰富、情节性强的特点;而不同作者的武侠小说间也有一定的区别,例如金庸小说副词、形容词的使用没有古龙小说丰富,但在名词的使用上,金庸小说呈现多种多数的景象,表现出金庸对地点、人物的构思颇为讲究的特点。

2.作品相似度作者在遣词造句上的特点体现了作品的语言风格从词汇的使用差异入手,可观察作家在不同小说中用词的相似度以及不同作家作品间的相似度用BCC工具分词、统计词频后,去除停用词和常用词,选择了基于词频的余弦相似度来计算。

用余弦公式计算相似度是1971年时提出的,广泛用于文本分类,刻画相似度,基本原理是用向量空间中的两向量夹角的余弦值作为衡量两个个体间差异大小值越接近1,就说明夹角角度越接近0°,即两个向量越相似(1)短篇小说。

表1 金庸短篇小说相似度(2)中篇小说

表2 金庸中篇小说相似度(3)长篇小说

表3 金庸长篇小说相似度《天龙八部》与《倚天屠龙记》相似度高达81.70%,其次是《笑傲江湖》与《天龙八部》的80.10%相似度最低的是《白马啸西风》与《越女剑》的46.30%总体来看,一部作品与其前后相邻作品的相似度更高,体现了作者的写作风格,用词用语在时间上的连贯性。

对金庸小说和古龙小说进行相似度对比,也分为三类其中,短篇小说《飞刀,又见飞刀》与《鸳鸯刀》相似度最低,是34.88%,中长篇小说中是《火拼萧十一郎》和《连城诀》,为55.06%,相似度最高的两部小说是《天龙八部》、《浣花洗剑录》的。

84.98%,《天龙八部》、《大旗英雄传》是82.60%由此可以推测,古龙早期的作品创作受金庸影响较大  3.句子分析 对于句子层面的语言特色,我们主要从句长的分布、句子破碎度和句长离散度等角度来分析(1)句长分布分析

我们分别按字数,词数,小句数对句长分布进行了统计。以按字数分析为例,如下图:

图3 《神雕侠侣》句长(按字数)我们发现先上升,后下降是金庸小说句长分布的总体趋势,但在这大趋势中也存在局部的高峰和低谷经统计观察发现,除《鸳鸯刀》以外,金庸小说在句字数为2时均于图表上形成一个小高峰,这些句子大多为“人称代词。

+省略号”或“语气词或叹词+感叹号”的形式,如“你……”“呸!”“爹……”“哎!”等,“人称代词+省略号”和“语气词或叹词+感叹号”展现了对话中语言的断续性,使对话场景更真实、生动,同时体现出其语言的口语色彩。

与小高峰对应的小低谷则多出现在句长字数为4时,多为“三字词/短语+标点”,例如“怎么办?”“这一次……”“田伯光!”等现代汉语中双音节词占多数,因此进行词语搭配组合时,三音节的词组和句子出现概率较小,这大概能作为句长字数为。

4时出现小低谷的解释。为了进一步观察金庸小说句长分布特点,我们将金庸小说与古龙小说及同时代的人民日报进行了整体性的对比,根据句长分布制作了句长频次分布折线图,如下:

图4 句字数频次折线图由折线图可观察到,人民日报句子长度变化比小说平缓许多,句长大于31的句子数量的占比始终高于金庸小说,由此可以判断人民报长句较多,短句较少,且语言节奏较为平缓,更为书面化,这与新闻这种语体密切相关。

相反,金庸小说语言整体富于变化,节奏性强(2)句子破碎度所谓破碎度,是指句子中停顿次数所以一般来说,句中标点符号越多,停顿也就越多,破碎度也就越高,语言口语性越强,反之,则句子流畅通达,书面性越强我们计算并统计了金庸、古龙小说及人民日报的句子破碎度,制成柱状图,并按照破碎度由小到大排列,如下图:。

图5 句子破碎度金庸、古龙均是武侠小说作家,因此破碎度总体差异不大,除《残金缺玉》外,均在2—4之间,其中古龙小说《飞刀,又见飞刀》破碎度最低从整体来看,金庸大部分的小说破碎度均高于古龙的小说,结合句长分布及句中逗句数量来看,金庸短句较少,长句较多,但句中逗句数量多,句子破碎度较高,由此我们可以推断:金庸小说的语言较为平实,口语性较强,更贴近生活;古龙小说书面性较强,更注重词句的雕琢。

(3)句长离散度句长离散度(D)是指文本中句子的句长偏离平均句长的程度,它可以反映文本的节奏变化,离散度小则富有韵律性,平稳、重复,大则跌宕起伏、富于变化我们分别计算了金庸、古龙的各部小说的离散度以及金庸、古龙小说总体的离散度,并制作图表(图表按照离散度由小到大排列),结果如图表所示:。

图6 句长离散度我们可以发现,金庸各部武侠小说内部离散度差异并不大,大约在16—20之间,而古龙各部小说句长离散度差异较大,在13—46之间由此我们可以看出,就数据而言,金庸小说相较于古龙小说,在文本节奏方面趋于统一,韵律性强,句子长度变化较为稳定;结合句长和句中小句分布来看,其小说虽长句占比较大,但句子破碎度高,长短结合,错落有致。

总的来说,小说的句长变化程度对小说的语言风格有所反应,金庸小说语言更为口语化,文本节奏趋于统一,韵律性强金庸小说和古龙小说同作为武侠小说在句子的分布构成有密切的联系,同大于异,体现了同体裁作品内在的一致性。

4.人物行迹与金庸江湖地理我们使用文本计算、电子地图与EXCEL三维地图等工具为辅,将金庸笔下人物的行踪路线可视化,并呈现出金庸笔下的江湖地图(1)人物行迹图我们通过编程统计了小说中的人物名称(nr)在每个段落中与各个地点名称(

ns)共同出现的次数。

表3 人物行迹图在金庸的十五部小说中,《鹿鼎记》中韦小宝的游历区域最为广泛,共到达过254个不同的地方,高频的地点有罗刹329次、北京256次、云南209次、扬州197次、台湾191次等韦小宝的人物形象在金庸笔下十分特殊,他既能混迹于市井妓院、当白龙使、加天地会,也能入皇宫、任抚远将军、平各处战事,他浪迹四海,到过如此多的地方也是合理。

此外,根据人名、地名共现的数据,还能够绘制出小说中主要人物的行迹图本研究选取了金庸早期、中期、晚期的四部代表性的作品《书剑恩仇录》,《射雕英雄传》《倚天屠龙记》以及《笑傲江湖》,提取主人公所到的高频的地点,并使用百度地图的标记工具进行了详细的标记。

图7 《射雕英雄传》郭靖、黄蓉路线(2)金庸江湖地图我们提取出每部小说中高频出现的地名(ns),认为是金庸着墨描写过的地方,与故事情节密切相关,经筛查后,在excel的三维地图上生成柱状图和热力地图,显示出金庸笔下着墨描述最多的地方并进行了相应的分析。

观察金庸笔下最常出现的地方,颜色越深则表示出现的频次越高。

图8 金庸小说地点频次热度地图首先是漠北地区的蒙古草原,在射雕三部曲、《天龙八部》和《鹿鼎记》等小说中均涉及到了汉蒙民族关系的发展与变化在《射雕英雄传》的前面部分,蒙古人对流落漠北的郭靖母子伸以援手,呈现出热情善良而勤恳朴实的一面。

到了后期,为了本民族的利益,蒙古人又显露出可憎可恶的残暴的侵略者的一面士兵们攻城略地,成吉思汗为突进中原,甚至下令屠城“蒙古形象的多重性,在不同的历史时段、不同的人物关系之中,形象也发生相应的变化”金庸塑造的精彩的人物形象中也有不少是蒙古人,如赵敏、拖雷,一代枭雄成吉思汗等等。

正是在不同小说中对蒙古士兵、蒙古英雄细致、整体性的刻画中,我们看到了金庸作为文学家、历史学家具有的深刻、进步的民族、国家意识,在蒙古形象的塑造下,也折射出本民族统治者的昏庸无能此外,北京,山西大同,华山,河南,陕西,云南大理等地的密度也较高,符合我们对金庸小说内容的印象。

在推动情节发展的过程中,出现了大范围时空迁徙,体现了金庸宽广的地理与历时视野尤其是地域牵涉范围之广,凸显了金庸的江湖世界对整个东亚文明核心与周边的强大包含性03♪总结金庸小说在用词方面,展现出武侠小说的细节描写丰富、情节性强的特点,从名词的使用上表现出金庸对地点、人物的构思颇为讲究的特点;在句子方面,金庸小说句子破碎度较高,口语化程度高,语言贴近生活,各部小说句长离散度差异较小,文本节奏趋于统一,韵律性强,句子长度变化较为稳定;在人文地理方面,金庸笔下文学地理空间十分广阔,涉及中国大部分疆域和俄罗斯等国家,其中韦小宝、令狐冲、段誉等人游历地点较多,符合我们对其小说内容的文学印象。

金庸小说在本文中分别与古龙小说和人民日报比较呈现出了不同的语言风格特点但在现代汉语规范和共同语变迁的历程中从不同的社会层面、生活空间中都起到了重要的作用文学作品的研究应该是多维的,而定量研究可以分析的数据的解读同样具有多种阐释空间。

金庸作为20世纪下半页在语言生活和社会文化上具有重要影响力的作家,其作品研究还有很大空间04♪关于作者夏恩赏,北京语言大学汉语国际教育研究院硕士生,研究方向:语言学及应用语言学邰沁清,北京语言大学汉语国际教育研究院硕士生。

,研究方向:语言学及应用语言学李琪,北京语言大学汉语国际教育研究院硕士生,研究方向:语言学及应用语言学黎江涛,北京语言大学汉语国际教育研究院硕士生,研究方向:语言学及应用语言学饶高琦,北京语言大学汉语国际教育研究院硕士生导师

荀恩东,北京语言大学信息科学院博士生导师注:本论文将于6月30日上午8:45至9:00北京国际温泉酒店第十会议室进行口头报告。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186