您的位置首页  人文

人文环境描述(工作人文环境好怎么描述)一看就会

  • 来源:互联网
  • |
  • 2023-11-12
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字


摘要:以文物数据为核心的知识组织与应用是国内博物馆的主要研究趋势之一,旨在结合相关历史、艺术与文化背景,深入挖掘文物资源的内涵信息,构建内容丰富、具有规范性的领域

人文环境描述(工作人文环境好怎么描述)一看就会

 

摘要:以文物数据为核心的知识组织与应用是国内博物馆的主要研究趋势之一,旨在结合相关历史、艺术与文化背景,深入挖掘文物资源的内涵信息,构建内容丰富、具有规范性的领域知识体系,借助知识重构、数据检索及可视化展示等方式,发挥中华优秀传统

文化的应用与研究价值数字人文环境的建设与发展,为这一目标的实现提供了契机01研究背景应用信息技术解决以文物数据为核心的知识组织与应用问题是博物馆主流的研究趋势之一期望结合相关的历史、艺术与文化背景,深入挖掘文物资源的内涵信息,构建内容丰富的、具有规范性的领域知识体系,借助知识重构、数据检索及可视化展示等方式,发挥中国传统优秀文化的应用与研究价值。

在标准规范方面,国家文物局于2018年公布《馆藏文物登录规范(草案)》行业标准,对现有31类历史文物的编录要求进行了通用性说明在科研项目方面,2014年科技支撑计划《文物数字化保护标准体系及关键标准研究与示范》项目(项目编号:2014BAK07B00)研究制订了可移动文物(以书画与青铜器为例)和不可移动文物(以敦煌石窟寺为例)的信息采集、加工、存储、传输、服务和交换标准等共87项,填补了国内文物数字化工作中缺乏统一的、基于知识层面的分类体系和数据值标准的空白。

2019年国家重点研发计划《基于知识图谱的文物知识组织和服务关键技术研发与示范》 (项目编号:2019YFC1521200)中,要求创建领域知识图谱并在行业内普及与推广文物知识图谱的构建及应用虽然现有研究在数字资源管理方面取得了长足的进步,但尚未达到预期的应用效果。

博物馆以“物”作为研究对象,以展览策划(故事描述)、历史文献、科学实验等作为依托,注重文物影像采集,具有数据体量大、类型多、存储分散、描述标准不统一的特点在已有数字人文研究成果的支持下,依照文物类别(如青铜器、瓷器、书画、玉器等)构建知识模型对文物特征进行有倾向性的标引,使数据脱离格式、结构的束缚形成知识模型,然后利用可视化及人工智能技术挖掘其在人文研究和社会教育中的潜在应用价值,具有重要的研究意义。

而数字人文研究的发展为博物馆藏品的知识组织与应用提供了新的发展思路和契机02已有研究成果(一)典型研究案例近些年,国内外学者和学术机构在应用信息化技术促进人文研究方面做了大量的尝试,相关项目如下:1.文学共和国地图(Mapping the Republic of Letters)。

斯坦福大学与牛津大学的学者合作创建了该项目从文艺复兴至启蒙运动时期相关手稿、档案及出版文献中抽取通信人、通信时间、通信地点等数据然后在地图与时空坐标上展现,以洛克、伏尔泰、伽利略等欧洲知名人物为核心的知识群体的社交网络、居住地迁徙和通信往来情况。

从数据计量和可视化的新视角为学者观察和分析该期间文化、政治、宗教、经济与决定性事件的相互影响及演变情况提供素材2.《九宫大成南北词宫谱》电子版香港理工大学中国文化学系的学者创建了该项目作为清朝乾隆年间的一部戏曲音乐曲谱集,《九宫大成南北词宫谱》用工尺谱汇聚了唐宋诗词、大曲、南戏、杂剧、金元诸宫调、元明散曲、明清传奇等曲调,是南北曲研究的重要材料。

该项目不仅从文献中抽取了歌词、语调、节拍、旋律等数据完成了古籍的数字化工作,同时提供了五线谱释读及线上的播放功能,为学者的词曲研究提供了素材3.董其昌书画艺术大展2018年,上海博物馆进行了新型数字化展示形式的探索,以明代著名书画家董其昌作为叙事核心,延伸出书画作品、社交网络、生平事迹、艺术游历等故事线,以知识图谱、地理信息系统(GIS)、时间轴(TimeLine)、虚拟现实、现实增强等形式生动地再现人物生活的历史背景、生平重要事件和画作描述内容,便于观众在了解作者创作心态创作背景的基础上,深入理解书画作品所展现的意境及珍贵之处。

4.疾病感觉地图台湾研究院文哲研究所的学者创建了该项目”项目以魏晋南北朝期间具有相关性的35部志怪、传记小说及历代僧传作为研究素材,基于手工构建的古代疾病词表库应用自然语言处理技术,从中抽取与疾病相关的描述信息并在地理信息系统进行呈现,用于发现疾病出现的区域性特点和发展趋势。

同时从身心、情感、命运、生死、征兆等方面分析疾病在不同社会环境、不同小说中叙述焦点发生变化的原因,以及由此引发的社会现象5.明清妇女著作数字档案与数据库麦基尔大学图书馆的学者创建了该项目项目以图书馆收藏的明清时期的女性著作作为研究素材,抽取了女性作者的民族、婚姻、传记、诗词的形式、曲调、题材、评论等信息,以及作者之间的关系等数据,并提供基于中国历史地理信息系统的展示和检索。

协助学者分析明清时期不同流派女性作家的创作主题、流派间的相互影响及主题的演变过程6.明清杂志翻译研究香港中文大学的学者创建了该项目项目以1913年至1923年间,上海中国图书公司出版的四本女性译本杂志作为研究对象,研究作者及编辑的性别、年龄、籍贯、社会关系、工作情况、教育水平等,翻译文章的主题、题材以及文章与刊物之间的引用关系等。

用于发现该时期社会底层译者在国内的分布和生活状况,以及当时中国人对外国作品的兴趣关注点和变化趋势7.天象模拟在古代文学研究中的运用安徽大学学者以含有天象描述的古代诗文作为研究对象,以天文学软件虚拟天文馆(stellarium)作为辅助研究工具,辨析诗文中天象描述对应的历法时间与重要历史事件,如“四星聚尾”与安禄山的起兵宣传,李白《南奔书怀》中记载的叛逃事件与太白夜食昂现象发生的时间关系等。

便于学者还原当时的社会环境,感受作者的创作心态,或理解作品中借助天象描述隐喻的历史事件8.日本古籍数据集日本人文学公开数据共同利用中心创建了该项目在日本江户时代,每年都会发行刊载诸大名与旗本(日本官员名称)姓名、系谱、官位、家纹等的文书,称为武鉴。

该项目以1789年出版的《宽政武鉴》作为研究对象完成了数字化工作并将书中的武器与纹样,使用国际图像互操作性框架策展视图(IIIF Curation Viewer)的图像处理功能分别进行标注整理另外,项目还对照书中的描述对图样进行了基于三原色光模式(RGB)的填色处理,以最大程度还原武器的真实形态。

(二)小结与分析通过上述案例可以发现:1.越来越多的人文领域学者将人工智能、可视化展示、地理信息系统、虚拟现实等技术作为在研究中发现问题及支撑论点的辅助工具这种现象一方面得益于信息技术已经发展达到了一个较为成熟普及的阶段;另一方面也说明,数据在脱离了载体限制后处理方式变得更加灵活,具备了支持知识分析和发现的巨大潜力。

2.大部分项目是针对某个时间、地域范围内的某个较为集中的主题实现的一方面由于全面收集支撑材料存在难度,通常选择一套较为完整的、经典的古典文集作为研究对象另一方面表现为人工处理的工作量较大例如,现有的文字识别技术对古籍排版方式及古文字的处理能力不足,自然语言处理技术无法从晦涩的文言文表述中抽取数据等,都需要专家依据经验手工完成。

3.在数据处理和标注时,对数据格式标准的重视程度不同有些项目侧重于资源平台建设,为了达到资源共建共享的目的,主体使用了文本编码倡议(TEI)、国际文献编辑中心的概念参考模型(CIDOC)、国际图像互操作性框架(IIIF)等国际或国家标准,并根据资源特点在已有体系结构上进行了扩展。

有些项目侧重于为个人研究提供分析与统计数据,采用了自建知识体系的方式03博物馆藏品的知识组织与应用(一)整体技术路线

图1 整体技术路线示意图在深入调研、归纳和总结相关数字人文项目的基础上,本文从技术角度设计了实现博物馆藏品知识组织与应用的一般技术路线,如图1所示(二)关键问题分析在上述技术路线中,可重点思考及解决以下三个问题:。

1.知识模型的构建与编译文物是在人类历史发展和社会变迁中保存下来的劳动遗物或遗迹,揭示了不同历史时期社会活动、意识形态、自然环境等要素的状态及变化规律博物馆可通过数字化手段表现文物的保存、鉴赏和研究价值,而良好的文物知识模型是支撑应用层功能(如知识分析与关联检索、人机交互、虚拟现实、沉浸式体验等)实现的关键性因素。

以已有的知识结构作为种子,结合信息技术和长久以来累积的专家经验,将历史纪年、文化事件、地理位置、历史名人等要素作为基线,对特定类型文物的知识模型进行延伸,实现历史人文知识的融合,协助学者从多角度思考并扩展其研究视野,发现和解决科学问题。

为了使知识模型达到准确性、一致性、可衔接性和适用性的要求,通常在构建过程中从数据结构和数据值等方面为其设计规则和约束条件数据结构主要用于实现文物对象的抽象和描述其中,文物信息是数据结构设计的核心部分,依据《文物藏品档案规范(WW/T0020—2008)》的著录要求,可从名称、类别、年代、地域、人文、质地、功用、工艺、技法、形态、色泽、装饰、题识、文字和计量等方面进行描述。

针对不同类型文物的特殊属性,可根据应用需要对上述结构进行延伸与扩展数据和数值用于规范内容描述的共性词汇,为不同来源数据的关联创造条件例如青铜器的纹饰、书画的十八描技法等文物词典,尽量使用领域通用的表述方法促进学术交流。

在知识模型编译的过程中,也可参考国际通用的国际文献编辑中心的概念参考模型(CIDOC)、艺术作品描述类目(CDWA)、视觉资源核心类目(VRA)等标准,这些标准被广泛应用于台北故宫博物院、数字影像图书馆(ARTstor)、欧洲数字文化遗产平台等项目中,便于国际博物馆界藏品数据的交互与共享。

2.支撑数据的收集与处理文物相关的支撑材料,除了博物馆藏品管理系统、影像信息管理系统以及其他机构创建的资源共享平台的数据外,大部分内容如形态结构、历史考证、鉴定辨析等,隐藏在论著、期刊文献、展览策划方案、官方网站、图录、古籍等网页、出版物和文本文件中。

因此,首要的问题是完成相关材料的数字转化工作,并分别归纳为结构化、非结构化和半结构化三种数据类型考虑到资料来源的差异性,数据在表述方式上存在不一致的问题,使用通用的知识抽取工具会导致无法正确识别实体、关系和属性的情况出现。

对于非结构化和半结构化的文本数据,为保证知识抽取的准确性,需要专家依据知识结构和经验,借助语言标注工具对部分数据进行手工标注即以半监督学习的方式,让计算机理解不同描述之间的相互关系,为自然语言处理、语义标注、实体消歧、不一致检测、相似度计算等自动化的数据处理创造学习环境。

在这项工作中,博物馆可根据支撑材料体量的大小和机器学习的难易程度,选择适当的方式(人工或自动),完成数据的结构化所有数据,在经过字段映射和取值归一后,即可达到应用要求3.知识情境富化文物的知识模型需要在人文知识环境下发挥其研究价值,包括但不限于历史纪年、文化事件、地理位置、历史名人、地层层序律、化学成分分析等方面,实现历史空间重建及物质变化推演的要求。

为此,需要寻找、借用已取得的研究成果,丰富知识内容并提供对照分析的依据较为常用的基础性项目如:(1)复旦大学和哈佛大学等多家机构共同研发的中国历史地理信息系统CHGIS项目,以谭其骧主编的《中国历史地图集》为基础,结合历史文献,应用网络地理信息系统(Web GIS)技术以层叠的方式展现公元前221年至1911年前后中国各历史时期的重要行政区,如安徽、福建、甘肃、广东等地的地名、行政状态和地理位置、行政边界的变化情况,以及山川、湖泊等地理要素的分布与变化规律。

(2)北京大学古代史研究中心等多家机构共同研发的中国历代人物传记资料库(CBDB)项目,以收录和整理中国从7世纪至19世纪的名人传记材料作为主要目标,至2018年收集了约40余万条人物数据,整理了人物生平、社会关系、社会地位等内容(可关联到出处),用以重现个人的社会网络关系,其中以唐、宋、明、清的人物传记资料最为充实。

(3)浙江大学经济与文化研究中心等机构共同研发了智慧古籍平台项目,该项目以中国宋、明、清等朝代大家的著作为素材,完成古籍全文的文字识别和标注(包括标点、地名、人名、官职等)工作,能在很大程度上减轻古籍的数字化处理任务。

这些项目中的大部分资源向学术研究团体提供免费的资源共享服务以中国历代人物传记资料库(CBDB)为例,项目提供了免费的资源获取应用程序编程接口(API),支持基于身份及人名的查询提供可扩展标记语言(XML) (或JSON)格式的结果输出;链接开放数据(Linked Open Data)服务支持朋友的朋友(FOAF)、网络本体语言(OWL)、资源描述框架(RDFS)等格式的数据查询;还可基于地理信息系统(ArcGIS)、谷歌地球(GoogleEarth)等地理信息系统软件,实现与中国历史地理信息系统(CHGIS)项目数据的整合,交互展示项目数据。

(三)主要应用方式文物知识模型可应用于以下方面:1.数据检索与知识关联分析数据检索是从庞大的数据集合中获得与需求相关资源的活动由于文物数据普遍存在的文字生僻、一物多名、一名多义等问题,使用传统的关键字匹配、分类检索等方式,检索效率较低,无法满足使用要求。

知识模型能有效提高检索的准确率,主要体现在:(1)创建了知识体系结构及词表库,使数据检索不再浮于字面意思而是指向知识内容本身;(2)在知识之间形成了丰富的关联关系,将与检索知识相关的其他重要节点作为推荐,便于知识拓展及检索思路的调整;(3)知识模型对异构的数据格式提供了良好的包容性,其数据关联无形中完成了对文物二维、三维影像等多媒体资源的自动标注工作,为文本搜图、图搜文本等多模态检索提供了支撑环境。

2.可视化呈现以图形或者动画的形式完成海量数据的表达和模拟,是知识模型重要的应用和呈现载体相较于复杂、晦涩的数据,图像更符合人类的认知习惯,能够有效减少理解和记忆消耗的成本并可在保留数据关系的前提下,支持多维度的空间构建、定量的数据推演和计算、多角度多类型的静态和动态图像展示。

同时,可视化展示支持人机交互,能够将专家的经验、感知能力与人工智能的数据处理能力实现有效的结合,在信息互动的过程中不断迭代达到最优的可视化展示效果,揭示客观事物的本质及发展规律目前,基于时间序列、地理空间、统计图等可视化方式在文博领域逐渐引起重视,但主要作为成果的展示工具,面向观众提供教育服务。

可在此基础上,结合知识模型探索其在研究中的应用价值04中国古代钱币的知识组织与应用实践中国古代钱币,素以历史悠久、流传有序、形制多样、种类纷繁、制作精良等特点著称于世,是揭示古代社会意识形态、经济体制与对外贸易往来、重大历史变革、冶金与铸造技术、文化与民俗的重要依据。

在经历了深入的学习和调研后,本文以中国古代钱币作为研究对象,选取了秦汉至明清时期百余枚传世珍稀钱币,构建小范围的知识模型结合中国古代钱币资源特点,基于钱币的基本信息(如名称、地域、年代等)、构造特征(如形态、钱文、纹饰、尺寸、重量等)、技术特征(包括材质、成型工艺等)、功用(如货币、民俗钱、模范、印钞等)、历史文化(如历史事件、人物传略等)和参考文献创建了钱币知识模型框架并基于可扩展标记语言(XML)完成了编译工作。

以“靖康通宝”为例,其知识抽取及可视化展示如图2所示以“靖康通宝”为基点,可以一层层延伸出多个存在相关性的人名、事件、物品、地点、时间节点作为数据关联检索的条件,便于深层次、多角度的知识发现

图2 靖康通宝的知识构建示意图(上)与可视化展示(下)在完成知识抽取的全部工作后,本文尝试使用可视化数据分析软件(Gephi)进行数据关系网络分析,如图3所示主要从战争、币制改革、朝代更替、经济危机、艺术、版别、特殊用途等方面展示了中国古代钱币珍藏价值(即稀有性)产生的原因。

例如,钱币的版别存世稀少是决定其珍藏价值的一个重要方面,这一现象主要发生在宋代,例如绍熙元宝、政合通宝等唐代的珍稀货币很多是与叛乱或币制改革相关的,如史思明在安史之乱之后发行的得壹元宝,乾元重宝开炉钱是实行币制改革的重要标志等。

再如,宋代大观通宝、淳化元宝因两代帝王的“御书体”较为珍贵,从一个侧面反映了宋朝崇尚艺术的时代特征

图3 基于可视化数据分析软件的关系网络分析钱币作为一种人与人之间物品交换的媒介,与人类文明相伴相生,展现出极强的跨学科性,文化、政治、经济、人物、矿产资源分布、重大历史事件等因素,对钱币的铸造工艺、金属成分、形制用途、钱文(纹)特征、铸造时间与地点、版别、货币体制、流通情况、文化涵义等特征存在错综复杂的影响。

本文仅从一个角度对知识模型的构建和可视化展示进行应用尝试,得到如下体会:在实施计划前,应根据自己的优势、限制条件和研究目的等,综合考虑研究主题,并界定研究范围因为知识模型是一个庞大的关系网络,不同的数据选取范围和统计计算角度可能得出不同的推断和观点。

支撑材料的可获得性、全面性和权威性,知识抽取的深度和广度,资料数字化的难易程度等,决定了是否能够从科学研究的角度对现象给出合理、客观的解释知识模型可根据研究角度进行多层级深入细化例如,研究钱文和书画艺术的相互影响时,可收集并创建字体词表,将篆体细分为悬针篆、菲叶篆、玉筋篆、九叠篆等类别。

研究钱币发行和使用的变化趋势和原因时,可详细整理并归纳每种钱币的版别、面值和流通时间《中国钱币大辞典》《中国历代货币大系》《中国古钱大系》等书,对中国自先秦起至清代3000多年的古代钱币做了系统性、权威性的整理,可作为首选的参照标准。

随着出土钱币数量的增加,可考证的素材也在不断丰富正确认识实践中遇到的各种困难例如,由于大部分支撑材料都是文本类型的非结构化数据,有些著录项在材料里没有说明或者描述的比较模糊,为了保证研究的严谨性需要搜索补充材料进行比对分析。

有些可视化软件操作容易,但是无法满足展示要求;有些展现效果好但操作复杂,需要花费大量时间去挑选和学习在数据分析的过程中,发现著录项选择有误,需要重新界定分类等,应保持乐观的心态去探索求知05结语在国家文化强国及智慧博物馆建设战略的指引下,以沉浸式体验、4K高清虚拟等技术实现文物的数字化展示,已成为博物馆的发展趋势之一,与传统展示方式相得益彰。

但是,在文物知识模型的组织与应用方面仍存在较大的发展空间可借助数字人文建设已经取得的研究成果与经验,以结构化的方式组织和描述文物中的概念、实体以及之间的关系,将分散的数据有效地组织起来,然后利用可视化呈现、数据检索等方式为公众教育及领域研究提供有深入挖掘价值的知识。

  ❁ 为阅读方便,注释从略,请以正式出版物为准 ❁  本文作者及其工作单位:刘芳 / 中国国家博物馆   本文刊载于《中国博物馆》2022年第3期本公号刊载的作品(含标题及编辑所加的版式设计、文字图形等),未经中国文物报社授权不得转载、摘编、改编或以其他方式使用,授权转载的请注明来源及作者。

编辑|高文思 雪晓楠审核|耿  坤

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186