切换到宽版
  • 645阅读
  • 1回复

[数码讨论]激活中华典籍的“数字生命” [复制链接]

上一主题 下一主题
离线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
106035
金币
458
道行
19523
原创
29307
奖券
17205
斑龄
189
道券
10126
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 19960(小时)
注册时间: 2007-11-29
最后登录: 2024-11-12
— 本帖被 兵马大元帅 执行加亮操作(2024-02-23) —
轻点鼠标,随着一缕悠远的音乐,“永乐大典”在隽秀的书法背景中缓缓浮现……

  “终于让我们普通读者一睹国宝真容。”家住山东滕州的古籍爱好者李庆,在电脑屏幕前浏览《永乐大典》数字版时发出感叹。他所观看的,是由国家图书馆出版社有限公司和北京大学-字节跳动数字人文开放实验室联合研发的“《永乐大典》高清影像数据库”。历经600多年风雨,成书于明朝的《永乐大典》存世数量不及原书的4%,眼前的影像数据库让每一位读者都能感受它的厚重与魅力。

  保护和传承中华古籍不仅是维护中华文明根基的重要任务,更是向世界传播中华文化智慧、造就中华文明新形态的关键环节。在学术意义上,古籍数字化意味着运用数字技术对古籍进行收藏与保护、整理与研究、呈现与出版,而在更广阔的人类文明衍进层面,数字化使古籍中的智慧精华,能够通过趣味性、前沿性和大众化的方式,得到传播与推广。调研中,98%的受访者认为应对古籍进行数字化转化,几乎相同比例的人认为数字技术对古籍保护和传承发挥着显著作用。

焕新 以数字科技赓续中华文脉

  古籍保护层面,数字化实现古籍生命永久存续,助力海外遗珍重现容颜。

  中华文明是世界上唯一没有中断的文明,在数千年历史进程中,传世古籍浩如烟海。古籍不仅包含传统线装古籍,还包括甲骨、简帛、碑帖拓本、古地图等。《中国古籍总目》显示,我国现存古籍约有20万种。数字科技从根本上改变了古籍保护逻辑,通过“数字孪生”和“入库共享”,使古籍以数字形态永久保存。

  “古籍数字化关系到我们国家文化资源的安全。古籍一旦遇到火灾、水灾等,将带来不可逆的损坏”,国家图书馆(国家古籍保护中心)办公室介绍。由国家图书馆(国家古籍保护中心)建设的“中华古籍资源库”,目前已发布古籍资源10.3万部(件),共2640万页,其中,读者利用率最高的善本古籍,已有2万多部实现上网。

  对于壁画、彩塑等无法永久传世的文化形态,数字复刻更为重要。敦煌研究院的“数字敦煌”项目,将洞窟、壁画等制作成数字图像,一方面能永久保存敦煌文化信息,另一方面可使游客将线上参观与实地游览相结合,降低过量游客进入洞窟带来的文物保护压力。

  除了在时间维度上永久延续古籍生命,数字技术还打破空间限制,使散布于国外的中华古籍能够以数字方式重现真颜。公开资料显示,由山东大学作为主体单位实施的“全球汉籍合璧工程”,对境外存藏的中华古籍进行调查摸底和数字化回引,至2023年7月,已经发现1900多种中国大陆缺藏的珍稀汉籍,并复制回归1600余种。

  古籍整理层面,数字化推动古籍搭上智能“快车”,促进整理工作提质增效。

  在影像复刻基础上,运用人工智能技术对古籍文本进行提取、标引、分析等,是数字科技助力古籍传承的关键一环。北京大学数字人文研究中心主任王军曾指出,依照国内修复整理古籍的速度,可能需要300年才能将现存古籍全部修复整理出来,但借助人工智能技术,这一时间大概会缩短至二三十年。

  “古籍的数字化整理部分,我们从人力和资金的投入上来说是比较多的”,字节跳动公益古籍项目相关负责人告诉调研组。由于数字化整理需要把纸本内容转化成数字文档,古籍特有的假体字、异体字和书写方式等,对转化准确率形成挑战。在文本提取基础上,自动断句、自动标点以及识别文本中的人名、地名、官职名等,更体现着智能科技对古籍整理工作的颠覆式迭代。

  当然,机器无法百分百准确地识别语义,人工标注和校对依然重要。借助数字平台,古籍整理的众包模式悄然兴起。中华书局下属的古联公司在2018年推出古籍整理众包平台,2020年上线了能在移动端分发任务的“i编纂”小程序。公司总经理洪涛向调研组介绍:“众包平台有5000多位注册用户,他们是来自各行各业的古籍爱好者。”据悉,该平台上编校过的任务近5万个,处理的古籍超14亿字。

  古籍传播层面,数字化推动“蒙尘”古籍走向前台,搭载互联网实现开放共享。

  小谭是中国古典文献学专业的在读研究生,日常学习“穿梭”于各大古籍网络平台。“这些平台基本能满足对材料的初步检索搜集,许多平台还提供珍贵古籍书影数据,不用去各地奔波就能看到古籍原貌。”

  点开国家图书馆(国家古籍保护中心)建设的“中华古籍资源库”,排列着数字古籍、数字方志、赵城金藏、碑帖菁华、甲骨世界等20余个子栏目,支持单库检索、多库检索、精确检索、模糊检索。由北京大学-字节跳动数字人文开放实验室打造的“识典古籍”平台,提供原本影像对照、繁简转换、文白翻译等功能,并对内容添加了标点和注疏,还能显示文中人名、地名、书名等专有名词详细介绍。据调查,超过80%的受访者期待使用集搜索、翻译、注释等功能于一体的古籍应用平台,这些功能使古文褪去晦涩难懂的外壳,极大方便用户阅读和学习。

  分布于全国各地的珍贵古籍也借助数字化浪潮纷纷亮相。截至2023年9月,国家图书馆(国家古籍保护中心)联合各地图书单位开展了8次古籍数字资源发布活动,地方图书单位累计发布古籍资源超过2.8万部(件),参与发布的机构下沉至县级图书馆。针对全省各地市馆不少珍贵古籍已做数字化处理但未能发布的情况,浙江图书馆建立了“浙江省历史文献数字资源总库”,已发布古籍2600余种,约6.5万余卷。联合发布让散布于中华大地的珍贵古籍重焕光彩。

活化 融古于今绘就现代文明

  内容的活化:萃取海量古籍中的知识网络

  将海量古籍文本进行数字化提取,就形成了汇聚先哲智慧的“大数据库”。借助智能分析技术,能够针对其开展深度文本挖掘、社会网络分析、时空关系分析、知识图谱建构等,让大众全面又直观地理解古籍中的知识网络。

  浙江大学徐永明教授团队开发的“智慧古籍平台”,在提供文本分词、标注、释义、文白翻译等功能基础上,还为用户呈现古籍著者的世系图、社会关系图等。“未来的发展方向,是将古籍文本与结构化数据进行关联,实现智能化处理”,徐永明教授告诉调研组,他的团队还开发了学术地图发布平台,以地理信息系统为依托显示其规律性、综合性数据,比如李白、杜甫一生中的地理迁徙轨迹图等,这一平台在中学语文教学中得到广泛应用。

  对古籍文本知识进行显性化提取,也是北京大学数字人文研究中心持续发力之事。近期该中心上线“文献溯源分析平台”,能够呈现词语在古籍文本中的出现频次、共现情况等,并可追溯句子的来龙去脉,观察句意相似句子在形式和内涵上的流变过程。“吸引大众参与是古籍活化的重点,要利用智能技术让社会更多接触和使用古籍数据”,中心研究员位通谈到。在北京大学2022年举办的首届“北京大学数字人文作品展”中,“中国古代名人迁居地图”“中国古典诗歌声律分析系统”等也令人印象深刻。

  形态的活化:虚拟仿真推动古籍融入现代生活

  “千年之后,还有这么多人喜欢我,我还是蛮欣慰的”,在2023年央视《中国诗词大会》现场,诗人苏轼“穿越”而来,不仅为选手出题,还与演员饰演的黄庭坚一起再现了“鄱阳湖相会”。这位“苏轼先生”让人难辨真假,而“他”正是当下火热的虚拟数字人。

  再如,深度沉浸的超现实技术将古籍活化推向新高度。2023年在国家典籍博物馆举办的“古籍寻游记”体验项目引发热烈追捧,观众只需头戴虚拟现实头盔,手持操作手柄,便能够“亲身”穿梭于历史时空,“亲手”将文物捧在掌心。

  在技术加持下,虚拟现实、沉浸参与、人机交互、智能传播等为文化创新持续赋能。从“阅读古籍”到“身临其境”,技术重构了人与古籍的互动场景,让人能在综合感官体验中领略文化魅力,提升对文化的归属感和认同感。

  此外,网络游戏、数字展厅、数字藏品等当下流行的传播形式,在多个维度上助力古籍从“活”起来到“潮”起来。

  体验的活化:借助数字影像讲好古籍故事

  古籍不仅蕴含古人智慧,也承载着中华文明发展的集体记忆。传播经典古籍,要将古籍知识与古籍历史相结合,运用具象化、生动化的手法讲好古籍故事。近年来,《典籍里的中国》《山海奇幻夜》《穿越时空的古籍》等视听节目,不断创新古籍影像叙事策略,引发一轮又一轮“古籍热”。更为重要的是,这些节目注重在时空交融中诠释中华古籍的当代价值。

  “一直说‘古’会陷入曲高和寡,一定要汲取古籍对当下有指导意义、能够产生共鸣的点。”《山海奇幻夜》总导演雪芬向调研组介绍,“比如我们把夸父追日诠释为奔跑在路上的执着,将飞走的神鸟演绎为追求光明,这都能与现实呼应。”

  短视频平台上,古籍的能见度也越来越高。抖音平台#寻找古籍守护人#话题播放超过25亿次,快手平台#古籍古书#话题播放3亿多次,古籍专家、普通用户和文化机构等讲述各自故事,让古籍及其文化通过手机屏幕进一步走进大众生活。

反思 古籍数字化还需要完善什么

  建设主体各自为政,技术标准不统一,数据库之间壁垒明显。当前,全国范围内的古籍数据库,在建设中缺少统一的技术规范,古籍的呈现、标注、检索等“千库千样”,质量参差不齐。随着数字化平台增多,库与库之间的壁垒愈加显现,用户难以实现“一站式检索”。面对海量古籍,对哪些书目进行数字化处理,各个建设单位缺少协同。“因没有相对可持续的规划,有较多重复制作,造成浪费”,某省级图书馆管理人员向调研组坦陈。

  行业开放程度不足,版权保护不健全,制约古籍的全社会共享。古籍是属于全社会的文化遗产,部分图书馆抱有“奇货可居”的思想,共享意识不足。古籍馆藏量仅次于公共图书馆的高校图书馆,长期定位于服务本校师生,向全社会开放程度不够。同时,古籍数字化建设的版权保护体系尚未形成,削弱了图书机构数据库建设的主观动力。“我们做数字化工作,最担心的是出现盗印、非法牟利等现象”,广东省立中山图书馆工作人员告诉调研组。

  古籍活化系统性弱,资源配置待完善,“数字高阁”隐忧凸显。在古籍数字化建设目标上,多位受访专家表示,结构化、智能化开发古籍数据更为重要,但目前国内在这一层面“只见树木,未见森林”。从事古籍活化的主体数量较少、力量分散、单兵作战,在人力、财力和技术上面临制约。部分数字影像内容,将古籍元素作为噱头谋取利益,缺乏真正的文化传播意识,而与之形成对比的是,73%的受访者认为古籍数字化产品的宣传推广不充分。长此以往,古代典籍难免会被置于“数字高阁”。

  古籍活化内容单一,集中于文史题材,更多古代智慧亟待呈现。在活化产品层面,65%的受访者认为产品形式相对单一,57%的受访者认为内容活化程度不够。在活化对象上,当前的数字产品通常聚焦文学和历史题材内容,对于中医、数学、生物、天文等自然科学领域古籍呈现较少。不少经典文学巨著已得到不同建设单位反复深度开发,但辉煌灿烂的古代科技发展图景,尚未进行有效的数字化呈现。如何克服技术难关,活化更多题材中华典籍,是未来建设不可忽视的问题。

展望 我国古籍数字化工作高质量发展的策略建议

  加强统筹规划,推进行业主体协同建设,助力中华古籍高效数字化传播。当前全国尚有大量古籍未被数字化,应制定出台古籍数字化建设统一标准,在元数据规范、技术选型、平台功能等方面进行系统规划。加强各类图书馆、互联网企业、出版社等在古籍数字化建设中的联通渠道和共享机制,编制全国性古籍馆藏联合目录以及数字化古籍联合目录,打造一体化检索平台。完善古籍数字化建设版权保护,分析制定针对古籍整理、技术开发、活化设计等不同环节的版权认定与保护细则,规范行业与市场发展。

  完善顶层设计,布局数字人文战略方向,引领文化软实力建设国际前沿。社会各界应充分认识古籍活化在当代文化传承中的重要作用,大力推进人工智能、大数据、云计算、可视化等技术融入古籍工作。针对前沿技术创新需求,发挥高水平企业和科研院所技术研发优势,破解技术创新难题。将全局规划与重点支持相结合,打造一批高质量古籍类数字人文产品。积极引领世界数字人文发展前沿,加强对外合作交流,向世界宣传推介我国古籍数字化建设成果,增强我国文化软实力和中华文化国际影响力。

  坚守传承导向,丰富古籍活化产品层次,满足大众的文化精品阅听需求。68%的受访者愿意为古籍数字化产品付费,46%的受访者会出于体验新奇技术的目的使用古籍活化产品。应积极利用前沿数字科技和交互传播技术开发古籍活化产品,满足受众对传统文化体验和参与的多重需求。打造古籍产品IP,开发适配网络空间和现实世界多重场景的系列产品,在展览、文旅、科普、出版等事业方面积极应用。面向大视听时代,在短视频平台、播客平台和专业视听节目中嵌入古籍产品,搭载网络超链接汇聚古籍内容,引导大众关注古籍、传承文化。

  优化人才培养,打通专业教育与社会参与,造就数字化建设有生力量。2022年,教育部将数字人文专业列入普通高等学校本科专业目录,但目前仅有个别高校开设此专业,应推动有条件、有基础的高校积极布局、开展办学。同时,依托国家新文科和新工科建设战略,加强信息技术、新媒体技术、视觉设计等学科知识与古典文献学、汉语言文学等专业交叉融合。推进高校与企业协同,在产、学、研深度融合中培育人才。面向社会开办古籍数字化专项培训班,统筹建设在线课程,推广古籍整理与数字出版众包模式,激活社会力量参与古籍数字化建设与传播。

  开展成果转化,推动古籍数智产品进校园,以现代科技促进青少年文化传承。中小学校是古代文化历史教育重地,将古籍数智产品与学校教育相结合,能够以新鲜、趣味的方式提升育人效果。教育机构与出版机构、科技企业等统筹规划,建立面向不同学习阶段的古代文化教学资源库,推动古籍整理、智能开发、数字出版和校园应用一体化发展。举办灵活多样的古籍相关主题活动,培养青少年学习兴趣,以线上线下联通的方式推动青少年传承中华文明。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
100457
金币
1070388
道行
1951
原创
2152
奖券
2044
斑龄
27
道券
537
获奖
0
座驾
设备
摄影级
在线时间: 23865(小时)
注册时间: 2008-10-01
最后登录: 2024-11-13
只看该作者 沙发  发表于: 01-25
要激活中华典籍的“数字生命”,需要进行以下几个步骤:

1. 数字化:将中华典籍进行数字化处理,包括扫描、OCR(光学字符识别)等技术,将纸质书籍转化为数字文本。这一步是基础,也是最关键的一步,为后续的处理提供数据支持。

2. 语义化:对数字化后的文本进行语义分析,提取其中的关键信息,如实体、关系、事件等。这一步可以采用自然语言处理(NLP)技术,如命名实体识别(NER)、关系抽取(RE)、事件抽取(EE)等。

3. 结构化:将语义化后的信息进行结构化处理,构建知识图谱。知识图谱是一种结构化的知识表示方法,可以清晰地表示出实体之间的关系,方便后续的查询和推理。

4. 智能化:利用人工智能技术,如深度学习、机器学习等,对知识图谱进行进一步的优化和扩展。这一步可以实现对中华典籍的智能检索、问答等功能,提高用户体验。

5. 互动化:将中华典籍的数字生命与用户进行互动,实现用户参与和共创。这一步可以通过社区、游戏等方式,让用户参与到中华典籍的解读、创作中来,增强用户粘性。

6. 应用推广:将中华典籍的数字生命应用到各个领域,如教育、文化、旅游等,让更多的人了解和传承中华传统文化。

通过以上步骤,可以激活中华典籍的“数字生命”,让传统文化在数字时代焕发新的活力。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个