古籍扫描仪吧 关注:40贴子:1,615
  • 2回复贴,共1

数字技术让古籍“触手可及”(网上中国)

只看楼主收藏回复


从图书馆“搬”到网络平台点击浏览器,进入一个名为“识典古籍”的网站,记者看到《周易》《左传》《礼记》等典籍陈列在首页上。随机点开一本,左侧为章节目录,右侧为正文,排版形式既符合现代人的阅读习惯,又还原了古籍纸张的阅读美感。这是北京大学数字人文研究中心与字节跳动合作研发的一个数字古籍平台,自去年10月发布以来,已上线古籍1200余部,免费供公众浏览。与一些数字化平台仅提供古籍影像不同,点击该平台的功能按钮,还能实现简繁体转换、图文对照、全文检索、支持移动端等服务。北京大学人工智能研究院副研究员杨浩介绍,该平台应用了文字识别、自动标点等技术,不仅将影印本上的文字提取整理,还可以标记文本中的人名、地名等信息。“我们利用人工智能技术,将古籍由以前的图像加工成可检索的文本与数据,方便研究者、用户直接阅读。”随着数字技术不断成熟,科技赋能古籍工作取得可喜进展。国家图书馆公布的数据显示,全国已累计在线发布古籍数字资源13万部(件)。打开《永乐大典》高清影像数据库(第一辑),读者能浏览到国家图书馆馆藏的《永乐大典》40册、75卷的高清图像及相关知识;浙江大学打造的“智慧古籍平台”可在线查阅数万篇古籍,还有著者小传、人物行迹及社会网络关系图等延伸信息。这些古籍是怎样从图书馆库房“搬”到网络平台的?杨浩介绍,古籍数字化过程分为两步。首先将古籍进行扫描。古籍扫描使用专用非接触式扫描仪,通过高像素照相机,尽量不按压古籍页面进行拍照;采用的光源是防紫外线的LED灯冷光源,减少对古籍的损害。其次是对图像做数据化处理,利用人工智能技术对文字进行识别,对标点、实体等进行标引,方便读者阅读与检索。减少人工智能识别错误率也很重要。字节跳动公益古籍项目相关负责人说,具有中文、历史等专业知识并对古籍感兴趣的员工,自发成立2600人的志愿者团队,参与古籍校对工作。
来源:人民日报海外版


IP属地:北京1楼2023-12-27 08:50回复
    更多古籍得到利用


    IP属地:北京来自Android客户端2楼2023-12-27 08:55
    回复


      IP属地:北京来自Android客户端3楼2024-01-11 14:59
      回复