字节和北大合作研发识典古籍官网 现已上线685部古籍

2023-02-24 14:19:56
分享

2月24日消息,在字节跳动与北京大学的合作之下,识典古籍官网现已上线了685部古籍,包括双方参与设计与研发的《永乐大典》高清影像数据库,用户可以登录官网或者在今日头条古籍频道查看已上线古籍。据了解,古籍数字化业务的研发复杂度很高,例如古籍的格式里,大字是正文,小字是注解,单独一列的大字是标题。为了把这些复杂的结构区分开,字节方面定义了一套古籍的元数据协议。字节团队将一页一页的古籍变成了结构化的数据,可以满足行业通用的 TEI(Text Encoding Initiative)元数据标准,能区分章节、标题、内文,方便搜索、翻看,而且还能进一步编辑整理。借助飞书文档提供的SDK,字节已经为合作方北大的专家学者们提供了古籍整理平台,便于精校现有古籍、增加新的书目。

更加详细情况,请关注本站最新动态。
    Baidu
    map