| 17 | 0 | 4 |
| 下载次数 | 被引频次 | 阅读次数 |
在“数据要素×”行动持续深化与人工智能大模型对高质量语料需求爆发的背景下,出版单位虽拥有海量古籍文献资源,但面临从“内容资源”向“数据资产”转型的困境。传统古籍文献数字化往往止步于内容资源数据加工,难以满足机器训练对结构化数据的需求;同时,在数据确权及交易合规方面缺乏成熟实践参考。本文基于省级出版集团下属技术企业的实践,探索版权语料向数据资产转化的路径:一方面借鉴“全国工业产品质量检验公告”数据产品在上海数据交易所完成合规评估、质量评估、数据产品登记及交易挂牌的全流程;另一方面基于在古籍文献语料加工中结合知识资源数据加工与多类型语料加工技术的实践,讨论将内容加工为高信噪比语料的价值提升路径。本文结合两项实践经验,探讨借鉴通用数据合规体系推动版权语料资产化的路径,提出“深加工提价值、先确权后入表”的资产化实施建议。
Abstract:[1]李美霖,蒲添.数据资产化:不是选择题而是必答题[N].中国新闻出版广电报,2025-03-31(5).
[2]李剑平.浙大让历史人物故事从古籍文献中“活起来”[EB/OL].(2025-05-15)[2026-01-15].https://s.cyol.com/articles/2025-05/15/content_ybVoQmtR.html.
[3]上海数据交易所.上海数据交易所数据产品登记规范(试行)[EB/OL].(2024-04-19)[2026-01-15].https://www.chinadep.com/bulletin/rules/CTC_20240419093123808940.
基本信息:
中图分类号:G230.7;G255.1
引用信息:
[1]刘俊彦.版权语料向数据资产转化的路径探索——基于数据产品挂牌案例与古籍文献资源深加工实践[J].出版参考,2026,No.876(02):12-15.
2026-02-20
2026-02-20