nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo journalinfonormal searchdiv searchzone qikanlogo popupnotification benqimuci xinwengonggao jingxuanzhuanti guokanliulan wangluoshoufa beiyinpaihang xiazaipaihang liulanpaihang caozuorukou wenbenneirong xiazaizhongxin lianjiezhongxin fangwenliangtongji papernavigation benqimucitupian wangluoshoufatupian beiyinpaihangtupian xiazaipaihangtupian liulanpaihangtupian xinwengonggaosimple xiazaizhongxinsimple lianjiezhongxinsimple jingxuanzhuantisimple
2026年02期
卷首语

以优质语料助力智能时代高质量发展

赖青;

<正>当前,智能革命席卷全球,构建智能生态的核心要素正加速成熟。在算力、算法与数据三驾马车的共同驱动下,大模型的底层能力持续增强,以智能体、模型上下文协议(MCP)、技能(Skills)和记忆(Memory)等为代表的新一代AIGC工程理念也不断涌现。我们正置身于一场前所未有的智能化转型浪潮,技术革新正在深刻改变多个产业的生产逻辑与商业范式。

2026 年 02 期 No.876 ;
[下载次数: 0 ] [被引频次: 0 ] [阅读次数: 4 ] HTML PDF 引用本文
专题策划 出版语料和数据资产

出版语料和数据资产

郭佳宁;

<正>当大模型训练对高质量语料的需求激增,面对数据要素市场化的机遇窗口,出版机构如何将版权资源转化为可计量、可交易的数据资产,已逐渐成为行业转型的必然思考。当前关于版权语料资产化的理论研究尚处于起步阶段,实践探索亦缺乏系统梳理。本刊组织本专题,旨在填补相关空白,为出版业提供实践参照与认知框架。专题中的三篇文章从不同维度对该命题进行了深入探讨:中国大百科全书出版社的案例揭示了通过知识图谱构建“知识基座”的技术路径,探索了权威知识结构化、多模态标注及“知识授权”商业模式;基于古籍文献的数据资产挂牌实践,则验证了“深加工提价值、先确权后入表”的路径,通过知识资源加工提升语料质量,依托数据交易所挂牌打通资源变资产的“最后一公里”;关于标准化体系的探讨,则是从基础设施层面审视了行业规范缺失的痛点,呼吁建立覆盖语料采集、加工、流通的全链条标准。

2026 年 02 期 No.876 ;
[下载次数: 0 ] [被引频次: 0 ] [阅读次数: 2 ] HTML PDF 引用本文

浅谈出版业人工智能语料加工标准工作

陈磊;

2025年7月,《出版业人工智能语料加工要求》行业标准获批立项,标志着我国出版业人工智能标准化建设迈入系统性推进阶段。该标准明确了合规性、多样性等四大原则,规范了采集、转写、标注等全流程要求,覆盖多类型出版物的多模态语料加工。其实施将从质量保障、意识形态安全、创新赋能三方面为行业赋能,同时为构建涵盖基础类、产品类、保障类、管理类的出版业人工智能标准体系奠定核心基础。通过强化顶层设计、聚焦痛点破题、协同联动推进等路径,该标准将与系列配套标准共同构筑行业安全与创新平衡的标准化体系屏障,引领出版业完成向数智化出版方向的跨越式发展。

2026 年 02 期 No.876 ;
[下载次数: 2 ] [被引频次: 0 ] [阅读次数: 4 ] HTML PDF 引用本文

AI时代中国大百科全书出版社的内容重构与价值再造

熊秀鑫;张新智;

生成式人工智能的迅猛发展,将高质量、结构化的语料库推向了国家战略资源的核心位置,同时也凸显了通用大语言模型在事实准确性与知识体系性方面的“幻觉”短板。文章分析了中国大百科全书出版社如何在AI时代重构内容,通过引入知识管理理论、版权语料理论,剖析了出版社在构建多模态知识图谱、探索“知识基座”授权模式等方面的具体方法,并深入探讨了百科全书知识在内容重构与价值再造过程中所面临的版权复杂性、知识保鲜与技术伦理等挑战,且提出了相应的对策。

2026 年 02 期 No.876 ;
[下载次数: 5 ] [被引频次: 0 ] [阅读次数: 4 ] HTML PDF 引用本文

版权语料向数据资产转化的路径探索——基于数据产品挂牌案例与古籍文献资源深加工实践

刘俊彦;

在“数据要素×”行动持续深化与人工智能大模型对高质量语料需求爆发的背景下,出版单位虽拥有海量古籍文献资源,但面临从“内容资源”向“数据资产”转型的困境。传统古籍文献数字化往往止步于内容资源数据加工,难以满足机器训练对结构化数据的需求;同时,在数据确权及交易合规方面缺乏成熟实践参考。本文基于省级出版集团下属技术企业的实践,探索版权语料向数据资产转化的路径:一方面借鉴“全国工业产品质量检验公告”数据产品在上海数据交易所完成合规评估、质量评估、数据产品登记及交易挂牌的全流程;另一方面基于在古籍文献语料加工中结合知识资源数据加工与多类型语料加工技术的实践,讨论将内容加工为高信噪比语料的价值提升路径。本文结合两项实践经验,探讨借鉴通用数据合规体系推动版权语料资产化的路径,提出“深加工提价值、先确权后入表”的资产化实施建议。

2026 年 02 期 No.876 ;
[下载次数: 1 ] [被引频次: 0 ] [阅读次数: 1 ] HTML PDF 引用本文
本期统计数据 more>>

最新动态

下载中心

友情链接

网站访问量

总访问量: 168,207
今日访问量: 420

引用

GB/T 7714-2015 格式引文
MLA格式引文
APA格式引文
检 索 高级检索