来源 | 中银证券
编辑 | 山巅 伊思
二十条确立产业基础框架,大数据局规范运营和监管体系
重磅政策出台,产业拐点将至。2019 年,党的十九届四中全会首次将数据列为生产要素,体现出了国家决心大力发展数字经济的态度,标志着数据从资源到要素的转变。2020 年 4 月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,明确将数据市场与土地市场、劳动力市场、资本市场、技术市场并列为加快培育的五大核心生产要素市场之一,数据要素步入市场化阶段。近期,“数据二十条”与国家数据局的获批成立标志着数据要素市场开始规范化发展阶段,政策推动下,数字要素顶层设计规划与配套政策完备,产业拐点有望到来。“数据二十条”确立数据要素基础框架。2022 年,国务院颁布“数据二十条”,提出二十条政策举措以建立“三权分置”的数据产权制度框架与多层次数据交易市场体系。“数据二十条”涉及四个制度,即数据产权、流通交易、收益分配和安全治理制度。数据产权建立数据资源持有权、数据加工使用权、数据产品经营权“三权分置”的结构;流通交易环节建立场内外结合的数据要素流通和交易制度;受益分配遵循“谁投入、谁贡献、谁受益”的原则,并在实行贡献值分配的基础上,在再分配环节关注公益和相对弱势群体利益;在安全治理环节,通过“以链治数”的监管模式实现数据要素的安全可信流通。国家数据局获批成立,产业迎来集约化管理。2023 年 3 月,《党和国家机构改革方案》印发,国家数据局正式获批成立。目前我国数据供给侧存在大量数据孤岛和数据垄断现象,即时通信、网络购物、网上外卖、网约车等领域覆盖用户规模达4.5 亿-10亿,大量数据没有实现共享、流通;国家数据局由发改委直接管理,能够打通部门之间、系统之间、区域之间的阻碍,实现数据要素的互联互通,解决过去数字经济中存在的多头管理的问题,并缩小由于地方数字经济发展不均带来的数字鸿沟,从而提高数据交换的效率和准确性,加快数据要素产业的发展。数据要素有望接力房地产成为 GDP 新支柱
从土地经济走向数字经济,数据产业链将成为拉动 GDP 的新引擎。2020 年 4 月 9 日,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,将数据定义为继土地、劳动力、资本、技术之后的第五大生产要素。土地经济时代,房地产作为支柱行业拉动 GDP 增长。进入数字经济时代,数据对于规模经济的效应进一步放大。当一项数字服务完成研发后,后期扩展用户规模的边际成本几乎可以忽略不计,相对于土地经济,由于数据可以无限进行复用,因而更容易享有规模经济效应的优势。AI 与数字经济双轮驱动
ChatGPT 引发产业革命,大模型解锁生产力。AI 的三大基石是算力、算法和数据。人工智能产业经历了 3 次浪潮,前两阶段由于商业化落地不及预期等原因导致泡沫破裂,而 ChatGPT 的出现表明人工智能产业已到达拐点。AI 的高速发展需要大模型的支持,大模型是指在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型,它能够将传统烟囱式的、碎片化的 AI 应用开发转向集中式开发,使一个模型可以支撑各类不同应用,有效缓解 AI 碎片化开发反复建模的困境。大模型的背后需要海量的数据支撑。中国信通院《人工智能白皮书(2022 年)》显示,当前预训练模型参数数量、训练数据规模按照 300 倍/年的趋势增长,增大模型和增加训练数据是未来演进方向。海量数据需求的提升将带动数据要素产业高速发展。数据要素是数字经济的核心引擎,是实现数字产业化和产业数字化的关键。一方面,通过海量数据要素能够打造出数字产品制造业、服务业、应用业等新经济增长点,另一方面,数据要素与其他生产要素的结合能够提升其他生产要素的匹配效率、推动产业数字化水平提升。政务数据入场交易,市场规模有望实现 4 倍增长
数据要素市场规模2021年超800亿,未来有望继续保持高速增长态势。根据国家工信安全中心的测算, 2021 年数据要素相关产业市场规模达 815 亿元。未来随着数字经济整体规模的快速增长,数据要素市场有望继续保持高增长态势,预计 2025 年市场规模有望接近 2000 亿元,4 年 CAGR 达 25%。3000 亿市场有望释放。由于在数据要素发展初期,政务数据无法向企业数据一样直接在市场上进行交易流通,因此过去对于数据要素市场规模的估测基本只覆盖企业侧数据。线性递推,对应政务市场规模为 3000 亿元以上。横向对比,根据北大国发院教授、北大数字金融研究中心副主任沈艳与北京大学国家发展研究院长聘副教授张俊妮发布的《数据流通的挑战与应对》,对标美国等地,中国数据产量排名世界第二,而数据要素市场规模仅为美国的 3%,按照数据量与数据要素市场规模呈线性相关的假设,以美国水平参照,我国潜在数据市场空间约为 6000 亿元,侧面印证了我们的估测。政务数据有望先行落地。从各省市公共数据开放相关政策情况来看,目前各级政府正大力推动公共数据在公共数据开放平台和数据交易所流通。我们认为政务数据由于具有高重要性与高价值量的特点,在数据要素流通的背景下,有望率先实现落地,并形成政务数据先“入场”,企业侧数据“跟随交易”的模式。在后续篇幅中,我们所研究的数据主体主要为政务及公共数据。数据要素产业链梳理:重点关注存储、分析及交易环节
数据要素产业链长,核心是资源化与价值化
数据资源化是数据产生价值的基础。数据资源化环节首先要对个人、企业、政府的数据采集,并在此基础上进行数据整理与聚合,并对数据进行分析,使数据要素转变为可使用资源。数据价值化使数据实现交易流通。数据价值化主要涉及登记、确权、定价等流程。处理后的数 据资源首先需要通过确权来提供规章性的保护,随后在数据交易平台市场通过供需关系确定价格并实现流通,在此过程中,第三方数据服务商为客户提供相应数据资源的应用服务,从而完成数 据价值变现。
数据采集:行业集中度较高,平台型厂商优势突出
数据供给仍保持高速增长。根据 IDC 发布的《数据时代 2025》,2025 年全球每年产生的数据将从 2018 年的 33ZB 增长到 175ZB;中国网络空间研究院、中国信息通信研究院发布的《国家数据资源 调查报告 2021》显示我国 2021 年数据产量达 6.6ZB(+27.9%),仅次于美国 16ZB,占全球数据总产量 9.9%。未来数据产量的高速增长将进一步带动数据采集行业发展。市场集中度高,平台厂商形成垄断优势。根据拓尔思发布的《拓尔思数据要素白皮书》,2021 年数 据采集市场 CR4 近 80%,百度、阿里、京东等大厂具备大型数据平台,在基础设施、数字技术、用户群等方面具备较强优势,能够积累大量数据,并且在采集过程中平台厂商的边际成本远低于中小 厂商,导致采集市场形成垄断局面。数据存储:增量市场高速发展,关注实现核心系统替换的厂商
海量数据的存储环节主要涉及传统关系型数据库以及新兴的非关系型数据库。在数据库专题报告:国产化替代加速推进,数据库布局正逢其时中,我们提到关系型数据库主要对应国产替代市场,非关系型数据库主要对应数据库增量市场。根据 IDC 预测,2025 年我国数据库整体市场规模有望突破 500 亿元。数据库增量市场高速发展。目前借助 NewSQL、NoSQL 等新技术架构的非关系型数据库市场规模占整体的 10%左右,根据艾瑞咨询预测,到 2025 年非关系型数据库有望实现 5 年十倍以上的扩张。在 该市场云厂商占据较大优势。存量市场国产化加速推进,关注具备核心系统替换的厂商。党政时期替换由于信创名录的强制性, 进入名录的厂商如人大金仓、达梦等深度受益。而进入行业信创时代,以金融为代表的行业对于数 据库的实时性、并发性有着较高要求,且不存在党政领域的强制性名录,因而具备较高技术水平的 厂商如星环科技等有望脱颖而出。数据加工:AI 技术有望加速中小厂商出清
市场竞争激烈,集中度不足 10%。数据加工包含数据清洗、数据处理、数据标注、数据训练、数据审核等。根据拓尔思的数据要素白皮书,根据艾瑞咨询的测算,2019 年 AI 基础服务行业 CR5 为 26.2%, 行业集中度低,竞争较为激烈。语音和视觉业务代表企业包括海天瑞声和百度数据众包。AI 技术正逐渐介入,市场集中度有望提升。以数据标注为例,AI 自动预标注的利用大幅提升了标注效率,同时节约人力成本。借助人工智能技术替代人力进行数据加工是未来发展方向,因此数据加工厂商需投入大量人力资本进行技术研究。中小型厂商综合实力较弱,未来具备先发优势的品牌 服务商市场份额有望进一步提升。数据分析:高基数高成长市场,关注细分领域龙头
数据分析在整个数据要素产业链中占比较大,且保持高速发展态势。根据国家工业信息安全发展研 究中心的相关数据测算,2021 年数据分析市场规模占整体的 21.5%。2019-2021 数据分析市场规模 CAGR 达 22%,未来 3 年市场规模呈加速上升态势。一方面数据量的增长将会从供给端带动数据分 析市场;另一方面数据分析正逐步深入客户业务系统,由辅助经营决策逐步转为预测性决策,下游 需求进而提升。细分行业龙头优势突出,工业、电力领域有望快速发展。数据分析与下游紧密绑定,厂商需具备丰 富的相关行业知识和长时间积淀,短时间后发者难以破局。金融领域领先厂商包括恒生电子、同花 顺等;政府领域包括中科江南、拓尔思等。目前金融、政府、电信等行业市场占比较高,而数字化发展程度相对较弱的工业、电力等行业占比较低。未来随着工业、电力等行业信息化建设的加速, 相应数据分析市场有望快速发展。数据确权:主要业务为进行区块链建设,市场尚未爆发
区块链技术为数据交易提供保障。传统数据权利确认的方式是向数据确权登记点或数据交易所等第三方机构提交权属证明,但这类方式存在权利篡改、标准不一以及缺乏技术可信度等问题。区块链技术具备时间序列、不可篡改等技术特性,在每个数据元素的生命周期内对其归属、操作及使用等行为进行完整记录,适用于数据确权场景,区块链技术为后续交易环节在技术可信度层面提供保障。上市公司主要进行区块链建设,市场规模较小。2019 年人民网旗下人民数据管理,以人民链为基座, 在 2019 年推出我国首个数据确权平台“人民数据资产服务平台”,2023 年 3 月 24 日人民链 Baas 服务平台 (2.0 版本)上线,拥有数字存证、知识产权保护、数字产品、数字确权等众多应用场景。此外,中科金财、安妮股份、中文在线等多家公司在投资者互动平台表示已将区块链技术运用到数据确权场景。单数据确权市场规模相对较小。根据中国信通院和中国政府采购网数据,确权服务相关项目招标金额在百万元级别,而区块链信息服务前十批备案中仅 7%的应用为数字资产、版权保护与交易方面。数据定价:国内数据交易所多采用动态和混合定价策略
在数据定价环节,厂商能够参与场景较少,因此在该部分,我们主要对数据定价的模式进行研究。根据中国信通院的《数据价值化与数据要素市场发展报告(2021)》,数据价格涵盖补偿价值、增值价值、异质性价值以及风险溢价。补偿价值即为成本,增值价值主要指数据的市场价值和社会价值,异质性价值主要指由于数据结构异质、搜集主体各不相同、价值高度依赖使用场景等因素带来的和数据交易市场分割产生的价值。数据定价策略主要分为静态定价策略、动态定价策略以及两者混合的定价策略。静态定价策略主要以固定定价和差别定价为主,前者对数据根据大小设定一个固定价格;后者根据反应成本费用的不同比例差异化定价,如对小规模数据免费,大规模数据收取高昂费用。动态定价策略包括自动计价、协商定价、拍卖式定价,其中自动计价是买卖双方报价在交易系统自动撮合;协商定价是双方通过协商对数据价值达成一致;拍卖式定价适用于一个卖方和多个买方,在低价基础上买方竞拍。混合 策略则是根据具体情况进行选择,或对数据拆分采用不同策略。目前国内外在不完全市场下的数据定价策略不同,国外如 Data plaza、Factual 等数据交易平台多采用静态定价策略,国内数据交易所多采用动态和混合定价策略。数据交易:重点关注具备国资背景、全产业链覆盖厂商
市场规模与场内交易占比有望大幅提升。根据中国信通院和观研报告发布的《数据要素流通视角下 数据安全保障研究报告》和《中国数据交易行业发展现状研究与投资前景预测报告(2023-2030 年)》, 2021 年我国数据交易规模超 500 亿元,但数据交易所/中心为主导的场内交易占比仅为 2%,而 2025 年整体数据交易市场规模有望超 2200 亿元,未来随着数交所数据流通方式多样、公共数据激活、数据孤岛等问题得到解决,届时场内交易比重有望占总体交易的 1/3,对应数据交易所/中心市场规模可达 700 余亿元。目前数交所交易规模呈高速增长态势,广州数据交易所、深圳数据交易所 2022 年所累计交易额超过 17 亿元,2023 年预计破 50 亿元。场内数据交易所以公共价值为导向,重点关注具备国资背景和全环节覆盖的参股公司。数据交易所建设环节,上市公司除了为数交所进行区块链建设外,大多数通过参股各大数据所来参与到数据交易环节。目前数据交易所多为政府推动甚至主导建立,其数据交易所以公共价值为导向,国有资本控股或 100%持股成为重要趋势。同时“数据二十条”提出数据收益二次分配、三次分配阶段重点要关注公共利益和相对弱势群体,交易所佣金呈现下降趋势,因此上市公司在该环节多是以股权为纽带切入数据要素交易市场。在该背景下,参股公司一方面在数据“一级市场”发力,强化供给侧能力;另一方面在后续流通运营环节大数据以技术服务商的身份,参与公共数据运营服务。因此应当重点关注具备国资背景,且实现从数据供给到数据交易业务全产业链覆盖的参股公司。重点关注存储、分析和交易环节
在本小节,我们主要对数据要素各细分产业链进行综合分析和横向比较,从市场规模、增速以及竞争格局角度,我们认为数据存储、分析及交易环节值得重点关注。存储、分析、交易环节规模占比较大。数据要素产业链主要包括采集、存储、加工、分析、确权、 定价以及交易环节。其中存储、加工、交易、分析环节市场相对成熟,2021 年市场规模超百亿。确权与定价主要涉及相关区块链的建设,目前市场规模较小。存储与分析市场格局较为明朗。数据采集作为数据要素市场中发展较为成熟的环节,市场集中度较 高,优势主要集中在平台型厂商。数据存储国产化进程加快,数据库领域应重点关注具备核心业务 系统替换经验的厂商;数据加工市场集中度较低,竞争激烈,未来随着 AI 技术更多地运用到加工业务中,中小企业有望加速出清;数据分析与下游行业联系紧密,目前金融、政府、电信等市场占比较高,未来工业和电力领域有望加速发展;确权、定价以及交易环节为市场发展初期,其中在确权和交易环节,厂商较难参与到其中,而在交易环节上市公司主要通过参股数据所和提供数据服务来切入数据交易领域。报告出品方/作者:中银证券,杨思睿、刘桐彤
推荐阅读
国家发展改革委价格监测中心王建冬:明确数据要素市场一、二级体系,建立适配规律的定价机制
数据能确权了?国知局局长:深圳已发36份数据知产登记证书
江小涓重磅演讲:数字时代的经济学(全文)
梅宏院士对“数据20条”和数字经济的主要见解
广东携手港澳打造“数字湾区”,加快大湾区全面数字化发展
征求意见 | 广东数据流通交易管理办法(试行)发布
杜平:数据资产入表是企业数字化转型后最具潜力利好
创新实践数据资产化 | 获得了1000万元授信额度并成功放款
国家互联网信息办公室关于发布深度合成服务算法备案信息的公告
做大做强数据要素型企业
推进数字基础设施建设加快数字经济发展
加快构建中国数据知识产权保护规则体系