鲁政委丨我国数据财政:潜在规模估计

时间: 2023-11-30 12:07:33 |   作者: 雷电竞入口

  早在2015年8月31日,国务院发布《促进大数据发展行动纲要》(国发〔2015〕50号,以下简称“《纲要》”),提出引导培育大数据交易市场,开展面向应用的数据交易市场试点。此后,中央、国务院、发改委等多次发文引导数据要素市场发展。2022年12月,中央 国务院发布《关于构建数据基础制度更好地发挥数据要素作用的意见》(以下简称“《数据二十条》”),确定数据要素市场发展原则,指明数据要素市场的发展趋势。2023年3月,中央、国务院印发了《党和国家机构改革方案》,明确将组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字化的经济、数字社会规划和建设等。国家数据局的成立意味着数据市场发展将从此前的原则性引导文件过渡到具体实施落地,中国数据要素市场走上快车道。

  从数据要素由资源走向资产的过程来看,数据要素市场发展可大致分为三个阶段,依次为数据资源化、数据资产化、数据资本化(普华永道,2022;信通院,2023)。数据资源化是指使无序、混乱的原始数据成为有序、有实用价值的数据资源的过程。数据资产化是以数据资源为起点,为既定应用场景及商业目的来加工、开发,形成可供企业应用或交易的数据产品。数据资本化是在数据资源化和资产化的基础上,赋予数据资产具有更多金融属性,例如可以将其作为抵押品进行信贷融资等金融活动的过程。目前,我国正处于数据从资源走向资产的阶段,在此阶段我国的数据要素市场发展具有如下特征:

  一是数据已能带来显著的经济收益。根据国家工业信息安全发展研究中心与北京大学光华管理学院在2022年11月发布的《中国数据要素市场发展报告(2021-2022)》测算,数据要素使得工业公司业务增长平均增加41.18%,生产效率平均提高42.8%,产品研制周期平均缩短15.33%,能源利用率平均提高10.19%。

  二是数据要素交易市场雏形已现。依照我们2023年4月发布的《全国数据交易平台梳理与商业银行业务机会分析》[1]报告梳理,截至2023年2月,据不完全信息统计,全国共有数据交易平台40家,涉及全国30多个省、市或者地区,根据各数据交易所对于自身的目标和定位,已初步形成国际数据交易枢纽、国家级数据交易所、区域级数据交易中心与行业级数据交易平台的分层架构。

  三是数据资产入表工作逐步展开。2022年 12月9日,财政部发布《企业数据资源相关会计处理暂行规定(征求意见稿)》,探索对现阶段数据资源入表会计处理适配相应的企业会计准则。同时,按照会计上经济利益的实现方式,进一步将企业数据资产细分为“企业内部使用的数据资源”和“企业对外交易的数据资源”两类。近年来,某股份制银行[2]、贵阳大数据交易所[3]等也在尝试通过数据估值以推动数据资产入表工作。

  根据我们此前的研究[4],数据作为一类重要的生产要素,其资产属性已得到了各方的确认。参照《企业会计准则》中的定义,资产是指由企业过去的交易或事项形成的、由企业拥有或者控制的、预期会给公司能够带来经济利益的资源。目前,我国境内对于数据资产尚无官方、统一的定义。从境外经验来看,美国国家标准与技术研究院(National Institute of Standards and Technology,NIST)将数据资产定义为任何由数据组成的实体(Any entity that is comprised of data),包括系统、应用程序、数据库、文档、网页、以及基于应用程序的数据服务[5]。

  数据资产化的典型特征是,数据不但可以在数据产生主体内产生价值,更可以在数据流通后通过更多主体被多次使用,从而充分的发挥其资产价值。因此,数据的有序流通是提升数据资产化能级的重要枢纽。而从数据流通、使用的角度来看,目前数据资产化面临诸多挑战:

  第一,数据制度的顶层设计尚不完善,存在数据产权不清晰、数据的分类分级制度不完善等情况,是数据资产化之路面临的最大挑战。2022年12月2日,中央、国务院发布《数据二十条》,指出数据相关的合法权利包括数据资源持有权、数据加工使用权、数据产品经营权。虽然《数据二十条》尚未给出数据产权确定与权属分割的详细规则,但鼓励优先推动数据资产在经济生产中探索深度、广泛的使用。

  第二,数据流转确权、数据应用与数据安全技术仍需逐步提升,从而能通过成熟且丰富的技术,保障数据相关制度的建设与实施。数据确权技术的不足阻碍了数据流转中各类权利主体相关利益的保障,数据应用技术的不足则不利于数据价值的充分释放,数据安全技术的不足增加了数据流转的风险和障碍,降低了数据主体提供数据的意愿。

  第三,亦是本文重点探讨的问题,即数据价值怎么样确定。资产与资源最大的不同之处在于资产可以给公司能够带来经济利益。而如何度量数据所带来的经济利益,即数据资产估值,以及如何在交易流转过程中达成合意的成交价格(即促进双方对数据的估值达成一致),是数据如何进一步对外赋能要解决的关键课题。应当指出的是,公允市价(Fair Value)是指市场参与者在计量日发生的有序交易中,出售一项资产所能收到或者转移一项负债所需支付的价格,下文中对数据资产的估值指评估其公允价值。

  数据相关制度需要国家监管部门等通过立法、发布规范性文件等给与明确;数据有关技术的发展也需要一些时间;而数据资产价值难确定导致数据价格难形成的问题,将直接影造成数据流通交易的堵点。

  一方面,数据价值难以直接度量。第一,从数据本身来看,无法直接确定数据价值。无论是数据的维度、体量大小都无法直接决定数据在数据分析中的贡献,数据条数在衡量客户级别的数据时具备一定直接的作用,但不能决定数据质量的高低。例如,非对称数据集数据分布不均匀,则该类数据在数据分析中的价值较低。此外,稀疏数据等问题也会导致数据体量大、条数多,但实际应用价值并不高。第二,从数据使用的角度来看,统计学框架中缺少对数据定量比较的方法。在经典的统计学框架中,模型评价体系较为完善,有众多模型评价指标。相较而言,由于缺少数据质量的评价指标,已有的部分指标无法起到度量数据质量的作用,如方差膨胀因子(Variance Inflation Factor, VIF)仅针对多重共线性这一特定数据问题;费雪信息矩阵中虽然包含着数据可用于参数估计的信息量,但其仅针对特定参数的估计,且无法衡量整个数据的价值;深度学习、强化学习框架会使用数据增强[6]等方法以增加数据量,进而提升模型表现,更是缺少数据评价指标。第三,数据资产价值到货币之间的映射缺少参考系。即使我们拥有数据价值的度量指标,但如何映射到以货币计量仍然缺乏参考系的支撑,即数据价值的量纲与货币量纲间缺少连接点。

  另一方面,通过各类估值技术对数据资产进行间接估值时,难以在各方之间形成共识。第一,从数据供需来看,目前国内数据交易大部分以双边的“点对点”撮合为主,对于数据提供方来说,基于其自身数据资产入表的出发点,或将有高估数据资产价值的倾向。而对于数据使用方来说,数据的价值体现在对其业务能力的提升等方面,且采购数据前数据对业务的提升效果具有较强不确定性,因此其有低估数据资产价值的倾向。第二,从数据使用的行业来看,由于不一样的行业需求和使用方法的差异,对于同一数据所认定的附加价值也将存在不同。例如,个人客户的消费数据在互联网行业、金融行业中具有较高的应用价值,而在传统的制造业则应用价值有限。第三,从数据资产生成的行业来看,数据资产生成的成本不同。以电子商务行业为代表,其通过业务经营活动就可以获得大量的用户数据,成本较低;而地质勘探、政务数据等在收集与整理的过程中均需付出较大成本。此外,成本法等经典的估值方法在数据资产估值时也面临一定的局限性。

  2022年 12月9日,财政部发布《企业数据资源相关会计处理暂行规定(征求意见稿)》(以下简称“《暂行规定》”),其适合使用的范围包括企业按照企业会计准则相关规定确认为非货币性资产或存货等资产类别的数据资源,以及企业合法拥有或控制的、预期会给公司能够带来经济利益的、但由于不满足企业会计准则相关资产确认条件而未确认为资产的数据资源的相关会计处理。《暂行规定》明确现阶段数据资源会计处理应当按照企业会计准则执行,并按照会计上经济利益实现方式,进一步细分为“企业内部使用的数据资源”和“企业对外交易的数据资源”两类。

  企业内部使用的数据资源需要按照《企业会计准则第6号——非货币性资产》(财会〔2006〕3 号,以下简称“《非货币性资产准则》”)确认为非货币性资产,按照获取方式能分为企业自行开发的无形资产、外购取得的无形资产、其他方式取得的无形资产,包括非货币性资产交换、债务重组、政府补助和企业合并取得的无形资产等。《无形资产准则》[7]中定义无形资产指企业拥有或者控制的没有实物形态的可辨认非货币性资产。确认无形资产首先需要满足“可辨认性标准”[8],并且判定“与该无形资产有关的经济利益很可能流入企业”与“该无形资产的成本能够可靠地计量”。

  企业对外交易的数据资源则需要按照《企业会计准则第 1 号——存货》(财会〔2006〕3 号,以下简称“《存货准则》”)确认为存货,按照获取方式可大致分为企业自行加工存货、外购存货以及其他方式取得的存货。《存货准则》[9]中定义存货是指企业在日常活动中持有以备出售的产成品或商品、处在生产过程中的在产品、在生产过程或提供劳务过程中耗用的材料和物料等。确认存货需要判定“与该存货有关的经济利益很可能流入企业”与“该存货的成本能够可靠地计量”。

  应当指出的是,《暂行规定》明确了数据资产适用的会计准则,但是对数据资产的会计处理只是数据资产估值的众多应用场景之一。除在资产入表过程中必需的会计处理外,评估数据资产的公允价值将对数据有效畅通的流转和使用有着更重要的意义,是建立公开活跃交易市场的必要条件。因此,下文将重点关注数据资产各类估值方法在数据资产价值确认过程中应用具体情况。

  《企业会计准则第39号——公允价值计量(2014)》(以下简称“《第39号准则》”)中指出企业以公允价值计量相关资产或负债,使用的估值技术主要包括市场法、收益法和成本法。企业应当使用与其中一种或多种估值技术相一致的方法计量公允价值[10]。中国资产评估协会(2020)指出数据资产价值的评估方法包括成本法、收益法和市场法三种基本方法及其衍生方法。我们将详细分析三种基本方法在数据资产估值上的优劣势以及实际应用情况,并且在基本方法的基础上提出数据资产估值技术法的发展方向。

  根据《第39号准则》的定义,成本法是反映当前要求重置相关资产服务能力所需金额(通常指现行重置成本)的估值技术。而中国资产评估协会(2020)则定义成本法是根据形成数据资产的成本进行评估。基于成本法的数据资产估值分为三个步骤:第一,根据数据资产形成的全部投入,分析数据资产价值与成本的相关程度,考虑成本法的适用性。第二,确定数据资产的重置成本,数据资产的重置成本包括合理的成本、利润和相关税费。第三,合理确定贬值,数据资产贬值主要包括功能性贬值和经济性贬值。成本法的基本计算公式可以写成如下形式:

  具体到数据资产,企业自行开发与外购两种形式下所对应的成本确定难度差异较大。《暂行规定》明确企业通过外购方式取得确认为非货币性资产或者存货的数据资源,其成本包括购买价款、相关税费,以及其他有关支出等。而对于企业内部自行开发或加工的数据资源来说,其产生往往伴随企业内部的生产经营活动,数据资源作为衍生资产没有对应的直接成本,间接成本的分摊不易估计(欧阳日辉和杜青青,2022)。中国资产评估协会(2020)指出,企业内部加工产生的数据资产在获取阶段的成本较小,可以只考虑数据存储等成本,在数据研发阶段的成本较大,需要考虑设备折旧、研发人员工资等成本。重置成本是被评估资产当前时点的成本,其和原始成本在资产取得当时是一致的,而后随着市场的变动出现变动。

  成本法在数据资产估值上具有明显的优势与缺点。成本法的优势如下:一是简单,适合作为数据要素市场发展初期的估值方法。二是在推动企业数据资产入表上具有速度快、争议少的特点。但成本法也有其缺点:一是成本法适用于计提折旧和摊销的资产,而数据资产具有价值多变性,其价值可能随着挖掘不断提升,且数据使用的边际成本极低,成本主要集中在前期的固定成本上,导致了使用成本法可能低估数据价值,且其估值与真实价值的差距会随着时间逐步扩大(张俊瑞等,2023)。二是在缺乏市场参考的情况下,数据资产的重置成本与贬值难以精确计量(欧阳日辉和杜青青,2022)。

  成本法在数据资产估值上已有实际应用。在发改委价格监测中心的指导下,贵阳大数据交易所联合普华永道咨询公司、云上贵州大数据产业发展有限公司等通过成本法建立估值模型,以数据产品开发成本为基础,综合考量数据成本、数据质量、隐私含量等多重价值修正因子对于数据产品价格的影响,并基于预计的商业模式和市场规模,对数据产品进行估值[11]。

  根据《第39号准则》定义,市场法是利用相同或类似的资产、负债或资产和负债组合的价格以及其他相关市场交易信息进行估值的技术。中国资产评估协会(2020)则定义市场法是根据相同或者相似的数据资产的近期或者往期成交价格,通过对比分析其差异,评估数据资产价值的方法。基于市场的数据资产估值分为三个步骤:第一,充分了解被评估数据资产的情况,搜集充分的可比数据资产交易案例相关信息,包括价格、时间等信息。第二,对比分析并量化被评估资产与已成交资产在多个维度上的差异。第三,合理确定修正系数。市场法具体的基本计算公式可以写成如下形式:

  其中, n指可比数据资产的总数。技术数修正系数主要考虑因技术因素带来的数据资产价值差异;价值密度修正系数主要考虑有效数据占总体数据比例不同带来的数据资产价值差异;期日修正系数主要考虑可比数据交易案例交易日期的不同带来的数据资产价值差异;容量修正系数主要考虑不同数据容量带来的数据资产价值差异(中国资产评估协会,2020)。值得注意的是,在实际应用中,修正系数的维度选择可能有所差异,上述的四类修正系数仅作参考。

  相较于成本法,市场法可以更加客观、真实地反映数据资产的价值,更易于被市场接受。但在资产估值中使用市场法进行数据资产评估的前提条件是具有公开且活跃的数据交易市场,这一条件目前尚不具备。一方面,需要做到“有的比”。数据资产的分类维度较多,包括但不限于所属行业、用途、地域、时间、群体等,需要大量的数据资产交易,以保证在面对属于单一分类的被评估资产时仍有足够的可比资产进行比较。另一方面,需要做到“比得了”。数据资产的定量特征提取高度依赖信息披露,如前述提到的密度数修正系数需要通过有效数据量计算获得,而目前的数据资产信息披露仍不足以支持市场法的应用。《暂行规定》要求企业应当按照相关企业会计准则及《暂行规定》等,在会计报表附注中对数据资源相关会计信息进行披露。随着数据市场的不断规范,形成公开且活跃的数据交易市场,市场法的广泛应用或将具备先决条件。

  目前尚无基于市场法的数据资产估值实际应用,但学术界基于市场法提出衍生的数据资产估值方法。例如,李永红和张淑雯(2018)通过层次分析法计算出数据资产价值影响因素的权重;其运用灰色关联分析法,量化数据资产价值影响因素,计算数据资产之间的关联系数;最后,在市场法的基础上,利用关联度确定可比数据资产的权重,构建数据资产价值评估模型。张俊瑞等(2023)同样以市场法为基础建立了层次分析数据资产估值法。通过建立层次分析法的层次结构,根据数据资产所处行业、数据资产种类、数据资产用途三因素确认市场可比资产,得出市场可比数据资产和被估计数据资产的价值差异系数后,通过标准化计算被评估数据资产的最终价值。

  根据《第39号准则》定义,收益法是将未来金额转换成单一现值的估值技术。中国资产评估协会(2020)则定义收益法是通过预计数据资产带来的收益估计其价值。基于成本法的数据资产估值分为三个步骤:第一,估算数据资产可能带来的预期收益,指企业使用数据资产带来的收益,而非出售数据资产带来的收益,且仅限于数据资产带来的额外附加收益。第二,确定数据资产的收益期限,不应超过该数据资产合理的收益期。第三,确定合理的折现率,通常考虑到利率、投资回报率等综合确定。收益法具体的基本计算公式可以写成如下形式:

  相较于成本法和市场法,收益法从数据资产的应用角度出发,通过评估其预计收益,在凸显数据的内在价值上具有优势(欧阳日辉和龚伟,2022)。但收益法的应用前提是对数据资产未来的收益进行可靠计量,而从目前来看,这一前提条件较难以实现。一是目前数据交易市场处于卖方开发阶段,缺少买方使用带来的经济效益评估的实际应用,导致计量数据资产的收益缺少市场参考(普华永道,2022)。二是数据资产的附加收益较难测度,数据要素通常需依托于其他生产要素以作用于生产,将数据资产的附加收益单独剥离出来具有较大难度(欧阳日辉和杜青青,2022)。

  与市场法类似,目前尚无基于收益法的数据资产估值实际应用。Mark(2002)认为收益法为数据资产估值的最佳方法,但由于实现难度较大,学术界较少关于收益法在数据资产估值上的探索。

  成本法、市场法、收益法均是从外到内间接估计数据资产的价值,囿于我国的数据要素市场仍处于发展的初级阶段,导致传统的估值方法并不完全适用于目前的数据资产。而数据估值技术法则是从内到外直接估计数据资产的价值,先通过统计模型确定数据资产间的定量比较,再通过确定参考系将数据资产的不同定量分析结果映射到不同的评估价值。相较于成本法,估值技术法能够更充分的反映数据真实价值,避免低估数据资产价值的情况。而相较于市场法与收益法,估值技术法应用的先决条件更为宽泛,不需要公开且活跃的数据交易市场、未来收益进行可靠计量等苛刻的外部条件。值得注意的是,估值技术法并非完全脱离经典的估值方法,大部分情况仍需借鉴成本法、市场法、收益法的分析框架与分析逻辑。

  按照前文分析,虽然直接估计数据资产价值面临诸多挑战,但仍有部分学者尝试利用估值技术法对数据资产估值。Heckman等(2015),通过构建不同维度影响数据价值的指标,基于线性回归模型构建估值模型。张驰(2018)的思路与Heckman等(2015)类似,给出基于特征维度的数据资产价值分析方法,从数据颗粒度、活性度等五个维度进行数据资产内在价值的评估,其中包括数据数量、数据频率、数据关联性等的度量,利用深度学习的方法进行训练确定不同维度间的权重,以计算数据资产价值。该方法的缺点是需要事先获得大量数据资产的价值数据以训练模型,该文献中的样本数据来源于广州港集团5家散杂货作业公司的数据。Li等(2017)提出了一种基于数据信息熵的定价指标,通过基于信息熵的数据信息度量方法与基于数据信息度量结果的定价函数完成数据资产估值,文献中给出了三个具体的定价函数。Yu和Zhang(2017)从规划问题的角度出发,基于双层规划模型(Bi-Level Programing Model),同时建模分析数据提供方与数据购买方在数据资产交易中的最优决策,以确定数据资产交易价格,完成估值。

  数据资产估值技术法的成熟应用仍然需要经过较长的历程,而鉴于数据资产与传统资产的典型不同特征,如数据资产具备的非实体性、依托性、多样性、可加工型、价值异变性等,传统的估值方法在评估数据资产价值时存在一定的问题,估值技术法或将显著弥补这一不足。

  根据上文中对于不同估值方法运用于数据资产的优缺点和可行性分析,在成熟的数据市场中,不同的估值方法对于不同流动性、市场情况的数据资产均存在其适合的应用场景。

  第一,对于流动性较差,且难以采用估值计数法估值的数据资产,可以适用成本法进行估值。即使在未来数据交易市场更为活跃的情况下,可也可能存在部分部分流动性相对较差,且与其他数据资产难以可比或难以采用估值计数法进行估值的数据资产。为了有效推动这部分数据资产的估值、入表乃至进一步的交易,可以先行采用成本法进行估值。

  第二,对于部分数据资产,可以采用成本法辅以估值技术法估值的方式,提升数据资产估值的准确性。成本法将显著低估数据资产的真实价值,若该类数据资产具备部分交易数据,可以尝试通过估值技术法从数据内部出发,评估数据资产真实价值,弥补成本法的缺陷,进一步活跃数据交易市场。应当指出的是,估值技术法仍需要不断的研究与实践,且与经典的估值方法不同,估值技术法的推广不仅需要市场的认可,还需要获得会计准则委员会等官方或行业协会的背书。

  第三,对于具有较高流动性或市场交易频繁的数据资产,市场法与收益法或将具备应用条件。随着数据要素市场的发展,部分数据交易将具备公开且活跃的市场、数据资产收益可靠计量等条件的满足,市场法与收益法将能够较好的运用于这些数据资产中。尤其是收益法,若能够获得有效运用,将可以实现对数据资产变现能力的评估,将促进数据资产化向数据资本化的过渡。

  为了解我国数据资产的总体规模,在现阶段下,我们从成本法的思路出发,对我国拥有的数据资产价值进行粗略估算。估计思路为通过估算建设数据存储服务器在形成数据资产总成本中的占比,结合我国数据存储总量与数据存储服务器建设的支出,计算得到我国数据资产的总体规模。具体来看,估算分为三步:

  第一,估算我国数据产量总规模。信通院在2022年8月发布的《数字中国发展报告(2021年)》中测算得到2017年到2021年,我国数据年产量从2.3ZB增长至6.6ZB[12],复合增长率达到30.2%,结合信通院在2023年4月发布的《中国数字经济发展研究报告》中指出我国年数据产量为6.6ZB时的同比增速为29.4%,与前述复合增长率30.2%接近。故而,我们估算得出2022年我国全年的数据产量达到8.5ZB,2012年至2022年共11年我国产生的数据总量为34.9ZB。

  第二,估算单位数据所需的数据中心建设成本。根据全球数据库Statista的数据显示[13],全球2022年全年预计产生数据97ZB[14],数据中心(Data Center Systems)建设预计支出2090亿美元[15]。我们通过2012年至2022年间的数据产生总量与数据中心建设总支出,估算得到1ZB数据存储中心的平均建设成本约为49.1亿美元。考虑到数据中心建设前置于数据的产生,以及数据存储中心建设成本逐年降低等因素,这一数字的准确性未来有进一步提升的空间。

  值得注意的是,Statista中的全球新增数据量与信通院公布的数据存在差别,因此,我们在确定单位数据的存储中心建设成本时使用Statista公布的数据口径,而在估计我国数据资产整体规模时采用信通院的数据口径。

  第三,按数据中心建设成本在数据资产各项成本中占比,推算我国数据资产总规模。数据资产必然需要在数据中心存储,无论是数据持有主体自建或者租用数据中心,数据中心的建设成本都应被认定为数据资产成本的一部分。中国资产评估协会(2020)指出,数据资产的形成过程包括数据资产获取阶段与数据资产研发阶段,数据资产获取阶段的主要步骤为数据采集,其成本中包括数据购买成本或者数据开发成本、数据加工成本、数据存储成本等;数据资产研发阶段则为数据预处理、数据统计和分析、数据挖掘,其成本包括数据分析成本、数据挖掘成本等。而数据存储成本又涵盖数据中心建设、运维等细分项目,故而数据存储中心建设成本在形成数据资产总成本过程中的占比较难确定。

  若考虑极端情况,即数据存储中心建设成本约等于数据资产总体成本,则我国2012年2022年产生的数据资产总体规模为1.18万亿元人民币。

  在考虑适中情况,根据国际知名数据中心标准组织Uptime Institute[16]在2007年发布的白皮书《确定拥有数据中心成本的一种简单模型》(A Simple Model for Determining True Total Cost of Ownership for Data Centers)中测算,以15年的运营周期计算,数据中心的各项建设成本应占数据中心整体成本的75%左右,而数据中心的运营成本占数据中心整体成本的25%。而参照美国商业新闻社(Business Wire)引述国际数据公司(International Data Corporation, IDC)的报告[17],在2021年全球大数据与分析解决方案(Big Data and Analytics Solutions)的总支出中,将有40%左右的支出来自于信息技术服务基础设施支出[18],其他的支出还涵盖软件开发和采购、数据采集等。如果我们根据上述两项数据折中,假定数据中心建设支出大约占大数据资产全生命周期成本的30%,则我国2012年至2022年产生的数据资产总体规模约为4万亿元人民币。

  若考虑较为乐观情况,即数据资产形成过程中的开发成本、加工成本、挖掘成本、数据存储中心的长期运维成本,以及各项目中均包含的较高人力成本等因素,由此我们对数据存储中心建设成本约占数据资产总体成本的比例进一步下调至10%左右,则我国2012年至2022年产生的数据资产总体规模接近12万亿元人民币。

  综合上述三种测算,我们大致可以认为,在2012年至2022年间,我国产生的数据资产价值至少不会低于1万亿元人民币,而更有可能在4万亿至12万亿元人民币左右。鉴于我国大部分的优质数据资产为政府机关、国有企业、公共事业单位所拥有,10万亿级别的数据资产对于扩充地方政府财力有着重要的意义。2022年全年国有土地使用权出让收入66854亿元[19],对比2022年我国产生数据资产约9644亿元到28931亿元的规模,每年产生数据资产的价值或能达到土地转移收入的14.43%到43.28%。

  应当指出的有三点:一是我们从成本来估算数字资产规模,会显著低估数据资产价值,但仍有助于我们初步认识数据资产的总体规模。二是对建设数据存储服务器的成本在数据资产总成本中的占比情况的估计较为粗略。三是由于数据较少且来源不统一,我们在估算的过程中使用了部分的近似估计量。随着数字交易市场的成熟与可用的外部数据增多,我们会在未来持续测算并更新我国数据资产总体规模。

  数据已成为新的生产要素,数字经济已纳入各个地方政府的发展目标,其在我国未来的发展前景广阔,但相关的研究分析仍然有待深入。本文的研究仅仅是尝试的第一步,我们未来主要的工作方向如下:

  第一,进一步完善估值模型。一是寻找更多质量评价的维度与构建对应的指标,完善数据集的特征提取。二是尝试针对图片、音频、视频等非结构化数据以及数据库等数据形式进行数据质量的评价,针对性的发展对应的估值方法。

  第二,进行数据资产估值的实证分析。在获得带有价格标记的数据资产后,我们可以进行实证分析以验证各估值方法的实用性。

  第三,持续跟踪测算我国数据资产规模。随着数字交易市场的成熟与可用的外部数据增多,我们会在未来持续测算并更新我国数据资产总体规模。

  第四,观察数字经济生态系统及其对经济发展、经济结构、宏观政策、产业业态特别是金融业态的影响。

  (6)国家工业信息安全发展研究中心,北京大学光华管理学院,《中国数据要素市场发展报告(2021-2022)》,[EB/OL], [2023/5/16] 年11月。

  (8)欧阳日辉,杜青青.数据估值定价的方法与评估指标[J].数字图书馆论坛,2022(10):21-27.

  (9)欧阳日辉,龚伟. 基于价值和市场评价贡献的数据要素定价机制[J].改革,2022(3):39-54.

  (10)普华永道,数据资产价值与数据产品定价新思考,[EB/OL], [2023/5/16],年5月。

  (11)张驰. 数据资产价值分析模型与交易体系研究[D].北京交通大学,2018.

  (12)张俊瑞,董雯君,危雁麟.商务大数据分析:交易性数据资产估值方法研究[J/OL].情报杂志:1-10[2023-03-29].。

  (15)中国信息通信研究院,中国数字经济发展研究报告(2023年),[EB/OL], [2023/5/16],,2023年4月。

  (16)中国资产评估协会,资产评估专家指引第9 号——数据资产评估,[EB/OL], [2023/5/16],,2020年1月9日。

  [2]资料来源:媒体报道:光大银行发布 《商业银行数据资产会计核算研究报告》,EB/OL,2022/11/30[2023/3/21],。

  [4]任图南,陈昊和鲁政委,《商业银行数据托管业务初探》,EB/OL,2023/3/[2023/3/],。

  [6]数据增强通常是依赖从现有数据生成新的数据样本来人为地增加数据量的过程,包括对数据进行不同方向的扰动处理或使用深度学习模型按照原始数据的统计分布生成新数据点从而人为的扩充新的数据集。

  [7]资料来源:会计准则委员会,企业会计准则第6号——非货币性资产(2006),EB/OL,2018/8/15[2023/4/1],。

  [8]资产满足下列条件之一的,符合非货币性资产定义中的可辨认性标准:一是能够从企业中分离或者划分出来,并能单独或者与相关合同、资产或负债一起,用于出售、转移、授予许可、租赁或者交换。二是源自合同性权利或其他法定权利,无论这些权利是否可以从企业或其他权利和义务中转移或者分离。

  [10]资料来源:会计准则委员会,企业会计准则第39号——公允市价计量(2014),EB/OL,。

  [12]ZB,中文名是泽字节,英文名是Zettabyte,指十万亿亿字节。

  [13]Statista是全球一站式市场数据平台,提供来自170多个行业、150余国家及地区、8万多个主题的市场和消费者数据。Statista中部分数据为其通过已有数据估算得出。

  [18]根据Business Wire引述IDC的报告,全球2021年大数据及分析解决方案总花销约为2157亿美元,其中信息技术服务基础设施支出约为850亿美元,占比约为40%左右。



上一篇:一周经济学家圈学术动态周报:金刻羽合作论文在顶刊AER发表 下一篇:《计量发展规划(2021-2035年)》新理念评析

    关于我们

    雷竞技安卓下载