OBT商业科技观察

数据≠石油,数据垄断是个伪命题?

不知从什么时候开始,“数据垄断”成为了热门话题。在各种研讨会上,专家们开始大谈“数据垄断”;在各大报刊杂志上,也有显著的版面讨论“数据垄断”;而在微博和微信公众号上,更是不乏大V和意见领袖痛斥超级平台垄断数据,损害竞争和消费者利益。

那么,所谓的“数据垄断”究竟是什么?它会给竞争、给消费者、给整个社会带来怎样的影响?对于“数据垄断”问题,我们又应该采用怎样的态度来加以应对?要回答这些问题,我们恐怕还要从数据本身慢慢说起。

数据就是数据,不是现代的石油

在英文中,“数据”(data)一词最初源自于拉丁语单词“资料”(datum)。单从词源上,我们就很容易知道,它的本意是一种信息的载体,其作用是对信息进行存储和传播。如果根据这个定义,数据的历史几乎就是整个人类的历史——自从人们开始结绳记事,它就产生了,那一个个用绳子编成的结就是最早的数据。在计算机发明之后,“数据”一词的含义逐渐窄化,从原来的泛指慢慢变成了专指那些可供计算机存储和传播的信息。

无论是根据其本来含义,还是其现代含义,数据都不是最近才有的。但在很长时间内,人们一直没有对数据予以重视。数据在人们眼中的作用,不过是为了帮人们保存一段记忆,或者讲述一段故事,其价值更多是文化的,而不是经济的。

直到最近几年,一切才发生了变化。随着计算机技术的迅速发展和各种统计方法的涌现,人们渐渐掌握了通过挖掘数据来获取信息、指导实践的能力,原本被人忽视的数据从此摇身一变,成为了重要的生产要素。为了从数据中拷问出更多信息,数据的搜集和分析逐渐成为了单独的学问和生意。数据的规模(Volume)开始越来越庞大,数据的多样化(Variety)变得越来越高,数据的更新速度(Velocity)变得越来越快,而人们从数据中获得的价值(Val-ue)也变得越来越丰厚。在4个“V”的加持之下,就连数据本身也不再被简单称为数据。人们开始在它头上加上冠冕,尊称其为“大数据”(bigdata)。

由于在现代经济中,数据变得越来越重要,所以有一些人开始将其比喻为新时代的石油。应该说,作为一种突出数据重要性的比喻,它确实十分生动。不过,如果从性质上将数据简单类比为石油,那就大错特错了。事实上,作为一种新时代的重要生产要素,数据有很多属于自身的特点,而这些特点是和石油存在着显著不同的。

其一,从使用环节看,石油是一种竞争性的资源,而数据则是非竞争性的。竞争性是一个经济学的概念,若一种物品被一个人使用时,会妨碍或限制其他人使用,这种物品就被称为是竞争性的。很显然,根据这个定义,石油具有很强的竞争性——你多用一点,别人就只能少用一点。而数据则不同,一个人使用数据并不会妨碍其他人也对其进行使用。

其二,从生产环节看,石油具有很强的排他性,而数据的排他性则相对较少。什么叫排他性呢?就是一个人使用某物时,可以以较小成本排除其他人使用。我们知道,人们在采挖石油的时候通常会划分出一定的区域,在这个区域内,禁止其他人同时采挖。而数据的搜集则不同。在同一时间,不同的数据平台可能在对同一个人的相同信息进行搜集,彼此互不干扰,也不会相互排斥。

其三,从储量上看,石油的量是给定的,用一点就少一点。而数据则不同,人们使用数据,并不会使其减少。恰恰相反,通过对已有数据的开发和挖掘,还可以生产出新的数据。

其四,对于像石油这样的传统资源来说,重要的是数量,除了数量之外,并没有维度的概念。而对于数据来说,维度则具有至关重要的意义。如果一套数据只有一个维度,那么即使它的数量再大也没有意义。想象一下,即使你掌握了全中国所有人的体重数据,那又有多大用呢?但是如果你同时掌握了体重和消费开支这两个维度的数据,那就大不相同了。这时,你可以根据数据来推断不同的人愿意为减肥花费多少,并据此探索出相应的商业模式,从中发掘出经济价值。

其五,相比于石油等传统资源,数据具有更强的替代性。尽管从理论上讲,石油之类的传统资源也可以被替代,但其相对成本是很高的。例如要把一辆燃油动力的车改成燃气动力车,就需要花费很高的成本。而相比之下,数据之间的替代则比较容易。例如,我们想知道每个人住在哪儿,以便给他们定向投放广告。假如我们有相关的住址信息,那么很好,这个任务可以直接完成;但是如果没有地址信息,那也不要紧,因为我们完全可以通过其他数据,例如出行数据来予以推断,从而可以达到同样的目的。

综合以上几点,我们可以看到,尽管从商业价值来看,数据确实和工业时代的石油具有很强的类比性,但是在更多的性质上,它和石油等传统资源却存在着很多差别。数据并不是新时代的石油,数据就是数据。

数据可以被垄断吗

在花费了大量篇幅讨论数据作为一种新型资源的属性后,让我们言归正传,将话题回到数据垄断上来。这里需要指出的是,所谓“数据垄断”,并不是一个严谨的学术词汇,它主要流行于媒体报道和名人演讲。正因为如此,其实这个流行词汇并没有十分精确的定义。我翻阅了最近两年来关于“数据垄断”的很多文章,发现根据使用语境的不同,这个词其实有两个不同的含义。

第一个含义是对于数据的垄断,即指某些数据被某个企业独自占有了。这一点,主要是针对数据的生产和储存而言的。第二个含义则是,企业通过掌握的数据来获取,或者巩固自己的垄断地位。这一点,主要是针对数据的使用而言的。

先看第一种含义。在我个人看来,这个意义上的“数据垄断”其实是一个伪命题。为什么这么说呢?主要有两个理由:

第一,数据资源并不是恒定不变的,相反,它在不断地产生出来。由于这个特征,即使有企业真的独占了某一类数据资源,那也只能占有一时,不能占有一世。我们知道,在大数据时代,数据的价值是和其时效性密切挂钩的。因此,除非这个企业可以不断对新产生出来的数据加以垄断,否则其手中拥有的存量数据将很快失去其价值。

第二,正如我们前面强调的,数据搜集的排他性很弱,你可以搜集,但也不妨碍别人搜集。从这个角度看,某个企业也很难通过排除他人搜集来保证自己持久占有最新产生的数据。

当然,在一些特别的情况下,某些企业也可以通过技术手段来增强对数据搜集的排他性。例如,它们可以屏蔽掉第三方的爬虫软件,还可以用跟踪IP的手段来识别手动爬取数据的行为,但是这些都是需要投入不小的成本的。考虑到数据具有很强的替代性,一般的企业很少会有足够的激励去对其他数据搜集者严防死守,因为尽管这在理论上可行,但在经济上却未必划算。

数据可以帮助企业实现垄断吗

在“数据垄断”的两个含义中,真正值得引起人关注的是其第二个含义,即企业应用数据来获取、巩固垄断地位的行为。

在很多人的直觉中,这一点几乎是显然的。几年前,著名未来学家凯文·凯利在一段演讲中就发表过类似观点。他说:“我认为大数据会缔造大公司,十年、二十年之后,全世界最大的公司就是有最多数据、最大数据的公司。将来谁在数据方面能胜出,谁有最大的数据公司,谁就是最大的胜者……随之而来的是垄断,这意味着大角色大企业会自然而然的变得更大,越做越大,越大越强。越多的人加入到网络当中,网络就越值钱、越有价值。”

而和未来学家相比,从事反垄断经济学研究的专家对这一问题则要谨慎得多。举例来说,去年11月时,美国联邦贸易委员会曾对数据垄断问题进行过一次听证会,多位在业内具有很高知名度的经济学家都出庭作了证。几乎所有的经济学家都认为,数据的确可以大幅增加企业的竞争力,但如果企业想仅仅依靠数据来实现垄断,则是十分困难的。

为什么反垄断经济学家们更倾向于对数据强化垄断力量这一问题采取更为审慎的态度呢?其理由主要有以下两点:

第一个原因就是数据所具有的高度可替代性。对于同样的问题,可以利用很多不同的数据进行分析,其得出的结论都是有价值的。从这个意义上讲,即使一个企业完全拥有了某些数据也不能完全排除竞争,从而实现垄断。

关于这一点,2016年发生的欧盟批准微软收购领英(LinkedIn)案是一个十分典型的例子。在微软向欧盟反垄断机构提交申请后,欧盟委员会内部曾为是否通过这一申请发生过不小的争议。一些人认为,微软收购领英之后,可能整合双方原有的数据库,这不仅会消除两个企业之间原本存在的基于数据的广告竞争,还会强化合并之后的企业的市场力量,从而起到排除、限制竞争的作用。然而,在经过一系列审查之后,欧盟委员会最终认为这类竞争问题很难出现。原因就在于即使在两家企业合并之后,其他广告企业仍然可以通过很多渠道继续获得对广告有价值的互联网数据。

另一方面,尽管数据是一种有用的要素,但是这种要素是不会单独起作用的,必须配合上企业的技术实力和组织力量,才能真正发挥其作用。

如果没有相应的配套资源和举措,数据这种资源就不能有效地转化为真正的资本。当然,数据本身也就更不可能成为企业市场力量的来源。经济学家兰布雷希特(AnjaLambrecht)和塔克(CatherineTucker)曾写过一篇论文对数据与市场力量之间的关系进行了探讨,结果他们发现:“几乎没有任何证据可以证明在不断变化的数字经济中,仅仅依靠数据就能充分排斥更优的产品或服务的供给。要想建立可持续的竞争优势,数字战略的重点应当放在如何使用数字技术,给用户带来价值上面。”换言之,在竞争中,数据虽然重要,但绝非关键,希望用数据来建立或者巩固垄断地位,几乎是不可能实现的。

事实上,很多市场进入的例子也从反面说明了问题。经济学家杰弗里·曼恩(GeoffreyA.Manne)曾对不少互联网企业的崛起进行过分析,结果发现成功的互联网公司开始时都几乎没有数据,更不是什么数据驱动型的企业。他由此得出一个重要结论:数据更多的是互联网平台持续运行时的副产品,而不是创建互联网平台时的关键。

数据垄断的“三宗罪”

现在,且让我们暂时丢开关于“数据垄断”是否可能的讨论,假设某些企业依靠自身的能力可以垄断数据资源,或者可以通过数据来对自身的垄断地位加以巩固,又会产生什么后果呢?

在现有讨论中,认为“数据垄断”带来的危害大约有三个方面:一是对竞争的破坏;二是对消费者利益的损害;三是可能带来的隐私等方面的风险。如果我们细细分析,这三个可能的危害似乎也大有值得商榷之处。

先看对竞争的破坏。为什么数据垄断会产生这个后果呢?综合起来,可能的原因主要有两个:

第一个原因是拥有更多数据资源的企业可能会利用手中的资源来采取一些“妨碍性滥用”行为。例如,如果一个优势企业掌握了关于交易对象的充足数据,则它可以强迫对方接受自己的某些条件,一旦数据显示对方没有按自己的要求办事,就停止与其交易。应当承认,这样的情况确实是存在的。不过,在这种情况下,优势企业之所以可以强迫交易对象遵从自己的意志,通常是因为它们在其他方面所占有的优势,数据充其量只能算作它们实施类似行为的一个条件而已。从这个意义上讲,认为数据允许企业实施“妨碍性滥用”行为,从而破坏市场竞争环境,这种认识至少是片面的。

第二个原因是拥有丰富数据的企业之间可以更好地进行交流,从而进行合谋。这一点看似有道理,但其实并不正确。诚然,在数字经济时代下,很多企业之间已经可以利用算法来监控彼此的经营数据,并以这些数据为根据,来调整自身产销,从而达到合谋的目的。但在这个过程中,更为关键的其实是算法,而非数据。事实上,通过算法的设计,企业之间即使借助很少的数据和信息也可以达成交流,实现合谋。因此,算法合谋本身确实是一个问题,但这个问题的症结却在算法,而无关太多数据问题。

再看对于消费者利益的损害。这一点指控,最主要来自于对“个性化服务”的抱怨。当企业拥有了海量的数据之后,就可以对消费者进行精准的画像,从而对其提供“个性化服务”。在欧洲委员会的一份报告中,将“个性化服务”分成了个性化广告、个性化搜索,以及个性化定价这三个类别,并指出尽管这三种形式在表现上存在着不同,但本质上都是经济学上所说的“价格歧视”的一种体现。

熟悉经济学的朋友都知道,价格歧视,也就是对不同的消费者收取不同的价格,会让部分的消费者剩余转移到企业手中,从而让消费者剩余下降。从这个角度看,“个性化服务”确实会损害消费者利益。但是,正如欧洲委员会的那份报告中指出的,“价格歧视”在实现这种转移的同时,还会有一种“市场创造”(mar-ketopen)效应。通过精准地识别消费者的需求,企业可以让很多原来并不在市场中的消费者纳入到市场中来,而这部分消费者,却是确确实实得到实惠、能实现自身福利的改善的。如果考虑到这点,那么“个性化服务”对消费者整体所产生的整体福利效应就是不确定的。究竟作何判断,在很大程度上取决于我们如何看待不同消费者群体的重要性,如何对他们的效用状况进行加权。

最后再说说隐私方面的风险。不可否认,目前很多企业出于商业目的的需要,对于用户的个人信息进行了过度的搜集,从而产生了侵犯用户隐私的后果。更有甚者,还衍生出了“剑桥分析门”那样的丑闻。这些问题当然都是值得重视和反思的,不过,如果将这些问题视为数据垄断的结果,那就可能显得牵强了。

诚然,从现有状况看,确实有很多在业内具有较大市场份额、较强市场力量的企业侵犯了用户的隐私,例如Facebook就是一个典型事例。但是,这并不意味着企业的规模更大、占有的数据更多,就和侵犯隐私之间存在着因果关系。在一次会议上,我曾请教过诺贝尔经济学奖得主梯若尔(JeanTirole),问他怎么看“剑桥分析门”事件,以及是否应该用拆分的方式来对Facebook进行惩罚。梯若尔听完问题后沉思片刻,反问道:“你认为拆分就能解决问题吗?如果将一个大的公司拆分成几个小公司,那么这几个小公司为了竞争的需要,不是会加强对用户信息的采集和争夺吗?你认为这是会促进隐私保护,还是相反?”梯若尔的这番评论颇值得玩味。如果企业对数据的争夺是为了竞争,那么竞争越强,消费者信息被侵犯的概率就越大。从这个意义上讲,如果真的存在着“数据垄断”(当然,这很难达到),那么从保护用户隐私和信息安全的角度看,这倒可能是一种最优的状况,因为这时人们只要管好一家企业的安全,就可以防止问题的发生了。

理性对待“数据垄断”

通过如上冗长的分析,我们可以看到,所谓“数据垄断”其实并不是一个十分明确的概念。在现实中,它似乎很难存在,即使存在,其所谓的危害也是颇为值得商榷的。基于这个原因,我个人认为在数字经济条件下,应该对所谓的“数据垄断”抱有一种更为理性、审慎的态度。应该看到它所隐含的风险,但也不宜盲目渲染它的危害。

作为一种生产要素,数据具有很强的规模经济和外部经济。无论是用于预测,还是用于企业内部管理,数据的规模越大、维度越多,其用处就越大。如果数据是孤立的、零散的,那么它的作用就完全不能发挥出来。从这个角度看,为了鼓励企业提升自身的效率,就应该允许它们在合法合规的范围内搜集、使用数据,而不应该用一个莫须有的“数据垄断”概念来束缚了它们的手脚。

当然,在实践当中,企业搜集、利用数据存在着很多的问题,也确实有不少企业利用数据来谋取私利,损害消费者利益。对于这些具体的问题,应该研究具体的方法来加以治理。如果将所有问题都一概甩锅给“数据垄断”,然后祭出反垄断的大棒乱打一气,那可能非但无益于事情的解决,还会阻碍企业的正常发展。