泛览天下

阅读,看尽天下事

“数据”可以被垄断么?

2022-07-01 20:45:33


曲创(原创)欢迎关注 竞争者的垄断梦(本文瘦身版发表于《科技日报》2019年8月21日)“数据垄断”四个字最近很常见,大概指的是正处于反垄断风口浪尖上的那些互联网大公司(Big Tech),“垄断”了我们的数据,据说这样会导致很严重的后果。


曲创 (原创)欢迎关注 竞争者的垄断梦

(本文瘦身版发表于《科技日报》2019年8月21日)

“数据垄断”四个字最近很常见,大概指的是正处于反垄断风口浪尖上的那些互联网大公司(Big Tech),“垄断”了我们的数据,据说这样会导致很严重的后果。

从“数据垄断”这四个字本身我们可以解读出两层意思来:

首先,数据是很有用的东西,要不人家垄断它干什么?

其次,数据是可以被垄断起来的,这里的“垄断”意为“独占”,数据被某些公司独占了,别人用不到。

数据有什么用?

单纯的数据本身什么用也没有,不信你看:

这就是个数据,你什么也看不出来是吧?

“40岁”,这是个年龄,指一个不再年轻的年轻人,或是一个还不是很老的老年人。


“40元”,这可能是一个价格,也可能是一笔收入。


“40度”,如果指的是体温,此人在发烧;如果指的是一杯水的温度,此水现在有点烫。

所以呢,数据本身什么信息也不包含,必须和其他产品、服务、活动结合起来才能够提供有用的信息,

当我们把 大量数据集中在一起 ,奇妙的事情发生了。

前几天闹台风,大家时刻盯着手机上的一个页面:

“台风实时路径”,预报准确度很高。正是因为有了这样的气象预报,我们才能够提前防范,减少损失。

台风路径预测的背后,是气象部门依据无数的数据在不停地计算分析。

再比如,每天上下班的时候,打开地图APP看看交通拥堵情况:


这些红色、黄色、绿色的线条能够使我们避开拥堵路段,快点回家。

这也是基于成千上万个车辆的位置、速度等数据计算出来的结果。


滴滴在济南和交警部门合作进行了个“试点”,接管几条主干道上的红绿灯,按照拥堵状况实时调整信号灯时长。路口有屏幕显示“绿波速度”的速度。

如果所有车辆都按照这个速度前进,那么可以一路顺畅地快速通过多个路口。改善拥堵的效果很明显。

这么好的结果如何实现的?靠的是路上行驶的车辆中的APP数据,再加上交警部门的数据。

这便是数据的第一个作用: 揭示出个体信息无法体现的整体规律。

数据的第二个作用我们天天见: 提高既有市场的交易效率, 最简单的就是“匹配”。

搜索引擎、电商平台、外卖平台,其实做的都是这个事。

交易双方的数据越多,匹配的效率就越高。

不过这只是理论上的结论, 匹配效率最高的状态不见得就是平台利润最大的状态

对于平台而言,匹配效率显然没有利润那么重要。

很快,掌握了大量数据的科技平台不满足于只是匹配现有的信息,他们更要基于用户的个体信息提供 “个性化服务 ”,这是数据的第三种作用。

这个领域做得最彻底的当属亚马逊已经申请了专利的“预发货”系统:

亚马逊通过你之前的消费数据,推断出你在未来的几天会买什么东西,然后安排发货。

在你真正下订单的那一刻,你的包裹可能已经在路上,可能已经在离你家最近的配送站点,还可能已经在站在你家门外准备敲门的快递小哥手里了。

“比你自己还了解你自己” ,这是大数据时代很正常的现象。

和超级电脑相比,人脑的数据处理能力显然不是一个量级。

至于“个性化定价”、“个性化推荐”之类,和亚马逊的“预先发货”相比,只能算小儿科级应用。

不过很奇怪的是:

如果一个消费者因为大数据的引导, 多花了钱,感觉很气愤

可因为大数据的引导, 多买了几件东西,却好像没什么意见.

其实这两种行为的实质是一样的: “大数据杀熟 ”。

数据的以上三种作用还都是辅助性的,下面这个才是数据的“杀手级应用”: 基于数据的全新产品和服务。

基于数据的创新

苹果表上有个很冷门的功能“跌倒报警”,如果你意外跌倒,会提示你是否需要报警,简单确认后会拨通事先设置好的急救电话。

这一功能就如同汽车上的安全气囊,我们希望永远也用不上,但一旦意外发生,它可以救命。

它可以判断出你是自己蹲下的、趴下的、躺下的,还是意外跌倒的,依据的是苹果表上十几个传感器的数据计算的结果。

这就是数据创新的价值: 关键时刻能救命

这个表现在还可以测你的心电图,并且已经获得了FDA的批准。

这些数据长期积累下来,对于了解掌握一个人的身体健康状况,该是多么有价值的东西。

无人驾驶也是数据创新的好例子,车辆能够实现无人驾驶,靠的是车辆上下四周的多个传感器时刻收集周围路况的数据,经过计算,得出最优的驾驶策略。

造个车不难,造个能自己开的车,就难了;

造个自己能开还能停的车,难上加难。

让科幻电影中的场景成为现实的,还是数据。

“知人知面不知心”,一个人的“信用”是个很难准确量化的,可是却又经常需要知道,比如谈生意的时候,还有相亲的时候……

可有人就想法弄出来了,不仅弄出来了还算出数来了:


不仅算出来了,还越来越有用,这就了不起了。

“信用分”也是一个基于多种数据的新产品,完全彻底的创新。

期待这个数字能早日从“财务信用”,扩展至一个人全方位的“信用”。

那样的话,相亲、招聘、面试的时候,无需多言,一亮分即可……

从数据到信息:生产过程

以前我们企业分成了两种:劳动密集型,和资本技术密集型。

现在有必要加上第三种了: 数据密集型。

数据大致可以分成两类,一类是象城市里的道路分布、某个区域里有多少幢楼、某个路口一天有多少人来车往这样的,可以称为 “公共领域的数据”

这类数据谁都可以获得,无法垄断;

第二类是公司自己生产经营过程中产生的数据,平台每天的成交数量、一家餐馆每天卖出去多少份菜、平均每桌花了多少钱等。

这类数据本来就是公司自己的,也无所谓垄断与否。

所以, “数据垄断”本身就是个不成立的伪命题

更重要的是,从无用的数据到有用的信息之间,需要经过数据的收集、处理、存储、分析过程,这是一个不折不扣的 生产过程

数据的生产有两个特点:

数据量越大,成本越低,效果越好。

数据种类越多,成本越低,效果越好

因此对于数据密集型行业而言, 数据的集中能够提高数据生产的效率

以前“玩数据”是很烧钱的,一般的企业玩不起。


现在不一样了,有了这些专业的“云”,自己想上个天玩个云成本大大降低。

数据密集型行业的竞争在数据的总量、类型、处理分析能力、应用开发等层面展开, 数据的集中将是行业发展的必然趋势。

数据不能被垄断,但可能被滥用

大家忧心忡忡的“数据垄断”很多时候指的是“基于数据的垄断”,并不是对数据本身的垄断。


不久前的8月17日,欧盟正式发起了对亚马逊的反垄断调查,核心问题正是数据。

亚马逊身兼二职,既有自营业务,也有第三方业务。

在亚马逊上开店的第三方商家数据显然要对亚马逊开放,第三方业务和亚马逊的自营业务构成直接的竞争关系。

欧盟发现亚马逊很可能利用这些第三方商家的数据,对他们实施了不正当竞争行为。

此案正在调查中,结果怎样我们拭目以待,其结果很可能对国内的电商行业具有很强的借鉴意义。国内有一家电商平台的情况与亚马逊十分接近。

还有一个已经结了案的:

Art和Trod是两家卖招贴画的商家,他们都在亚马逊上开店(怎么又是亚马逊,今天算是和亚马逊杠上了)。

他俩写了个程序,可以自动获取对方商品的价格,然后和自己的同样商品价格比较,然后程序自动调整,保持价格一致。

具体算法据说很复杂,但目的很简单: 价格合谋

这是最古老的垄断行为,没有之一。

从以前行业大佬们面对面的合谋,到如今基于数据的 算法合谋

上百年的陈酿装在不同材质的瓶子里,味道还是一样的:

竞争对手之间通过合谋消除竞争 ,你好我也好,就是消费者不好。

正因为如此,“合谋”也是目前在反垄断中唯一依然适用于 “本身违法原则” 的行为。

不需要界定相关市场、不需要判定后果、不需要计算损害,有此行为即是违法。

数据本身是无法被垄断的,但是在一个数字化和大数据时代,数据却可能成为垄断和不正当竞争行为的帮凶。

数据可以让这些违法行为更加隐蔽、效果更好,对市场竞争和消费者福利的损害也就越大,这才是我们需要关注的。


曲创 (原创)欢迎关注 竞争者的垄断梦