这年头能隔三差五上热搜的除了各路网红明星,“大数据杀熟”显然也是其中之一。几乎每隔一段时间,关于大数据杀熟的话题就会出现在热搜上,日前则轮到了#年轻人开始反向驯化大数据杀熟#。在大众头顶作威作福多年的大数据杀熟,居然能被反过来利用,确实让人啧啧称奇。
根据相关媒体报道,最近有不少人在社交平台分享对抗大数据杀熟的攻略,“第一次搜机票,直飞最便宜的也要4309元,我就反复评论‘机票太贵了,买不起,不去了’。后来就变成了1903元”。
网友总结这套操作背后的逻辑,是通过特定的评论让算法认为你对价格敏感,从而改变系统对你的画像、从“想要进行跨国旅行的有钱人”变为“旅行取决于机票价格、没什么钱的人”。
不得不说网友里确实有能人,似乎洞察到了如今一众互联网厂商推荐算法和大数据的缺陷。既然算法是根据用户的行为和反馈来调整用户能看到的内容,用户自然也可以通过校正自己的行为来影响到算法的推荐结果。不过要说此举是“反向驯化”就有些过了,这充其量可能只能算是用户与互联网厂商围绕算法的博弈。
算法被“驯化”其实只是一种幻象,甚至能上热搜反而可能是互联网厂商乐见其成的事情。之所以会有这样的结论,还需要先从“大数据杀熟”讲起。所谓大数据杀熟,指的是经营者运用大数据收集消费者的信息,并分析其消费偏好、消费习惯、收入水平等信息,将同一商品或服务以不同的价格卖给不同消费者,从而获取更多消费者剩余的行为。
大数据杀熟只是手段,一级价格歧视才是互联网厂商的真正目的,看人下菜碟、把每一位消费者口袋里的钱都掏空的一级价格歧视,才是所有商家最梦寐以求的场景。只可惜在大数据(Big Data)概念问世之前,商家无法做到知晓消费者对于某一商品所愿意、并能够支付的最高价格,彼时一级价格歧视还只是一个理论上存在的概念。
信息革命催生的互联网让用户在网络上留下的一切痕迹都变得有迹可循,用户的行为也以数据的形式保留了下来。 “身怀利器,杀心自起”,在收集了大量用户的数据之后,互联网厂商又怎能按捺住赚钱的冲动呢。比如早在2000年,电商巨头亚马逊就曾进行过一次差别定价实验。
当时,亚马逊选择了68种DVD碟片,根据用户的人口统计资料、在亚马逊的购物历史、上网行为,以及上网使用的软件系统,来确定对这68种碟片的报价水平。只可惜,亚马逊这次差别定价实验只进行了一个月,就被用户发现了端倪。
由于此事迅速形成了舆情,逼得亚马逊创始人贝索斯紧急进行危机公关、并向用户承诺,“不论过去、现在,还是将来,亚马逊都不会利用消费者的资料进行差别定价”。不同于如今无孔不入的推荐算法,亚马逊当时的用户行为分析技术不成体系,用户画像的维度也过于单一,这也是其当时翻车的核心因素。
收集了海量用户数据却无法有效利用,这是本世纪第二个十年之前,全球互联网厂商都一筹莫展的现实。这也是为什么在PC互联网时代,隐私安全还不是一个全球性的问题。但随着计算机硬件水平的提升,计算能力的增强让云计算得以落地,使得原先无法利用的数据能够被互联网厂商抽丝剥茧,形成所谓的大数据。
在大数据技术的帮助下,用户的精准画像早已成为了现实,而通过收集用户在平台上留下的个人兴趣、社交关系、地理位置等可量化的数据,互联网厂商的算法更是做到了“比你还懂你”。在相关监管部门的三令五申之下,大数据杀熟为什么屡禁不止,总有消费者会发现自己被杀熟了呢?
其实由算法实现的大数据杀熟之所以难缠,是因为监管部门与互联网厂商的技术不对等,以及消费者保护和知识产权保护冲突的结果。大数据杀熟能够实现的原理其实很简单,无非就是对数据的收集、整理、分析,但是具体的规则、数据的权重是各厂商秘而不宣的东西。所以除非监管部门能够取得互联网厂商的后台权限,否则几乎不可能从用户看到的前台界面来完成证据固定。
显而易见,互联网厂商不可能向监管部门敞开大门,而需要尊重知识产权的监管部门也没有理由在互联网厂商的服务器安插监控程序。所以即便明明知道互联网厂商在大数据杀熟一事上捣鬼,可就是抓不住他们的马脚,这也是当下大数据杀熟沉渣泛起的关键所在。
即便如此,网友们尝试“反向驯化”大数据也不是没有效果。因为互联网厂商的推荐算法是以用户画像为基础,通过改变自身的行为来破坏用户画像的准确性也有实现的可能,毕竟例如蒋干盗书、假道伐虢等释放假情报来误导敌人,在历史上也屡见不鲜。
如果能持之以恒地向互联网厂商的推荐算法释放错误信息,确实能够避免大数据杀熟,可是真的有人能长期扭曲自己的本性吗?用户画像之所以威力无穷,盖因它就是用户在互联网世界的投射。故而网友们所谓“反向驯化”大数据的举动几乎注定会是徒劳的,但徒劳的努力也并非没有意义。
毕竟如果没有这些网友的“反抗”,互联网厂商借助大数据、算法进行价格歧视的做法,可能只会更加肆无忌惮。
本文来自微信公众号“三易生活”,作者:三易菌,36氪经授权发布。