从上世纪 60 年代个人电脑出现到现在,数字世界已经深入到我们生活的点点滴滴,从微小 “数字细胞” 到庞大概念的 “元宇宙”。ChatGPT 的火热也再次我们感受到强大的数字力量,甚至很多人都在思考如何改变才能避免工作上被替代。但是在数字世界中,我们是否拥有自己的数据?您是否面对过个人数据丢失、个人隐私泄漏、数字生活成本增长、依赖平台、被平台 “杀熟” 等各种问题呢?个人在数字世界中的地位会是怎样呢?
我们将依次通过三篇文章 《迷雾》、《探索》、《家园》来分析个人数据的现状和核心问题、剖析当前的技术和设计、探究解决之道和未来发展。
今天是第一篇《迷雾》。将通过重温过去 40 年的快速发展,思考我们如何失去了个人数据的所有权,以及我们面对的问题和解决方向。
- 什么是个人数据
- 我们面对的变化
· 20 世纪末的个人电脑时代
· 互联网兴起之初
· 移动互联网的浪潮
· 社交的风起云涌
· AI 的汹涌澎湃
- 我们面对的问题和往何处走
教科文组织关于个人数据的定义:个人数据是与个人(数据主体)有关的任何信息。这个定义是一个狭义定义,关注点在于会有个人标识的信息,比如姓名、邮寄地址、电子邮件地址、电话号码和医疗记录。
我们要讨论的个人数据是指个人拥有的电子数据,比如个人创建的笔记、文档、通讯录、日历等,个人拍摄、录制的家庭照片、视频、录音等,个人购买的应用软件、电子书、音乐等。
就像真实世界里,我们的家庭相册、购买的家具、书籍放在我们自己的家里一样,数字世界的家也应该是个人拥有的保护个人数据的一个空间。
过去 40 年的发展,个人数据也快速增长,我们的生活在全方位的数字化。
20 世纪末的个人电脑时代
不知道还有多少人记得 1.44MB 容量的软盘、DOS 命令以及五笔口诀的时光,那个时光是我最初的 PC 电脑的记忆,有这个记忆的朋友们估计都已经度过了 “35 岁” 的门槛。
在那个时代里,我们通过软盘、光盘、优盘以及移动硬盘来回折腾着自己的文件和数据,在 Windows、Linux 系统中折腾各种软件工具。虽然现在看来可能有些 “低效”,但那时候每个人的数据主要是存在个人电脑中,软件程序只是我们处理数据的工具。
在那个 “旧” 时代,我们的数据是属于我们自己的。
互联网兴起之初
来到 21 世纪初,以 Yahoo(雅虎)、Google(谷歌)为代表的互联网浪潮开启了属于门户网站和搜索引擎的数字时代,也伴随着电子邮箱、办公软件、电子竞技游戏等各种数字产品的发展。不仅魔兽世界是在 2004 年第一次发版,Gmail 也是 2004 年正式发布。相比于目前个人数据开始迈向的 TB 级别,1GB 现在看是一个很小的空间,但作为第一家提供 GB 级空间的 Gmail 很快成为最受欢迎的一个。现在还记得那时候朋友们早期找推荐获得 Gmail 账号的兴奋,尽管也伴随着对于个人数据挖掘分析的争议。
以流量、广告为基础的互联网盈利模式也正式形成,直到如今这也是数字世界中最主要的盈利模式,这也决定了对于个人数据的挖掘是数字平台本质驱动的诉求。
移动互联网的浪潮
发布在 2007 年的 iPhone 苹果手机则开启了移动数字生活的浪潮,让数字世界触角深入到我们生活的各个方面。看着在上班路上乘坐地铁时的 “低头族”,我们很难想象没有手机的生活是怎样的。照片、视频、通讯录、笔记、文件等个人数据通过手机这个媒介在各种平台中流转。我们对随时随地使用数据的诉求,也使得以 Dropbox 为代表的网盘和以 iCloud 为代表的个人云产品快速发展。
然而我们会发现个人数据已经分裂在各种不同的平台上。更可怕的是,我们开始依赖平台以及对应的生态,如果不克服损失和困难,很难脱离某一个平台。这种依赖会使得用户长期每年为某一个平台或公司的发展贡献一份 “力量”,难以脱离。
社交的风起云涌
从 2003 年的 Myspace 和 2004 年创建的 Facebook 开始,以 Facebook(脸书)、Instagram、Tiktok(抖音)、微信(WeChat)为代表的社交互联网的浪潮也在风起云涌。社交是人类文明发展的基础活动,数字化社交极大的提高了人们之间的交流沟通的效率。
但同时,数字社交产品的发展也让我们进一步依赖平台。当平台上某个账号无法使用了,我们会发现数字世界中这个用户就成为了零。一方面在现在的社交平台中,账号作为用户在数据世界的标识就是属于平台的,脱离平台账号就没有意义了。另一方面,用户之间的好友关系、用户在平台上的数据也都从属于平台。这种依赖附属关系,使得如果我们不努力改变,每个人都可能成为了数字世界的 “奴隶”。
AI 的汹涌澎湃
从 2015 年 AlphaGo 到 2022 年的 ChatGPT,这几年的 AI 浪潮,让我们感受到了数字力量的强大。我相信 AI 会越来越强大,对世界的发展会起到越来越重要的作用。
但同时,也让人担心 “黑客帝国” 的情景离我们并不远,“AI 教父” 杰弗里・辛顿也也有如此担忧。最开始担心这个问题是一次几年前的打车经历,在车上司机跟我诉说着对于平台自动派单的吐槽和无奈。在自动派单模式下,是平台根据 AI 算法安排司机做哪一个单子。虽然司机可以选择不去,但是次数多了也会影响未来的收入。所以,司机是在平台(AI)的指挥下做事情,在为平台打工,并且依赖平台。AI 会越来越强大,那么这种模式很可能会发展到越来越多的行业中,最终让人担心会走向黑客帝国中的 “人成为矩阵的能源来源” 的结果。
面对 AI,个人拥有自己的数据更为重要。
从互联网、移动、社交到 AI 浪潮,我们的时代有了深刻的变化,但同时个人数据的所有权也在逐步失去,我们面对着越来越多的问题,包括个人数据丢失、个人隐私泄漏、数字生活成本增长、依赖平台、被平台 “杀熟” 等问题。
上述问题的核心是数据的所有权,只有让个人数据掌握在人的手上而不是平台之上,才能避免数字世界中人成为 “数字矿产”,才能避免黑客帝国成为现实。
我们拥有自己的数据的三个基本问题是:
账号是否属于个人:个人账号应当由个人拥有,而不是属于互联网平台。
数据是否属于个人:个人数据应该由个人拥有,而不是属于互联网平台或第三方机构。
数据使用是否依赖平台:个人数据应该由个人主导使用,而不是需要依赖互联网平台或第三方机构。
当且仅当 “账号完全属于个人”、“数据完全属于个人”、“个人对数据的使用不依赖平台” 这三个条件都达成才能说个人是拥有自己的数据的,只有这样我们才能在数字世界中有主动权,让数字世界成为由人主导的可持续发展的社会。
我们很高兴的看到无论是政府的立法监管,还是公众隐私保护意识的提高,都在促进这个问题得到更多的关注。
同时我们也看到,近些年一些技术的发展和探索也在向这个方向努力。我们将在第二篇文章《探索》中分析当前相关技术的发展以及 3 个基本问题解决的前景,欢迎关注。
欢迎加入讨论组 https://slack.ao.space 围绕这个话题展开讨论。
教科文组织个人数据保护和隐私原则:https://www.unesco.org/zh/privacy-policy
个人电脑 - 维基百科:https://zh.wikipedia.org/zh-hans/%E4%B8%AA%E4%BA%BA%E7%94%B5%E8%84%91
Google opens Gmail to all - 互联网存档:https://archive.is/20120728125135/http://news.com.com/Google+opens+Gmail+to+all/2100-1038_3-6157101.html?tag=nefd.top
Gmail does scan all emails, new Google terms clarify:https://www.theguardian.com/technology/2014/apr/15/gmail-scans-all-emails-new-google-terms-clarify
Trump’s banishment from Facebook and Twitter: A timeline:https://www.nytimes.com/2022/05/10/technology/trump-social-media-ban-timeline.html
‘Godfather of AI’ Geoffrey Hinton quits Google and warns over dangers of misinformation:https://www.theguardian.com/technology/2023/may/02/geoffrey-hinton-godfather-of-ai-quits-google-warns-dangers-of-machine-learning
表决通过!个人信息安全有了专门法律保护:http://www.npc.gov.cn/npc/c30834/202108/52678c929bca4012a5b24c86811ef4ce.shtml