参考消息网11月5日报道美国《国家地理》杂志11月号刊发题为《人工智能如何揭示罗马帝国失落的秘密》的文章,作者是戴维·蒙哥马利。文章编译如下:
2023年春天,大学生卢克·法里托被一个播客节目深深吸引了。播客主持人正在描述一个目标十分大胆的比赛:在不展开卷轴的情况下读出一个有着2000年历史的卷轴上的文字。
这份手稿是一批纸莎草卷轴的一部分,这些卷轴在维苏威火山喷发后被埋藏并已碳化。公元79年的这次火山喷发摧毁了罗马城市庞贝和赫库兰尼姆。假如手工打开这些卷轴,它们就会碎成渣渣,卷轴上所包含的任何信息便会灰飞烟灭。利用机器学习找到阅读卷轴文字方法的参赛者可以分享超过100万美元的奖金。
现年22岁的法里托说:“我当时就想,天哪,我必须参与这个项目。这件事有很多吸引人的地方,最吸引人之处在于你有可能会发现一个来自古代世界的新图书馆,这可是一件了不起的事。”
主修计算机科学的法里托把自己的每个夜晚和周末都投入到维苏威挑战赛中——这有点像时间旅行。这份来自赫库兰尼姆别墅的卷轴据信曾属于凯撒大帝的岳父,它究竟说了些什么呢?
为找出答案,参赛者必须开发自己的程序,解释卷轴的3D扫描图,描绘出微妙的物理变化,识别烧焦材料上的文字。
法里托首先研究了CT扫描图像中的部分区域,但在这些区域中,碳基墨迹在碳化的纸莎草上难以识别。另一名参赛者——该比赛为分享早期结果的参与者提供现金奖励——观察到类似干泥的“裂纹”模式,这可能表明墨水的存在。于是法里托训练了一个机器学习模型,专注于研究裂纹纹理。
一个周六的深夜,回到内布拉斯加大学的法里托得知,卷轴的一个新部分已经上传给参赛者。他当时在参加派对,他用手机登录到桌面并让他训练的人工智能模型处理新图像。几小时后他查看手机,突然看到跨越千年时光的希腊字母π、ο和ρ在向他闪烁。
法里托说:“我意识到,天哪,我刚刚发现了来自罗马帝国的三个新字母,那是一个多么酷的时刻。我惊呆了。其他人也惊呆了。我把它发给了组织方。我还把它发给了我的妈妈。”
这些字母原来是希腊语“紫色”一词的部分字母,法里托成为自这个卷轴被埋在数十英尺火山灰下后第一个见到这个卷轴上单词的人。
这个卷轴是18世纪回收的大约1000个卷轴中的一个。当时挖井工人发现了这座位于现代小镇埃尔科拉诺下的别墅。学者们说,这批藏品很可能来自伊壁鸠鲁学派哲学家和诗人菲洛德默斯的希腊语图书馆。但他们怀疑,在尚未挖掘的别墅里,可能有一个更大规模的拉丁语图书馆。
这些藏品可能包含了希腊和罗马历史、哲学和文学中遗失的名著。研究古希腊和罗马的历史学家加勒特·瑞安说,即使没有更多的卷轴被发现,“这仍将改变我们对古代世界的理解”。但如果人们找到图书馆所在,它就将是“古典学领域的一场深刻革命”。
肯塔基大学计算机学教授布伦特·西尔斯与科技投资者纳特·弗里德曼、丹尼尔·格罗斯共同创立了这次维苏威挑战赛。西尔斯和他的实验室在墨迹识别和数字解包方面做了开创性工作,参赛者正是在此基础上继续的。通过发起这场比赛,他们似乎为这种非侵入性历史调查增加了更多的紧迫感、集体智慧和支持。
法里托在“紫色”一词上的突破只是开始。为取得尽可能多的进展,法里托和其他两名参赛者组了队。后来,他们在今年早些时候赢得70万美元的大奖,因为他们从卷轴中读出15列文本,超过2000个字符。他们提交的成果远远超过挑战赛最初的目标,即读出四段文本,每段140个字符。
三个人使用人工智能的方法略有不同。和法里托一样,28岁的团队负责人优素福·纳德尔——在柏林攻读人工智能和机器学习博士学位的埃及人——专注于提高墨迹识别水平。纳德尔没有从人工识别裂纹纹理开始,而是用从损坏卷轴的碎片上找到的墨迹来训练他的模型。纳德尔的工作使得字符的渲染更加清晰、精确。
团队成员朱利安·席利格29岁,是一个来自瑞士巴塞尔的计算机科学家,他致力于用数字化的方式“展开”卷轴。卷轴层在3D扫描的数千个横截面中是可见的,必须通过横截面来描绘出单独的层,然后经过数字化“压平”处理——这本身就是一个劳动密集型的过程。席利格开发了一种使用人工智能来自动化处理这个过程的方法。他创建了一个模型,可以识别扫描图中的哪些点在卷轴层的段落上是相邻的。他说:“这就像一个惊喜时刻,你可以自动完成。”
欣喜若狂的纸莎草学家们认定,该团队展示的几列文本是对于愉悦的一段思考,很可能是由菲洛德默斯所写。其中一段话写道:“对于食物而言,我们不会立即相信稀缺的东西绝对比那些富足的东西更令人愉悦。”
目前所取得的进展让古典学界感到兴奋,学者们急切地想知道这些复原的遗迹还有什么要说的。英国牛津赫库兰尼姆协会主席罗伯特·福勒说:“当我们第一次看到人工智能展示的文本时,这简直是一个让人大开眼界的时刻。现在能够做到这一点,能够跨越千年时光,浏览一本书乃至一整个图书馆……这是与永恒相连。”(编译/涂颀)
美国《国家地理》杂志11月号封面