像印度河文字和伏尼契手稿这样的古代文字几十年来一直困扰着学者们,一些研究人员认为人工智能系统可以帮助揭示它们的秘密。
大约4000年前,生活在印度河流域的古代文明占世界人口的10%。虽然关于这群人的记录很少,但考古学家发现他们足够先进,有自己的文字系统,这仍然有待破译。
这种神秘的文字被称为印度河文字,几十年来一直困扰着学者、语言学家甚至密码学家。只有几百个符号被分类,因为科学家们还没有发现破解这种未知语言的方法。但最近人工智能的进步,包括ChatGPT这样的大型语言模型可能会改变这一点,让我们对古代文明有了进一步的了解。
虽然印度河流域文明在20世纪20年代被正式发现,但直到1999年,它的第一批手稿才被出土。印章、陶器、甚至骨头上都刻有奇怪的符号和动物形象。这些复杂的铭文使这一发现更加诱人,将这个复杂社会的秘密置于触手可及之处。
微软应用机器学习科学家说:不久的将来人工智能将帮助我们更多地了解这个古老的文明、他们的生活方式和对世界的了解。
利用自然语言处理的最新优势,特别是像ChatGPT-3和ChatGPT-4这样的大型语言模型,我们可以尝试对我们认为源自印度河文字的语言进行破解或提供更多上下文,比如婆罗门文字。看看这些生成模型是否能弄清楚每个符号的含义,以及它们如何融入语言结构。
在2018年的一篇论文中,两名科学家发现,根据他们使用的人工智能算法,印度河文字的符号与腓尼基字母的某些字符相似,准确率为90%。
与印度河文字不同,被称为伏尼契手稿的神秘中世纪晚期文本为考古学家和语言学家提供了大量的字符进行分析。这本书写于600年前的240页文本由25到30个未知字母和字符组成。在这本书的页面上,还有126幅看起来像外星植物的彩色插图,其中124幅已经根据植物的花、叶或根结构进行了植物学上的鉴定。
类似的过程还没有完成手稿的语言,自1912年发现以来,它一直困扰着密码学家和语言学家。
其他学者认为,手稿是作为密码写的,甚至可能是一个拼字构词,这使得破译它变得更加困难。对于这种困难来说,就是人工智能算法可能会有所帮助的地方。
比如一个很长的密码,你可能会注意到P后面总是跟着D。你可能会猜P和D分别代表Q和U,因为QU在英语中就是这么说的。一旦你知道D代表U,你可能会寻找与U相关的模式。而计算机可以比人更快更好地进行推理。”
然而,伏尼契手稿中编码的中世纪语言可能是英语、法语或拉丁语的旧版本,这使得破译更加棘手。
伏尼契手稿和印度河流域手稿是最复杂的语言谜题之一。因此,世界各地的许多学者无疑将焦急地等待人工智能的进步,这可能有助于揭示这些古代文本背后的秘密。