当前位置:首页|资讯|人工智能|机器学习

北太天元: 从人工智能视角探讨社会科学研究的量化挑战

作者:北太天元卢朓发布时间:2024-08-20

摘要

本文旨在探讨机器学习等人工智能技术在社会科学研究中的应用潜力及其局限性。通过分析机器学习的基本范式,指出其在处理模式化行为方面的有效性,同时揭示了在处理非模式化、缺乏深层思维及整体性思考方面的困境。结合社会学理论,特别是马斯洛需求层次理论和涂尔干的世俗与神圣领域划分,本文进一步论证了人工智能在社会科学研究中的适用范围与限制,并提出将定性讨论转化为定量分析的必要性。

1. 引言

人工智能,尤其是机器学习,作为数据处理与分析的强大工具,在社会科学研究中展现出巨大潜力。然而,其应用并非无所不能,本文旨在通过量化分析框架,探讨其在社会科学研究中的具体效用与局限。

2. 机器学习范式及其在社会科学研究中的应用

D%3D%5C%7B(x_1%2Cy_1)%2C(x_2%2Cy_2)%2C...%2C(x_n%2Cy_n)%5C%7D,其中 x_i 表示输入特征,y_i 表示输出结果。机器学习任务是通过学习算法 A,找到函数 f,使得 f(x)y。在社会科学中,若行为模式高度一致,如理性选择理论下的投资决策,机器学习能有效预测(如线性回归、决策树等算法)。

除了简单的预测任务,如线性回归或决策树算法在理性选择理论下的投资决策中的应用,机器学习还能够处理更复杂的数据结构和关系。例如,当数据包含时间序列、网络结构或文本信息时,机器学习算法如循环神经网络、图神经网络或自然语言处理技术可以被用来捕捉这些复杂数据中的模式和动态。

此外,机器学习还可以用于社会科学中的分类任务,如将个体划分为不同的社会群体或行为类别。聚类算法和分类算法(如支持向量机、随机森林等)可以根据个体的特征将其分组,并揭示不同群体之间的行为差异和相似性。

更重要的是,机器学习还可以帮助社会科学研究者进行因果推断。传统的统计方法往往依赖于严格的假设和模型设定,而机器学习算法则能够通过探索数据中的复杂关系和模式来发现潜在的因果关系。例如,使用集成学习方法或深度学习模型,研究者可以分析大量观测数据,识别出影响社会行为或态度的关键因素,并估计它们的因果效应。

机器学习范式在社会科学研究中具有广泛的应用潜力,不仅限于简单的预测任务,还包括复杂的数据分析、模式识别和因果推断等方面。随着机器学习技术的不断发展和数据的日益丰富,它在社会科学领域的应用前景将更加广阔。

3. 机器学习的局限性与社会科学的挑战

3.1 模式化困境

很多人文学者认为,将人工智能应用到人文学科中存在困难,其中一个首要的困难便是机器学习的模式化分析范式。他们可能会举出这样的例子:当询问机器“1+1等于几”时,机器能迅速回答“等于2”。然而,如果告诉机器,这里的“1”实际上代表的是“一群人”,那么面对“两群人合并在一起是什么”的问题,机器就无法给出像人类那样的答案了。人们会自然地回答“还是一群人”,但机器却难以理解这种基于生活经验的理解。

然而,我认为,尽管这是一个挑战,但它并非不可逾越的鸿沟。问题的关键在于识别和处理语言中的含糊性。以“一群人”为例,我们需要明确“群”的定义是什么,以及“合并”的依据和规则是什么。一旦我们明确了这些概念和规则,就可以通过编程和算法,让机器学会理解和处理这类问题。例如, 我们可以考虑所有人组成的一个集合是一个全集, 一群人是指的一个由人组成的集合(这是全集的一个子集), 另一群人也是由人组成的集合(也是全集的一个子集), 这里的两个集合的和定义成两个集合的并集, 自然按照这个规则就有1+1 = 1 了, 这是很自然的, 人文学者往往认为人工智能(数学,计算科学,机器学习) 的加法都是实数的加法, 但是学习了线性代数的人工学者都知道, 我们可以定义各种各样的集合, 然后也可以定义各种不同的"加法". 

通过学科交叉的方式,我们可以结合人文学科的深厚底蕴与人工智能的先进技术,共同探索如何解决这类含糊性问题。我们可以借鉴语言学、社会学、心理学等领域的理论和方法,为机器提供更加丰富和多样的语境和背景信息,帮助其更好地理解和解释人类语言中的含糊和不确定性。

因此,虽然模式化是一个挑战,但我相信,通过跨学科的努力和探索,我们有能力克服这一困难。我们有望找到一种更加智能、更加人性化的方法来处理这类问题,从而推动人工智能在人文学科中的更广泛应用。


3.2 深层理解不足

人工智能在处理社会问题时所面临的第二个困境是深层理解不足,这是一个值得深入探讨的话题。目前,文本学习技术相当流行,尤其在情感分析方面取得了一定成果。然而,这种分析仍相对机械,主要依赖于特定词汇的计算特征,如词汇频率、词性标注和依存关系等,来推断作者的情感倾向。尽管如此,这种方法往往忽略了文本的上下文信息和语义关系,可能导致对文本情感的理解不够准确。同时,由于语言的多样性和复杂性,机械的分析方法往往无法捕捉到不同语境下词汇情感的细微差别。因此,使用这种技术所得到的信息往往只是非常初步的,很难捕捉到文字背后的深层含义和作者的真实意图。从而,我们需要认识到这一局限性,并不断探索和发展更先进的技术和方法,以提高情感分析的准确性和可靠性,同时结合人类的语境理解能力和语言经验进行验证和修正。

对于社会科学而言,深入解析一段文字,往往能够揭示出作者隐藏在字里行间的真实想法,这远非仅仅分析表面的词频或文字使用模式所能达到。这一特性给人工智能带来了巨大的挑战,因为若仅依赖这些浅显的特征,它很难准确区分作者的真实意图与反讽等修辞手法之间的差异。实际上,即使是由人来解读,我们所能理解的“作者的真实想法”也未必就是作者的原意。

历史上的文字狱案例数不胜数,很多文字作品因为被误解或曲解而导致了不幸的后果。试想,如果让人工智能去解读“清风不识字,何故乱翻书”这样的诗句,恐怕很难领悟到其中蕴含的“反清复明”的深层含义, 但是清朝的统治者就读出来了, 而且造成了严重后果。这提醒我们,在解读文本时,无论是使用人工智能还是人类自身的智慧,都需要保持谦虚和谨慎的态度。因此,无论是人工智能还是人类本身,也有其独特的价值和局限性,  在解读文本时应该更加谦虚和审慎,要关注文字的表面意义,还要深入理解作者的意图和作品的历史背景(但是在这个地方尤其需要谨慎)。

实际上,我小时候读到过很多由于语言歧义造成的笑话。比如,“无鸡鸭也行无鱼肉亦可”这句话,在古代没有标点符号的情况下,就容易造成歧义。如果我们把这句话加上标点符号,变成“无鸡,鸭也行;无鱼,肉亦可”,意思就变得完全不同了。因此,作为作者,我们应该在把文章输入人工智能之前,先自己检查一遍,看看是否有可能的歧义,并尽量消除它们。实际上,我们人类也经常会被一些含有隐喻、反讽或模糊表达的文章所迷惑。无论是高级黑还是低级红的文章,都可能让我们难以判断其真实意图。因此,一方面我们需要不断提高人工智能的能力,让它能够更好地理解和分析文本;另一方面,我们也需要认识到这并不是人工智能独有的问题,而是人类语言和沟通的复杂性所带来的共同挑战。

因此,  这里引出了一个有趣的观点:我们可以通过人工智能对文章的作者提出更高的要求。要求他们在写作时尽量减少歧义,让文章更加明确、无歧义地传达真实意图。这样不仅可以提高人工智能的理解能力,也有助于我们人类读者更准确地理解文章的含义。

3.3 缺乏整体性思考

人工智能往往缺乏整体性、系统性的思考。与人类的统筹功能相比,人工智能目前更擅长于处理特定任务,而在需要跨领域、跨任务进行整体性思考方面还存在明显不足。这一点在将人工智能应用于企业团队时尤为明显,例如在选择团队成员时,虽然可以通过算法和数据找到最好的技术人员和管理人员,但人工智能却难以判断这些最好的人员能否有效配合,产生良好的化学效应。

然而,我们也需要认识到,随着人工智能技术的不断发展,特别是在机器学习、深度学习等领域的进步,人工智能已经在一定程度上具备了模拟和预测复杂系统行为的能力。DSGE模型就是一个很好的例子,它涉及多个经济要素之间的相互作用和动态调整,人工智能可以通过学习和模拟这些要素之间的关系,来预测经济系统的整体行为。虽然目前可能还无法完全替代人类的判断,但人工智能在社会科学研究中的应用已经逐渐展现出其潜力和价值。

同时,我们也应该明确,人与人之间的联系以及这种联系所产生的“社会”的社会结构、社会现象或社会规律是社会科学研究的核心。人工智能在这些领域的应用需要谨慎和审慎,以确保其结果的准确性和可靠性。这并不意味着我们应该完全排斥人工智能在社会科学研究中的使用,而是应该积极探索人工智能在社会科学研究中的新方法和新应用,同时也需要注意保持对其局限性和风险的清醒认识。

3.4  对非理性部分考虑不足 

人工智能在设计和发展过程中,主要基于理性思维和逻辑规则。这在一定程度上限制了其对人类非理性部分的考虑,但并不意味着人工智能完全无法考虑到人的非理性部分。以下是对这一问题的详细分析:

首先,人工智能的核心在于算法和逻辑规则,这些规则和算法往往基于数学、统计学和形式逻辑等理性科学。因此,人工智能在处理问题时,更倾向于采用逻辑推理和数据分析的方法。同时,人工智能系统通常被设计为具有明确的目标,并通过优化算法来寻找实现这些目标的最佳路径。这种目标导向的方法使得人工智能在决策过程中更加注重效率和效果,而非情感或直觉等非理性因素。

其次,人类的非理性部分往往涉及认知偏差、情感反应和直觉判断等方面。由于人工智能缺乏真实的情感体验和主观意识,因此很难完全模拟人类的非理性思维和情感反应。此外,人工智能的决策和行为基于输入的数据和信息,但在现实世界中,许多非理性行为往往难以用数据来准确描述和量化。因此,人工智能在处理涉及非理性因素的问题时可能存在一定的局限性。

然而,值得注意的是,人工智能领域正在尝试考虑非理性部分。近年来,情感计算成为该领域的一个研究热点,通过情感计算技术,人工智能可以识别、理解和模拟人类的情感反应,从而在一定程度上考虑非理性因素对人类行为的影响。同时,随着机器学习技术的不断发展,人工智能系统逐渐具备了更强的自适应和学习能力,可以通过学习人类的行为模式和决策过程来更好地理解非理性因素的作用和影响。此外,人工智能领域正与其他学科进行交叉融合,如心理学、神经科学等,这些跨学科研究有助于人工智能更深入地理解人类的非理性思维和情感反应。

虽然人工智能在设计和发展过程中主要基于理性思维和逻辑规则,对非理性部分的考虑相对有限,但随着情感计算、机器学习等技术的不断发展以及跨学科研究的深入推进,人工智能正在逐渐尝试考虑人类的非理性部分,并在实际应用中展现出更加全面和智能的表现。

4. 将人文学研究与量化分析、人工智能相结合的挑战与潜力--以婚姻为例

探讨婚姻这一复杂社会现象时,我们面临着诸多挑战。婚姻不仅涉及经济利益等功利性考量,更关乎双方的爱情基础,这是一种神圣且不可妥协的存在。马斯洛的需求层级论为我们提供了一个理解婚姻中多元需求的框架:从基本的生理需求、安全需求,到更高层次的社会需求(归属与爱)、尊重需求,乃至最高层次的自我实现,婚姻中世俗与神圣的元素并存,交织成一幅复杂的需求图谱。涂尔干提出的“神圣世界与凡俗世界”的二元划分,在此也得到了体现——有些人更看重爱情这一神圣元素,而忽略经济利益等世俗考量;反之亦然。然而,一个普遍共识是,仅用理性计算来衡量婚姻是无法把握其本质的。

在这里,我们可以看到人工智能技术的应用潜力,但同时也必须认识到其局限性。显然,在涉及理性计算时,人工智能可以出色地进行推理和预测,但这种预测仅限于世俗领域的功利性考量,而无法触及神圣领域的爱情、情感等超验价值。换句话说,对人类理性计算的仿真和程序设计,在面对如爱情般神圣不可量化的价值时,显得力不从心(一般人也力不从心)。

实际上,将人文学者的研究方法与量化分析、计算机科学以及人工智能相结合,是一个极具潜力的研究方向。这样的跨学科合作有望使人文学者的研究成果更加明确、可衡量,并推动研究的深度和广度。然而,这样的转化并非易事。人文学者的研究常常涉及复杂的情感、价值观、道德判断等主观因素,这些因素难以用简单的数学模型或算法来准确描述和量化。正如涂尔干所强调的神圣与凡俗的二元性,人文学者研究的神圣领域往往超越了理性计算的范畴。

回顾历史,天气预报的演变为我们提供了一个有益的启示。古代的道士通过做法求雨并预测天气,但往往不准确,因为他们所使用的因素难以量化。然而,随着科学的发展,现在的天气预报已经变得相当可靠,因为我们已经能够识别并量化影响天气的主要因素。这一转变并非一蹴而就,而是经过了长时间的探索、实验和验证。

同样地,将人文学者的研究成果转化为可量化、可计算的模型也是一个需要不断探索和实验的过程。面对马斯洛需求层级论中提及的多元需求以及涂尔干的神圣与凡俗二元划分,我们应该保持开放和积极的态度,鼓励跨学科的合作和探索。通过不断地积累数据、改进模型和算法,并经过长时间的验证和完善,我们有望逐渐建立起能够真实反映人文学者研究意图和核心价值的量化模型。这将为人文学研究带来新的突破和发展,并有助于我们更深入地理解和应对如婚姻般复杂的社会现象。

层次分析法通常涉及构建一个层次结构模型,其中包含目标、准则和子准则等层次,并通过比较判断矩阵来确定各层次因素的相对重要性。使用层次分析法(Hierarchical Analysis)来评估择偶对象, 下面是北太天元代码

在这个例子中,我们首先定义了世俗利益和神圣性两个准则层,以及它们各自的子准则和权重。然后,我们为每个男性在子准则层下进行了评分,并计算了他们在每个准则层下的加权得分。最后,我们将准则层的权重应用于加权得分,以计算每个男性的最终得分,并进行排序。

这个模型可以根据您的具体需求进行调整,比如修改子准则、权重或评分。




5. 结论与未来方向

本文通过分析机器学习的局限性与社会科学的特性,指出在社会科学研究中,应结合定量与定性方法,审慎应用人工智能技术。未来研究可探索混合模型,结合机器学习与传统统计方法,以及开发能够处理非模式化、具备深层思维与整体性思考能力的新型算法。


图片来自网络



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1