很多工业企业,特别是类似能源、化工、冶金、钢铁、医药等流程行业,以及类似半导体、电子信息、汽车等高度自动化的离散行业,已经通过巨额的投资形成了自动化的装备、产线乃至工厂,实现了生产过程从单元级别到工厂级别的自动化和一定程度的无人化,极大的提高了生产的效率和产能。
同时,为了提高管理的规范性和运营效率,很多企业也投资建设了包括MES、ERP、SCM、CRM等数字化的业务系统,将企业的不同部门通过统一的业务系统串联起来,极大的提高了运营的效率。
但是,我们仍然可以看见,我们国家的绝大部分工业企业都处于大而不强的局面,即使在投资规模和人员规模上都远远领先于世界其他国家的同行业竞争对手,我们的企业在生产的效率、产品的品质、能耗及安全等关键指标上,以及在企业的经营利润及人均产出上,与世界一流企业还存在着巨大差距。
在这种资产和知识密集型的行业,投资行为只能拉动产能,无法提高生产效率、产品良率、降低能耗和风险,更无法从日常的人员和流程管理中产出效益。
如何走向世界?对标和超越世界一流企业?这是所有的优秀工业企业决策者都在思考的问题。
大家自然都会联想到工业智能化,通过建设是智能工厂来提高效率、提高产品质量和降低损耗,进而提高运营效率、利润和人均产出。
那什么是工业的智能化?工业智能化需要具备什么基础条件?如何开展?未来是什么呢?如果要问工业企业对智能化的理解,估计100个企业有100个答案。
我们也看到很多企业上线了很多智能工厂的项目,但是仔细分析,这些智能工厂大部分都还只是在MES、APS、EMS、AGV和机器视觉上进行建设,都只能称之为数字化工厂,离真正智能化的目标还有相当大的差距。
智能化不是自动化,因此绝大部分以替代人的自动化行为都不能称之为智能化,比如机器人、AGV、AOI,原则上都不能算作智能化,而只能是利用了智能的手段实现了自动化的机器换人。同时,数字化更不是智能化,它只是将原本生产过程中需要记录的内容,比如人员的行为、机器的状态、物料的调配、排程的分配等,通过数字化的方式(IT系统)固化下来,降低人员的操作失误,提高生产过程的标准化程度,减少由于信息封闭造成的决策延迟和失真,并进而提高生产和运营管理效率。
我们理解的智能化,是具备如下特点的:
上下文的全面感知、精确理解、自主判决、自动执行
如何理解这些特征?我们以最近非常讨论的通用人工智能为例来讨论。
早期的人工智能主要包括以下几类:
■ 规则驱动系统:依赖预定义的规则和逻辑,缺乏灵活性和适应性。例如,专家系统。
■ 传统机器学习:依赖于特征工程和经典算法,如决策树、支持向量机等,处理能力有限,依赖大量标注数据。
■ 早期神经网络:多层感知机(MLP)、卷积神经网络(CNN)和循环神经网络(RNN)等,虽然引入了深度学习,但在处理自然语言方面效果有限。
通用人工智能AGI,是指具有与人类类似的通用智能,能够理解、学习和应用广泛知识领域中的知识和技能,处理新问题和情境。AGI的目标是超越当前专用AI系统的局限,实现真正意义上的智能。
AGI的发展涉及以下几个方面:
■ 自主学习:AGI需要具备自主学习和适应能力,能够在未知环境中自主发现和解决问题。
■ 广泛知识整合:能够综合不同领域的知识,进行跨领域的推理和决策。
■ 人机互动:实现更加自然和智能的人机交互,包括情感识别、语言理解等。
早期的人工智能,无论是机器视觉、还是语音识别,亦或是类似Boston Dynamics在内的机器人,都只能在人的理解范围内、或者不超出人的预期范围内帮助人提高效率,基于神经网络和机器学习算法,实现了对特定场景的识别和判决,但离替代人进行主动判决还相去甚远,比如机器视觉只是减少了人员检出缺陷的失误,而机器人不会根据场景的变化主动作出判决和调整。
但是在以OpenAI GPT为代表的现代AI推出来之后,情况就发生了巨大的变化,朝着通用人工智能前进了一大步。
GPT和现代AI利用大规模深度学习模型,通过大量数据进行训练,具备强大的表示和学习能力。使用自监督学习方法,不需要大量标注数据,仅通过海量文本数据进行训练,显著提升了模型的通用性。同时,引入了Transformer架构,具有更好的并行计算能力和长程依赖处理能力,相比传统RNN有明显优势。
GPT-3.5是一个里程碑的产品,是OpenAI在GPT-3基础上进一步改进的版本。它在以下方面有显著提升:
■ 规模和性能:模型参数增加,训练数据更多,提升了理解和生成文本的能力。
■ 语言理解:更好地理解上下文,提高了对复杂查询的响应能力。
■ 多任务处理:能够处理更广泛的任务,包括问答、翻译、文本生成等。
GPT-4、GPT4o则在以下方面进行了进一步的改进:
■ 多模态能力:不仅限于文本,还可以处理图像、音频等多种数据形式。
■ 长程记忆:改进了对长文本的处理能力,可以记住更长时间内的上下文信息。
■ 推理能力:更强的逻辑推理和决策能力,使得它在复杂问题上的表现更加出色。
从GPT-3.5到AGI的发展体现了人工智能在模型规模、处理能力和应用广度上的巨大进步。相比于早期的规则驱动系统和传统机器学习,以GPT为代表的现代AI更具灵活性和适应性,正在高速向通用人工智能的目标迈进。
这种演进已经不是按年为单位,而是每个月都在涌现出一些新的、令人惊喜的进步。
以机器人为例,2024年初,具备了GTP4o能力的机器人Figure01面世了。
在视频中,机器人根据人类的口头指令执行了一系列简单的抓取和放置动作,例如将苹果递给人类、将塑料袋放入篮子中,以及将杯子和盘子放置在架子上。在整个交互过程中,机器人与人类之间的对话十分流畅,尽管在反应速度方面与真人仍存在一定差距,但显然已经取得了显著的提高。
Figure01的开发公司Figure AI称,Figure 01现已能够与人类展开全面对话,更关键的是,视频中机器人的所有行为均为自主学习所得,并非远程操控。而这背后,不仅有Figure AI引以为傲的“端到端”神经网络技术,还有OpenAI强大的大模型作支撑。目前,Figure AI已经成功研发出五款人形机器人原型,旨在解决仓储、物流和制造行业劳动力短缺的问题。
可以看到,不同于Boston Dynamics这样只是在执行机构上实现突破的机器人,Figure01已经具备了上下文的全面感知、精确理解、自主判决、自动执行的全部能力。它可以清晰的识别出来物体的类型,根据场景的判断决定物体的归属,并根据问答执行相应的动作。
可以想象,在很多科幻电影中出现的未来世界,已经离我们不远了,我相信在不久的将来,具备通用人工智能的各类机器人,无论是家庭、医院、教育、交通、酒店等,甚至军事、航空航天、乃至工业生产上,都会以极快的速度、以不同形态的方式诞生。
回到工业上来,基于对通用人工智能AGI的理解,我们认为工业的终极目标也是类似的形态,即具备上下文的全面感知、精确理解、自主判决、自动执行的全部能力。从极端的形态上来说,可以把一个智能工厂理解一个巨大的机器人,人只要发指令,智能工厂自动会理解、判决和执行,并不断找到优化的空间,而中间不需要人的任何干预行为,这才是真正的智能化。
是不是设想起来很好?但是现实是残酷的。我们下一节再讨论。
作者:寄云科技CEO 时培昕