大模型时代下的决策范式转变

创建时间:2023-10-19 17:20
源自:《中国地质大学学报(社会科学版)》    

作者:何赛克  张培杰  张玮光  於世为  曾大军

摘 要

OpenAI 发布的新一代对话型语言模型——ChatGPT,展现了自然流畅的对话能力。原本被认为不太可能的通用人工智能曙光重现。以ChatGPT 为代表的大模型是数智时代的典型技术和应用创新。面对ChatGPT 强大的信息加工、荟萃、整合和生成能力,信息资源管理学科机遇与挑战同在。ChatGPT 在信息资源管理支撑算法与技术、信息资源建设、信息组织与信息检索、信息治理、内容安全与评价、人机智能交互与协同等方面都具有深远的影响。数智时代,人工智能大模型飞速发展,我们有必要对此保持密切关注。依托以ChatGPT 为代表的大模型,通过学科技术应用范式转换、理论方法创新、治理变革,可以进一步夯实信息资源支撑“四个面向”的基础。

关键词

ChatGPT;大模型;信息资源管理

一、引 言

当前人工智能的国际技术前沿,已经从以AlphaGo为代表的算法智能 (Algorithmic Intelligence,AI)进入到以ChatGPT 为代表的语言智能 (Linguistic Intelligence,LI)阶段[1]。ChatGPT、GPT-4等大模型类产品的相继发布,表明一场颠覆性的变革正在到来。在通往通用人工智能(Artificial General Intelligence,AGI)的道路上,ChatGPT、GPT-4并不是终点,而是通往未来想象智能 (Imaginative Intelligence,II)新时代的起点。它们将如何颠覆和影响既有管理和决策范式,已经成为学术界和产业界高度关注的焦点问题。

 

针对大模型的决策能力,学术界已经进行了多维度评估。2023年, 《自然》杂志发文研究了ChatGPT 对用户道德判断和决策的影响[2]。同年,《美国国家科学院院刊》发表了一篇关于GPT-3认知心理研究的论文,该工作将GPT-3当作心理实验受试者,研究了其独立判断能力和决策能力[3]。针对决策大模型的构建方式,学术界也已进行了多种尝试和探索。2022年5月,Deep Mind发布了一个集成了计算机视觉和自然语言处理技术的通用智能体Gato,该模型可以完成600多个视觉文本和决策任务,其中450 个任务的表现超过了专家水平的50%。2022 年12 月,Enigma Tech发布了一款人工智能决策模型DB1,该模型集成了计算机视觉、自然语言处理、强化学习和多智能体等技术,能够面对单智能体和多智能体进行决策判断。此外,该模型还具备泛化迁移能力,支持并发处理上千个决策任务。在产业界,大模型的研究成果已经催生了一些决策软件的问世。例如,基于ChatGPT 技术开发的产品Rationale,旨在提高决策效率,用户只需输入想定的决策方案,Rationale就能快速生成一份专属的决策评估报告。

 

我国高度重视决策智能技术的发展,并进行了一系列前瞻性部署。在 “十四五”规划中,国家自然科学基金委 (以下简称 “基金委”)将 “决策智能”作为优先发展领域,并将 “政策智能理论与方法研究”写入指南。为深入研究政策智能及其与决策智能的联系,2020年10月,基金委第260期双清论坛“政策信息学与政策智能”召开。政策智能与人工智能领域前沿学科方向——决策智能有着深刻的联系,决策智能是发展政策智能的前提和基础,而政策智能为决策智能提供了重要的应用场景。此外,为促进决策智能领域的学术交流,中国科学院自动化研究所分别于2020年和2022年举办了智能决策论坛,旨在探寻更高效、具有认知特性的决策智能发展方向。

 

在当今技术-经济-社会环境中,决策制定与分析面临着与以往截然不同的情境,这些情境呈现出多维交互和全要素参与的特点。事实上,现有的决策情境实际上构成了一个复杂的社会物理信息系统 (Cyber-Physical-Social System,CPSS)。在这个系统中,决策环境、决策主体和受众的认知行为等要素错综关联、高度复杂,这导致此类系统往往不具有可分离性 (Separability)[4],即它们不能被充分描述为独立成分的总和,因此无法通过传统的还原论 (Reductionism)进行合理分解、独立分析和智能重组[5][6]。由此,依赖可分离性作为关键先决条件的传统决策方法 (如分步决策[7]和序贯决策[8])在这类系统中将不可避免地失效。

 

然而,以ChatGPT 为代表的大模型技术的发展,有望颠覆既有决策范式,推动学术界和产业界进一步探索AIGC (AI Generated Content,人工智能内容生成)到AIGD (AI Generated Decisions,人工智能决策生成)的可能性。AIGD 技术将使模型的思考能力和决策能力应用到具体场景中,将人类从繁琐的决策工作中解放出来,让人们更加专注于创造性的活动。

 

本文在系统化梳理大模型技术能力和决策范式发展里程碑的基础上,认为未来决策范式将发生四个方面的转变:数据来源转变、决策生态转变、决策模型转变及决策主体转变。针对这些转变,本文提出了未来应对的建议,旨在充分利用智能决策时代的大模型新基建,将大模型深度应用于决策场景。

二、决策的时代里程碑

基于对决策技术演进的特征分析,本文将决策的发展分为三个阶段 (如图1所示):经典决策(Empirical Decision-making,ED)、计算决策 (Computable Decision-making,CD)及智能决策(Intelligent Decision-making,ID)。经典决策是一门综合性学科,建立在现代自然科学和社会科学基础上,它源于1959年赫伯特·西蒙正式提出的决策科学,其研究内容包括决策原理、决策过程和决策方法等[9][10][11]。经典决策的典型特点是以内部决策数据 (如经验数据和业务数据等)的统计为主,基于规则进行决策。计算决策始于2011年大数据技术爆发,它是信息科学、数据科学和公共管理交叉融合的新兴学科,研究决策者、受众、环境及其相互作用[12][13],其典型特点是开始将内部决策数据和外部大数据 (如互联网数据和第三方数据等)进行结合,以提高决策的准确性和效率。智能决策始于2022年ChatGPT 类技术的成熟,它将ChatGPT 类技术体系化地嵌入决策制定、分析、实施及反馈流程中,以实现更加智能、高效的决策。通过人机深度融合的方式,智能决策以更加主动、全面的视角,面向未来可能出现的场景和情境进行积极深刻的知识贯通、动态推演、前瞻分析及决策进化。

 

图1 决策的时代里程碑

 

ChatGPT 类大模型技术是智能决策时代的新基建和核心驱动力,推动了决策范式的转变。因此,在详细介绍决策范式转变前,本文将先介绍大模型技术的成功要素和能力。

三、Chat GPT 的成功要素和能力

ChatGPT 是一款由Open AI开发的通用人工智能生成模型。该模型在GPT 系列模型的基础上进行了改进,并通过大量的训练数据进行监督学习以提高其输出质量。同时,ChatGPT 还使用了基于人类反馈的强化学习技术,以产生符合用户意图的文本内容。作为一项技术密集型、人力密集型及算力密集型的产品,ChatGPT 的成功要素主要体现在三个方面:大模型技术的大规模集成、人机协同下的群体智慧涌现以及大数据与大算力的支撑。

(一)大模型技术大集成

ChatGPT 的产生并非来自科学的飞跃,而是大模型发展中的技术积累。ChatGPT 基于Transformer技术构建,高度集成领域长时积累并经过反复检验的预训练、指令学习及强化学习等技术。作为一种生成式语言模型,ChatGPT 本质上是执行自回归 “单字接龙”,通过先量后质的三阶段的训练过程,生成了遵循客观事实、符合人类偏好的高质量文本。这三个阶段分别是泛学阶段、矫正阶段和拟人阶段。在泛学阶段,ChatGPT 基于多样的文本进行无监督学习,从而获得了海量的知识。在矫正阶段,ChatGPT 使用优质的对话范例进行监督学习,以遵循人类指示回答问题。在拟人阶段,ChatGPT 利用基于人类反馈的强化学习技术,使模型可以自主产生创新性的回答,并生成符合人类认可的创意回答。

(二)人机协同群体智慧涌现

ChatGPT 采用了人机协同的训练方式,这种方式实现了人类和机器的优势互补和相互促进,激发了群体智慧的涌现和提升。在这种协同方式下,人类提供创造性、灵活性、主动性、道德性等高层次的认知能力,而机器提供高速度、高精度、高可靠性等低层次的执行能力。在ChatGPT 的训练过程中,人类整理了多来源、海量、优质的训练数据,为模型提供充分的学习素材。此外,人类通过撰写大量优质的对话范例、为模型生成的答案打分等手段与机器进行反馈交互,促使机器能够产生符合人类偏好的回答。

(三)大数据与大算力支撑

大数据具有规模庞大、类型多样及价值密度低的特点。大数据提供了更丰富多样的信息,覆盖了更广泛深入的领域,只有充分利用大数据,才能让大模型充分发挥其潜力。大算力是指高性能计算资源和技术,是大模型训练的保障和加速器,只有借助大算力提升计算效率和并行程度,降低计算成本和延迟,优化计算质量和稳定性,才能完成大模型的训练。大模型、大数据和大算力构成了正向反馈循环:大模型需要大数据来训练,而大数据又需要大模型来挖掘;大模型需要大算力来支撑,而大算力又需要大模型来驱动。大模型、大数据与大算力是人工智能技术发展的三大驱动力,这三者相互促进,共同推动了ChatGPT 快速发展和广泛应用。

 

ChatGPT 是目前公开的最大语言模型之一,约有1 750亿个参数,它的成功验证了通用人工智能的可行性,给多个行业带来了强烈的冲击,大量自然语言处理任务被解决,其强大的泛化能力和自然语言生成能力为各领域的发展带来了新的可能性。ChatGPT 的能力可以总结为四个方面:通顺流畅的语言生成、通用广泛的场景适应、通达全领域的知识覆盖和通畅自然的人机交互。

 

在通顺流畅的语言生成方面,与以往生成模型产生的机械、重复、答非所问的回答不同,ChatGPT 可以通过自然的对话方式与用户进行交流,无论是回答问题、提供建议还是聊天互动,ChatGPT 会尽量避免重复或使用模板化语句。同时,ChatGPT 还能够准确地识别省略、指代等细粒度语言现象,回答内容在连贯性、一致性、丰富性、事实性、趣味性方面表现良好。

 

在通用广泛的场景适应方面,ChatGPT 不是一个传统意义上的人机对话系统,而是一个以自然语言为交互方式的通用语言处理平台。在多个不同自然语言处理任务 (如机器翻译、信息抽取、文本分类、代码生成、小说创作等)中表现出良好的泛化性能,因此在广泛的应用场景中具有很大的潜力。与传统的人机对话系统不同,ChatGPT 具有零样本学习能力,可以在没有任何先验知识的情况下学习新的任务,这使得ChatGPT 更加灵活和可扩展,从而适应多种应用场景。

 

在通达全领域的知识覆盖方面,ChatGPT 具有强大的数据处理能力和知识表征能力,能够将文本数据转化为可计算、可推理、可交互的知识。其使用的海量学习样本涵盖问答网站、社交媒体、新闻、代码、百科全书、小说、诗歌、论文等多个领域,因此能够满足多元语言文化、丰富风格主题、多样问答场景的知识需求。由于数据多样性和模型复杂性,ChatGPT 几乎可以将全领域知识表示在模型参数中,这为实现跨语言、跨领域的知识互通提供了有力支持。

 

在通畅自然的人机交互方面,传统的对话系统随着交互轮次的增加,话题的一致性难以保持。然而,ChatGPT 具有强大的意图理解能力,可以进行大范围的上下文理解和推理,根据用户的输入和历史记录进行回答和引导,即使在多轮对话的场景下仍然能够实现流畅的交互。此外,当ChatGPT 回答错误并被指出时,模型能够迅速捕捉到用户的意图,准确识别需要修改的部分,从而进行正确的修正。

四、大模型赋能的决策范式转变

在科学哲学的范畴中,范式 (Paradigm)指的是对科学的总体观点,这种总体观点联结了科学共同体,并且允许常规科学发生的一系列共享的假设、信念和价值观[14][15]。大模型时代决策范式的转变主要体现在四个方面:数据来源、决策生态、决策模型及决策主体 (如表1所示)。

 

表1 决策范式的转变

 

(一)数据来源转变:从领域大数据到开放域大数据

大数据驱动的计算决策实现了内部数据和外部数据的结合,有效扩展了决策数据的维度。在当前决策新情境构成的复杂社会物理信息系统中,跨域 (如物理域、信息域及社会域等)和跨场景(如经济、社会、文化等)数据呈现出非线性耦合和复杂关联的特性。然而,计算决策往往聚焦于单场景或少数场景的大数据挖掘,忽略了跨域、跨场景数据中决策知识的关联分析。这切断了跨域、跨场景知识间的 “链之力”,破坏了知识网上所附加的额外知识,进而阻断了跨域、跨场景知识通道的语义激活,导致对决策数据的观察不全面、不清晰、不准确。相反,大模型对决策数据的统一表示和开放知识的自动抽取能力,可实现在智能决策过程中知识的细粒化、全息刻画及深度融合。最终,这种方法可以为决策智能提供充分支撑 (如图2所示)。

 

图2 数据来源的转变

 

另一方面,很多决策场景缺乏历史案例,小样本、低资源情景对传统决策范式造成了巨大冲击。依赖领域大数据的计算决策框架,可以基于当前领域数据中的知识挖掘能力,有效地处理部分已知的不确定因素[16][17][18]。然而,在面对未知的不确定因素时,难以从当前领域的知识空间向外拓展和泛化,并形成有效的应对策略,导致决策效果不够理想。大模型赋能的智能决策框架从系统观视角出发,将决策过程视为知识的跨场景迁移和赋能。通过大模型的跨域、跨场景的知识链接能力,实现目标场景的决策能力提升。此外,利用大模型技术体系中的强化学习和反事实推理等技术,可快速构建并实现目标场景的数据增强和动态增广[19]。

(二)决策生态转变:从人工生态构建到开放人工生态半自动化构建

决策内部要素 (决策主体、决策客体和决策目标等)和外部环境 (政治法律、经济社会、文化宗教、数据技术等)共同构成了一个交互演化的复杂动态系统,即决策生态。在大数据时代,构建决策生态对于基于大数据技术的计算决策至关重要。然而,既有决策生态的构建过程依赖大量人工先验知识,导致构建的决策生态具有明显的主观性、片面性及静态性。受限于生态构建者的背景知识和决策场景的理解,这种方法构建的人工决策生态通常包含与真实情况相悖的理论假设,决策要素难以确保完备,且难以确保主体交互过程持续更新和生态持续进化。相比之下,智能决策框架借助大模型的规模效应,可在跨域、跨场景数据中自动提取决策知识,并总结决策要素对决策效果的复杂关联。在决策生态构建过程中,可实现开放人工场景的半自动构建,并确保生态场景构建的客观性和合理性,保证生态要素的完备性和细致性、交互机制的非线性和时变性及决策推演的动态性和开放性 (如图3所示)。

 

图3 决策生态的转变

 

具体来说,大模型赋能的开放人工生态半自动化构建过程,能够在统一考量跨域、跨场景的决策案例和知识的基础上,形成目标场景的最优生态架构设计和表示。此种构建方式能最大限度地避免对人工先验知识的依赖,从而减少设计偏差的可能性。此外,大模型的自动化识别和量化建模技术能够实现生态全要素的有效筛选和测量精度的提升。同时,利用大模型的场景反馈式学习等技术,能够确保在决策过程中,人工生态持续接收外部影响信号并做出状态响应和转移,从而高精度模拟人机协同决策过程下的生态持续进化过程。

 

开放人工生态的半自动化构建能力,使得决策过程中的 “大前试+小后试”模式成为可能,在解决历史案例难度性不高的同时,大幅降低决策的试错成本。例如,在新能源汽车购置的补贴政策设置过程中,政府不会直接将不同的补贴政策放到真实消费市场上收集反馈。相反,需要先在一个最接近逼真还原的决策生态中进行模拟推演,通过决策推演产生数据,决策模型学习完后再放到真实场景中进行试点实验和收集反馈的信息。然后,将收集的反馈数据再作为模型输入数据进行学习,从而使得决策大模型能够快速将决策能力应用到现实场景中。这种半自动化构建的决策生态,能够有效提高决策的精度和效率,同时也减少了在真实场景中的试错成本。

(三)决策模型转变:从 “数据+学习”到 “知识+推演”

决策模型是描述和分析决策问题的核心工具。通过对决策环境、决策目标、决策影响等因素建模,决策模型帮助决策者在动态复杂环境中做出最优选择。在计算决策时代,决策模型主要采用线性规划、决策树、马尔可夫链等小模型进行决策。然而,随着人工智能的发展,ChatGPT 等大模型技术为决策模型设计提供了新的解决方案,促进决策模型从 “数据+学习”模式向 “知识+推演”模式转变 (如图4所示)。具体地,决策模型的转变主要体现在决策空间、决策过程及决策评估三个方面。

 

图4 决策模型的转变

 

在决策空间方面,小模型的决策方案来自经验空间,即基于已经观察到或者可以观察到的实际数据,通过领域知识和已知事实人工设计决策方案,模型在这些决策方案中评估优劣[20]。而大模型可以突破经验空间的限制,在更为广阔的想象空间探索决策方案,即基于大规模数据学习到的规律和决策目标进行决策方案的自主创新,从而扩展决策者的思考范围,弥补知识量不足的缺陷,使决策方案覆盖更多的可能性,更接近全局最优。

 

在决策方法方面,不同于小模型直接产生结果的单次决策,大模型采用和人类解决复杂问题相似的 “思维链”决策方法。大模型将复杂决策问题分解为多个中间问题,然后逐步解决。这种经过多步骤推理的方法可以为每项决策提供决策依据支撑,帮助决策者厘清问题的因果关系,使决策模型更具可解释性。同时,大模型可以提供决策方案的优缺点分析,预测可能的发展方向,产生更有说服力、满足决策者偏好的决策方案。

 

在决策评估方面,小模型为了易于计算和建模,在决策评估时进行了大量近似和简化,只考虑少量因素,从而导致决策结果的不准确和不稳定。相比之下,大模型具有的强大计算能力和表征能力,可以存储大量知识、覆盖广泛场景、处理复杂逻辑关系,因此在决策评估时可以综合考虑多种相关因素,对决策场景进行最逼真建模,刻画复杂多变的环境和主体交互,通过多维、全面、长链路的动态推演的方法进行决策评估,从而得到更加准确、客观、科学的决策结果。

(四)决策主体转变:从机器辅助决策到人机协同决策

随着信息技术的不断发展,人类在面临越来越复杂多变的决策环境时,需要借助于更高效和智能的工具来进行决策 (如图5所示)。随着决策工具能力的提升,决策主体也发生了巨大转变。

 

图5 决策主体的转变

 

在计算决策时代,决策主体主要是人类,机器辅助决策系统利用大数据技术为人类决策提供数据支撑,机器只是一个决策信息的提供者。而在智能决策时代,人工智能越来越多地主动参与到决策过程之中,面向决策目标进行分析和推理,已成为决策方案的辅助制定者。人工智能大模型具有超越人类水平的信息处理能力,能够在数据中获得全域知识,并针对特定场景收集相关信息。随着生成式人工智能的发展,大模型具备创造解决方案的能力,能够根据问题的性质和目标,提出多种可行的解决方案,并提供各种方案的风险和收益分析。因此,决策主体从原来的全链条人工参与转变为以人为主、机为辅,再转变为人机协同。在人机协同决策模式下,决策者只需提出问题,并判断决策方案是否符合需求,方案的制定和评估都可由机器完成。此外,机器还可通过决策者的反馈对决策方案进行优化,这种人机双向反馈的机制形成了一种 “正和”博弈。人类有着丰富的经验、创造力、道德观和责任感,可以提供更符合人性和社会价值的决策;而大模型拥有强大的计算能力、知识储备、逻辑推理和预测能力,可以提供更准确和高效的决策方案。这种双向反馈机制使得人类与机器共同参与决策过程,并相互协作、补充、互动,最终形成增量的智慧涌现,以支持产生更高质量、高效率、高智能的决策方案。

五、智能决策未来发展相关建议

为满足决策代际升级的需求,我国应加快发展新一代智能决策理论体系,加紧研发智能决策技术链条,并打造具有一定普适性的决策推演引擎,从而助力我国实现 “决策优越性”。为此,建议从以下几个方面着手布局。

 

第一,应以人工智能为支撑底座,颠覆传统决策范式,提升决策效能。应以 “AI+决策”的系统观为基础,充分利用各类AI框架,包括大模型、AI规划、混合智能等技术,以重塑智能决策理论与计算框架,辅助完善我国决策体系,推进治理能力现代化。同时,应以重大项目为牵引,组织国家科研机构、高水平研究大学、科技领军企业协同攻关。

 

第二,应以计算决策为理论基础,加快发展新一代智能决策理论体系。应探索大模型时代智能决策研究的新范式,促进决策分析技术与心理学、社会学、管理学、运筹学的交叉融合研究。同时,应探索复杂决策场景的生态建模、大数据驱动的决策数据多维解析、混合智能驱动的决策范式构建及面向复杂社会系统的决策推演技术。通过跨学科融合实现理论创新,并加速突破相关理论在极端自然灾害、新能源及高新技术等领域的应用,为我国重大决策的制定提供理论指导。

 

第三,应以决策大数据为基础设施,打造具有一定普适性的决策推演引擎。首先,应依托决策大数据,建设大规模数据平台,提高大规模多模态的数据存储能力,加强数据管理标注能力,积累高质量数据集。其次,应研究大集成通用模型算法,整合碎片化、多样化技术,提高模型性能。同时,优化通用大模型训练算法,提高训练效率。最后,应布局大算力AI计算服务,部署高吞吐、低延迟的硬件集群,并开发可充分利用硬件性能、可训练万亿参数的模型软件,以充分利用硬件性能。通过上述工作,打造具有一定普适性的决策推演引擎,为智能决策提供有力支撑。

六、结 语

以ChatGPT 为代表的大模型技术,加速了AIGD 的变革步伐,对既有决策范式带来了巨大冲击和挑战。未来,大模型技术和决策科学的融合将会更加普及和深入,并在国家、产业、组织及个人等各个层面上重塑管理决策的过程和方式。一方面,决策模型将会更加自动化和智能化,能够处理更加复杂多变的问题,提供更准确及时的建议,甚至具有意识,可自主决策。另一方面,决策模型将会更加人性化和可信赖,能够理解和尊重人类的情感、偏好和价值观,提供更透明和可解释的决策依据,与人类进行沟通和协作。虽然智能决策模型有着广阔的应用场景和丰富的技术积累,但是在提高智能决策模型的可解释性、可信性、可控性、易用性及经济性等方面,仍需学术界和产业界共同探索和解决。在智能决策时代,我们期待看到更多的创新和突破,让决策模型更好地服务于人类社会。

 

声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。

浏览量:0
收藏