C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  少校

注册:2015-11-148
发表于 2025-3-26 09:08:11 |显示全部楼层
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点先容国外的新技术、新观点、新风向。
编者按:2025年是AI智能体元年。本系列文章旨在先容AI智能体的概念、类型、原理、架构、开发等,为进一步了解AI智能体提供入门常识。本文为系列文章的第一篇,文章来自编译。

大语言模型(LLM)的出现让人工智能有了巨大飞跃。这些强大系统革新了自然语言处理,但其真正潜力在于与“智能体能力”(自主推理、规划和行动)的结合。这正是LLM智能体的用武之地,标志着大家与AI交互以及利用AI的方式出现了范式转变。

亚星游戏官网-yaxin222


AI智能体技术栈


本文旨在全面解析AI智能体,探讨其特性、组成与类型,并分析其发展历程、挑战及未来方向。

大家先了解从LLM到AI智能体的演进之路。

1. 从LLM到AI智能体

LLM应用形态的演变是现代应用的最快发展之一。

亚星游戏官网-yaxin222


1.1 从传统聊天机器人到LLM驱动的聊天机器人

聊天机器人并非新事物,在生成式AI(gen AI)概念出现前,你可能已经跟网上的聊天机器人互动过了。

前生成式AI时代的传统聊天机器人与当今AI驱动的对话智能体有本质区别,那种机器人一般是这样子的:

基于规则的响应:


  • 传统聊天机器人依赖基于规则的逻辑(“if-then”语句)。
  • 仅能处理预定义规则,无法应对复杂或模糊的查询。

固定回复:


  • 回复为静态且预先设定的。
  • 通过检测特定关键词或短语触发。
  • 缺乏灵活性和对话深度。

人工接管:


  • 搞不定的查询会提供一个“转人工”按钮。
  • 复杂问题仍需人工干预。

亚星游戏官网-yaxin222


1.2 LLM驱动的聊天机器人的诞生

ChatGPT的发布:2022年11月30日,OpenAI推出基于GPT-3.5的ChatGPT,成为首个主流LLM应用。

ChatGPT沿用了传统的聊天界面,但背后是经海量互联网语料训练而成的先进LLM技术。

Transformer架构:GPT(Generative Pre-trained Transformer)的基础是GOOGLE2017年提出的Transformer架构。

其通过自注意力机制分析输入序列,深入理解上下文。

LLM的能力:与传统聊天机器人不同,LLM能生成类人的、上下文相关且新颖的文本。

用例包括代码生成、内容创作、客户服务增强等。

局限性:


  • 个性化:难以在长对话中保持一致的个性化互动。
  • 幻觉问题:可能会生成事实错误但逻辑通顺的回复,因输出依赖概率而非验证过的常识。

应对措施:


  • 探索检索增强生成(RAG)等技术,让输出基于可靠的外部数据。
  • 这些进展旨在减少错误并提升LLM系统的健壮性。

1.3 从LLM聊天机器人到RAG聊天机器人与AI智能体

RAG聊天机器人:检索增强生成(RAG)将外部数据检索与LLM能力结合,生成准确且情境化的回复。

常识来源:


  • 非参数化常识:从互联网或专有数据库等外部来源检索到的实时数据。
  • 参数化常识:LLM训练中内嵌的常识。

优点:减少幻觉、提供最新信息并确保可验证的回复。

提示工程:通过上下文学习(单样本、少样本)、思维链(CoT)和ReAct(推理+行动)等技术,引导LLM推理与输出生成,提升回复质量。

亚星游戏官网-yaxin222


AI智能体:AI智能体由配备了工具、多步规划与推理能力的LLM演进而来。

工具使用:LLM可通过结构化模式(如JSON)分析任务并分配参数,调用编程定义好的函数或API。

环境:AI智能体在迭代实行环境中运行,支撑基于反馈的动态决策与持续适配。

智能体系统:由自主智能体组成的计算架构,可整合多系统组件、做出决策并实现目标。

智能体式RAG:


  • 将LLM的推理、工具使用和规划能力与语义信息检索结合。
  • 构建动态系统,可分解任务、实行复杂查询并利用工具解决问题。

亚星游戏官网-yaxin222


从LLM聊天机器人到RAG聊天机器人再到AI智能体的转型,标志着向更智能、自适应且集成工具的系统转变,这样的系统能实时解决复杂问题。

2. 什么是AI智能体?

AI智能体是通过传感器感知环境、处理信息,并通过实行器作用于环境以实现特定目标的系统。可将其视为能观察、思考与行动的数字实体,跟人类与环境的互动类似,不同的是以编程化和目标驱动的方式进行。

AI智能体的概念基于理性行为:智能体应采取实现目标可能性最大的行动。这种理性是AI智能体有别于简单的响应程序的核心特征。

亚星游戏官网-yaxin222


2.1 AI智能体的特性

AI智能体具备以下关键特性:

<ol>
  • 自主性:无需人类干预,独立决策。
  • 发射性与主动性:响应环境变化并主动采取措施实现目标。
  • 适应性:通过处理新信息与经验进行学习与进化。
  • 目标导向:以实现预定义目标或优化结果为方向。
  • 交互性:与其他智能体或人类沟通协作。
  • 持续性:持续运行,监控并响应动态环境。
    </ol>
    3. AI智能体的核心组件

    AI智能体的核心组件包括:

    <ol>
  • 感知
  • 推理
  • 行动
  • 常识库
  • 学习
  • 通信接口
    </ol>
    亚星游戏官网-yaxin222


    3.1 感知(传感器)

    传感器令智能体感知环境,包括物理传感器(摄像头、麦克风)或数字输入(数据流、用户交互)。

    3.2 推理(处理器)

    智能体的“大脑”,处理传感器信息并决定适当行动。

    该组件实现智能体的决策算法并维护必要的内部状态。

    AI智能体利用基于规则的系统、专家系统和神经网络等决策机制,做出明智决策并高效实行任务。

    3.3 行动(实行器)

    智能体影响环境或采取行动的手段。

    可能是物理实行器(机械臂、扬声器)或数字实行器(数据库更新、显示输出)。

    3.4 常识库

    智能体用于决策的信息库,包含预编程常识与学习获得的信息。

    3.5 学习

    使智能体通过数据与经验学习,随时间提升性能。

    利用强化学习、监督学习与无监督学习等技术持续优化智能体表现。

    3.6 通信接口

    让智能体可以与其他智能体、系统或人类交互。

    亚星游戏官网-yaxin222


    在更大环境下的智能体


    下文将详述各组件及智能体的运作方式。

    4. AI智能体如何与环境交互

    交互周期通常叫做“感知-规划-行动”循环。下面以自动驾驶汽车为例解析各阶段:

    4.1 感知阶段

    智能体的“感知”阶段可看作:
    传感器 → 处理 → 状态更新

    • 智能体通过传感器接收输入
    • 信息被处理与解析
    • 基于新信息更新当前状态

    4.2 决策阶段

    智能体的“思考”阶段:
    当前状态 + 目标 → 评估选项 → 选择最优行动

    • 智能体评估可能的行动
    • 权衡目标与约束
    • 基于可用信息选择最优行动

    4.3 行动阶段

    智能体的“实行”阶段:
    实行行动 → 观察变化 → 启动新循环

    • 通过实行器实行选定行动
    • 环境因此改变
    • 智能体通过传感器观察结果,启动新循环

    该循环持续重复,每秒可能实行多次。其强大之处在于:

    <ol>
  • 适应性:若发生意外,智能体可在下一个感知阶段检测出来并调整行动。
  • 学习机会:智能体可对比预测结果与实际结果,优化未来决策。
  • 目标导向行为:每一循环均推动智能体在约束下趋近目标。
    </ol>
    为了从编程的角度去理解,以恒温器为例对比三种复杂度:

    1.简单程序
    # Simple program
    if temperature &gt; desired_temperature:
    turn_on_cooling()

    • 仅遵循固定规则
    • 不考虑后果
    • 无学习或适应

    2.响应式程序
    # Responsive program
    if temperature &gt; desired_temperature:
    if time_of_day == "peak_hours":
       turn_on_cooling_eco_mode()
    else:
       turn_on_cooling_normal()

    • 更复杂的规则
    • 一定情境感知
    • 仍无真正智能

    3.AI智能体
    class SmartThermostat:

    def perceive(self):

    current_temp = get_temperature()

    time = get_time()

    electricity_price = get_current_price()

    weather_forecast = get_forecast()

    user_preferences = get_preferences()

    return Environment(current_temp, time, electricity_price,

    weather_forecast, user_preferences)


    def think(self, environment):

    possible_actions = [

    NoAction(),

    CoolNormal(),

    CoolEco(),

    PreCool(),

    WaitForOffPeak()

    ]


    # Evaluate each action's expected outcome

    best_action = None

    best_utility = float('-inf')


    for action in possible_actions:

    predicted_state = predict_future_state(environment, action)

    utility = calculate_utility(predicted_state)


    if utility &gt; best_utility:

    best_action = action

    best_utility = utility


    return best_action


    def act(self, action):

    action.execute()

    monitor_results()

    update_learning_model()

    • 考虑多因素
    • 预测结果
    • 从经验中学习
    • 优化长期目标
    • 平衡竞争性目标

    这个循环对所有AI智能体均适用:


    • 聊天机器人感知文本输入,考虑适当的回复并生成文本。
    • 交易机器人感知市场数据,制定策略并实行交易。
    • 扫地机器人感知房间布局与污垢,决定进入清洁模式并实行移动。

    5. AI智能体如何运作?

    假设你的智能冰箱不仅能在牛奶喝完时补货,还能根据你的浏览记录建议改喝杏仁奶。这算贴心还是有点吓人?你说了算!
    这便是AI智能体的缩影。

    AI智能体能理解人类语言(要归功于LLM)、对信息进行推理、规划行动,且无需持续的人工输入即可实行任务。

    它们解决复杂问题的能力远胜简单自动化工具。

    与基础脚本不同,AI智能体集成到App系统之中,支撑与环境的复杂交互。

    AI智能体与简单自动化的区别

    区别源于两大能力:


    • 工具使用
    • 规划

    你或许见过ChatGPT连基础的数学题也会做错,那是因为它只靠训练数据做出响应。

    同理,若要求你计算85×65,作为人类,你需直接知道答案或使用计算器工具。

    AI智能体同理,需赋予其工具访问权限。

    第二项能力是规划。

    以同一道数学题为例,你需懂得乘法或知道向计算器传入参数85、65及乘法指令。

    这便是规划与推理。

    以下是向AI智能体发起查询时的流程:

    亚星游戏官网-yaxin222


    AI智能体架构


    5.1 编排层(控制中心)

    假设我要创建一个AI会议智能体,我会跟调度器说“我想为学生举办一场网络研讨会”。

    该查询将触发AI智能体。

    亚星游戏官网-yaxin222


    编排层


    查询可以是文本、音频、视频或图像(数据最终会转换为机器可处理的数值)。

    查询由编排层(即智能体控制中心)处理。

    编排层的四大职责:


    • 记忆:维护完整交互记录。
    • 状态:存储进程的当前状态。
    • 推理:引导智能体的推理过程。
    • 规划:确定步骤及下一步行动。

    亚星游戏官网-yaxin222


    编排层会与模型(LLM)进行交互。

    5.2 模型(大脑)

    模型是整个智能体的中央决策者。

    AI模型通常为大语言模型(LLM)。

    亚星游戏官网-yaxin222


    AI智能体的模型


    为了理解查询、制定计划并决定行动,模型采用以下推理与逻辑框架:


    • ReAct(推理+行动)

    (推理+行动)确保审慎行动


    • 思维链

    通过中间步骤推理


    • 思维树

    探索多路径以寻找最优解

    模型决定采取何种行动,并利用工具实行。

    5.3 工具(手)

    工具让智能体得以跟外部世界交互。

    如计算器、API、网络搜索、外部数据库等都属于工具。

    亚星游戏官网-yaxin222


    工具让智能体能实行模型无法独立完成的任务、获取实时信息或处理现实世界的任务。

    6.  何时使用智能体 /  何时应避免使用

    当你需要LLM来决定应用的工作流时,智能体是有用的,但常被滥用。关键在于:你是否真的需要灵活工作流来高效解决任务?如果预设工作流经常失效的话,就需更高的灵活性。

    以冲浪旅行网站客服应用为例:

    若用户请求一般只有预设的两类(基于用户选择),且两类均有预设工作流:

    <ol>
  • 用户需旅行信息  提供搜索栏访问常识库
  • 用户需联系销售  提供联系表单
    </ol>
    如果这种确定型工作流已覆盖所有查询,直接编码即可!这样的系统是100%可靠的,避免了LLM的不可预测。

    出于简单性与健壮性的考虑,不建议优先采用智能体。

    但如果工作流无法预先确定呢?

    比方说,用户问:“我原计划周一到达,但忘带护照可能延迟至周三。能否在周二上午带上我和装备去冲浪?费用需包含取消险。”

    这个问题涉及到多种因素,预设标准无法覆盖。

    如果预设工作流经常覆盖不到的话,则需更高灵活性。

    此时智能体架构便可派上用场。

    上述案例中,可构建多步骤智能体,访问天气API获取预报、GOOGLE地图API计算距离、员工空闲情况面板及常识库RAG系统。

    此前,计算机程序受限于预设工作流,试图通过堆叠if/else处理复杂性,仅能处理“数字求和”或“寻找最短路径”等范围狭窄的任务。但预设流程通常无法匹配上现实世界的任务(如上述旅行案例)。智能体系统为程序开启了处理现实任务的大门!

    7. 应用领域

    AI智能体是通用工具,可提升多领域生产力、效率与智能,正日益应用于日常场景与高影响领域。

    亚星游戏官网-yaxin222


    8. 总结

    AI智能体正改变大家与技术的互动方式,提供空前的自主性、智能与适应性。

    从简单反射型智能体到复杂学习系统,AI智能体正应用到多个行业来解决复杂问题并增强人类能力。但构建高效智能体面临伦理关切、数据依赖与可扩展性等挑战。

    随着AI技术的不断进步,AI智能体潜力巨大。通过关注通用AI、
  • 举报本楼

    本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
    您需要登录后才可以回帖 登录 | 注册 |

    版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

    GMT+8, 2025-3-29 23:06 , Processed in 0.338315 second(s), 16 queries , Gzip On.

    Copyright © 1999-2023 C114 All Rights Reserved

    Discuz Licensed

    回顶部
    XML 地图 | Sitemap 地图