By 积墨AI
2026年6月2日
47
389
从思考到行动:智能体时代的可信 AI
清华大学发起的专题报告深入探讨智能体时代的可信AI问题,研究者从模型能力演进路径出发,审视在模型具备推理与行动能力后如何保证其行为的可靠性与可验证性。
可信性的核心挑战
报告指出,智能体从单纯回复到能够推理并执行工具链任务,带来了新的风险——包括错误传播、不可解释决策以及自动化执行的连锁效应。评估方法需要覆盖上下文理解、推理过程透明性与结果验证。
研究方法与实验设计
演讲者介绍了基于推理轨迹和可证伪性测试的评估框架,强调通过构造高风险任务与工具交互场景来检验模型的可靠性,并提出结合形式验证与审计日志的治理手段。
当模型连接工具与现实操作环境时,评估其上下文理解与决策验证能力比以往任何时候都重要。
“小墨”从研究到产业实践
将可信性研究成果转化为可部署的实践,需要学术与产业的协作。报告建议建立行业测试基线、共享评估数据集并推动标准制定,以降低智能体在关键领域应用的系统性风险。
未来方向
面向未来,可信智能体研究将更多关注模型在连续决策、长期目标与人机协同场景下的安全性与可解释性,同时探索法律与伦理层面的约束机制,以保障技术落地的可控性。
如有侵权,请联系删除。
Related Articles
-
Thu Jun 04 2026微软发布全新拓扑量子芯片:AI智能体协助开发,可靠性提升1000倍
在Build 2026开发者大会上,微软发布了第二代拓扑量子芯片Majorana 2,并介绍了在芯片研发中广泛应用Agent化的Microsoft Discovery平台,实现从假设生成到实验设计与结
-
Wed Jun 03 2026AI 驭领・价值重塑 —— 数云原力2026・数智金融论坛盛大召开
数云原力2026·数智金融论坛在合肥召开,来自学术界与产业界的400余位专家参与,会议发布了多项AI金融成果与智能体产品,展示了AI在金融业务场景中的落地应用和技术路径。
-
Wed Jun 03 2026斩获总冠军!亿格云凭'人+AI'统一治理创新,登顶第十一届安全创客汇
在2026年第十一届安全创客汇总决赛中,亿格云凭借‘人+AI’统一治理方案斩获全国总冠军,展示了面向AI时代的企业安全治理实践与技术积累。
-
Wed Jun 03 2026Ayar Labs加入英伟达生态系统 将CPO引入机架级AI基础设施
Ayar Labs宣布加入NVIDIA NVLink Fusion生态系统,使其封装光学(CPO)解决方案与英伟达的机架级互联方案兼容,此举为超大规模AI集群的数据移动与能耗挑战提供新的技术路径。
-
Wed Jun 03 2026黄仁勋台北Computex重磅演讲:Agent重塑AI产业周期,全品类新品开启算力新格局
在GTC Taipei 2026的主题演讲中,英伟达创始人黄仁勋提出Agent智能体将重塑AI产业周期,并发布面向云端、消费端与企业市场的三大硬件产品,强调算力覆盖的广度与深度。
-
Wed Jun 03 2026值得关注的全新Agentic AI的发展趋势——Gartner2026年首份智能体AI技术成熟度曲线的研究报告
2026年4月,Gartner 发布了首份关于智能体(Agentic AI)的技术成熟度曲线报告,标志着智能体从生成式 AI 的子集走向独立的技术类别。报告基于行业调研与企业采用数据,评估了智能体在企
-
Wed Jun 03 2026AI竞争赛道迭代:券商Skills生态落地生根 行业博弈转向数据与创新
近年来券商在 AI 领域的竞争重心逐渐从大模型能力本身转向围绕业务场景的数据资产化与 Skills 生态建设。头部机构通过构建可复用的 Skills、能力接口与数据中台,推动 AI 能力在研究、投研、
-
Wed Jun 03 2026推动平价AR/AI眼镜走向大众市场,Phosio获400万美元种子轮融资
Phosio 宣布完成 400 万美元种子轮融资,致力于通过高折射率金属氧化物材料与专有薄膜平台,将高性能显示功能集成到轻便的日常眼镜中,力图解决 AR/AI 眼镜在光学与显示器件上的成本与性能痛点。
-
Wed Jun 03 2026华为举办智能光伏战略&新品发布会
在SNEC 2026期间,华为面向光伏行业推出了智能光伏战略与多款新品,重点展示了其FusionSolar Agent智能体技术架构和新一代组串式构网PCS解决方案,旨在推动AI在新能源场景的深度落地
-
Wed Jun 03 2026值得关注的全新Agentic AI的发展趋势——Gartner2026年首份智能体AI技术成熟度曲线的研究报告
2026年4月2日,Gartner发布了首份‘智能体人工智能技术成熟度曲线’,将Agentic AI从GenAI中独立出来作为新兴软件范式,系统评估了其技术成熟度与行业采纳状况。
-
Wed Jun 03 2026芮勇博士深度解析AI智能体的进展与未来
在中山大学的讲座中,芮勇博士系统性地回顾了AI智能体的发展脉络,强调大模型、智能体与人之间的协同进化是未来发展的核心思路。
-
Wed Jun 03 2026减少30%用能成本!晶澳破解能源瓶颈
在JAx2026品牌焕新发布会上,晶澳智慧能源正式发布了AI智能体系统JA E-Link Agent OS与核心硬件JA E-Link MC微电网控制器,旨在为工商业园区与分布式能源场景提供智能化能量
-
Wed Jun 03 20262026年工业AI驱动的中国制造新范式白皮书
IDC发布的白皮书系统性梳理了工业AI在中国制造业的演进与应用路径,指出智能体已成为推动工业场景落地的核心技术方向,并分析了产业链与商业模式的深刻变化。
-
Wed Jun 03 2026AI智能体 + 算电融合:晶澳智慧能源用AI重构能源管理边界
在SNEC展会现场,晶澳智慧能源发布了面向工商业与园区场景的AI智能体体系与微电网控制器,宣称通过一套从感知、预测、决策到执行与反馈的全链路闭环,提升能源利用效率并实现更高比例的绿电就地消纳。
-
Wed Jun 03 2026喜报!热轧生产AI智能体解决方案获评行业标杆
在2026中国AI智能体领航者征集活动中,首钢股份的热轧生产AI智能体方案被评为制造类行业标杆,并被纳入《2026智能体产业图谱》,标志着制造业AI应用的进一步成熟。
-
Wed Jun 03 2026共同探索AI在医疗健康行业的应用与创新
新西兰AI行业代表团对中国的AI医疗应用开展高层访问,重点考察了清华大学智能产业研究院与紫荆智康,双方就AI在诊疗场景的技术应用与商业模式进行了深入讨论。
-
Wed Jun 03 2026林洋智维发布"虚拟交易员 2.0" 以 AI 开启能源电力智能交易新时代
林洋智维在SNEC展会上推出面向电力市场的智能体产品'虚拟交易员2.0',该产品将时序预测、大模型与策略执行结合,旨在实现电力现货市场的自主预测与交易化决策。
-
Tue Jun 02 2026从思考到行动:智能体时代的可信 AI
清华大学发起的专题报告深入探讨智能体时代的可信AI问题,研究者从模型能力演进路径出发,审视在模型具备推理与行动能力后如何保证其行为的可靠性与可验证性。
