AIVF '26 ·
智能体产业研讨会
日程
嘉宾
Wiki
日程
› Agentic AI 软件工程方法论与形式化验证 › 纪要
Formal Method by Agents
董劲松(Jin Song Dong)
新加坡国立大学(NUS)计算机系教授
主题二 Agentic AI 软件工程方法论与形式化验证
⏱ 13:15–13:30
🎙 18 分钟现场录制
📊 信息图 · 一图读懂
🎙 18 分钟 · 5 章节 · 11 关联实体
音频围绕形式化方法在程序生成与汽车设计中的应用、大语言模型的局限性、体育策略分析以及超级智能时代人类角色等内容展开讨论
运用概率模型分析,建议费德勒多打反手直线球,其提高
2%
赢球几率可增加
5%
费德勒听从建议,2017 年反手直线球提高
3%
,24 次全部打败纳达尔
①
形式化方法与程序生成
形式化思维链确保程序正确
②
形式化方法在汽车设计中的应用
特斯拉设计缺陷案例
③
体育策略分析
大语言模型在体育策略中的不足:大语言模型为费德勒提供的打败纳达尔的策略全
④
超级智能时代人类角色
玩家角色:许多人将成为玩家,参与体育、电子竞技、音乐、舞蹈等娱乐活动。
智能纪要
音频围绕形式化方法在程序生成与汽车设计中的应用、大语言模型的局限性、体育策略分析以及超级智能时代人类角色等内容展开讨论,内容如下:
形式化方法与程序生成
形式化思维链确保程序正确
运用 refinement calculus 作为形式化的思维链,能产生 100% 正确的程序,如解决平方根问题,通过 separational composition law、assignment law 和 integration law 等可保证程序代码的正确性。
相关成果已发表在去年和凌云合作的 poco paper 中,但复杂程序或系统设计生成可能面临新挑战。
大语言模型在程序生成中的不足
让大语言模型生成平方根程序时,GPT5 和 Gemini3 都出现错误,原因是其长思维链不正式,各环节间缺乏形式化连接和保证。
目前大语言模型在解决复杂问题上还不够擅长,不过结合研究有望生成自动的大语言模型 agent。
形式化方法在汽车设计中的应用
特斯拉设计缺陷案例
特斯拉汽车水传感器检测到车辆浸入水中时,未触发车门解锁,导致车内人员被困淹死,这是设计失误。
大语言模型给出的改进建议多聚焦于用户界面,未抓住关键的传感器触发车门锁状态问题,而形式化方法可解决此问题。
小米汽车安全问题
小米汽车在高速行驶遇障碍物时,仅给用户 3 秒手动控制时间,碰撞后车门仍处于锁定状态,导致车内人员被烧死。
应在碰撞传感器检测到重大撞击时,同时触发气囊弹出和车门解锁,以保障人员安全。
体育策略分析
大语言模型在体育策略中的不足
:大语言模型为费德勒提供的打败纳达尔的策略全错,如建议多用反手削球,而纳达尔擅长处理上旋球,此策略会让费德勒更吃力。
概率模型助力体育策略
运用概率模型分析,建议费德勒多打反手直线球,其提高 2% 赢球几率可增加 5%。费德勒听从建议,2017 年反手直线球提高 3%,24 次全部打败纳达尔。
为无名小将 Muelman 提供概率监督报告,助其 2018 年首次打败费德勒。还为小德分析对阵费德勒的策略,助其 3:0 战胜对手。
对郑钦文比赛进行分析,助其在意大利公开赛首次打败萨门。
超级智能时代人类角色
玩家角色
:许多人将成为玩家,参与体育、电子竞技、音乐、舞蹈等娱乐活动。
探索者角色
:当麻烦成本变大时,人们会因好奇心成为探索者和旅行者,在玩乐和探索中产生新想法。
共创者角色
:与 AI 共同创造新系统和新世界。
守门人角色
:人类需成为守门人,确保 AI 的安全、可靠、对齐和鲁棒性,防止 AI 完全控制。
章节速览
00:00
形式化方法用于程序生成及复杂程序挑战探讨
本章节中说话人1表示自己是讲形式化验证且能说中文的资深人士,因早年出国电脑术语多讲英文。他主要谈用形式化方法看后三代情况,还提及让海报用大语言模型生成平方根程序,GTP5和Gemini3都出错。他与玲玲合作,用refinement calculus作为形式化思维链可使程序100%正确,但复杂程序或系统设计生成可能有新挑战。
02:30
特斯拉事故案例及形式化方法改进设计方案
本章节以特斯拉车事故为例,讲述两年前赵安杰倒车入半米深湖,因车水感器未触发开门致其被淹死,认为这是设计失误。大语言模型提出的建议未抓住关键,而可用形式化方法解决。介绍了自己和PhD学生合作的PAD系统,有商业和教育版,用其并发模块可解决问题,保证一秒内生成新设计避免类似现象。
05:59
小米汽车安全问题及大语言模型应用探讨
本章节主要围绕小米汽车问题及技术研究展开。去年小米汽车有学生被烧死事件,今年2月又出现类似情况,汽车碰撞后车门未解锁致学生被烧死,小米未召回汽车重新设计系统。同时提到利用大语言模型自动生成规范的可能性,近期有代码生成和模型检查相关工作文章将发表,还谈到物理世界的挑战及决策分析需求。
09:43
概率模型助力网球选手战胜对手案例分享
本章节以费德勒和纳达尔的比赛为例,指出大语言模型给出的建议错误,而用概率模型建议费德勒多打反手直线球,使其2017年多次打败纳达尔。之后帮助无名小将Muelman打败费德勒,还为小德提供训练建议。最后提及对郑钦文比赛进行分析,助其打败萨门,近期她受伤表现不佳,不必埋怨。
16:34
超智能时代人类的四大角色及AI管控要点
本章节说话人1围绕“超级智能后的生活”话题展开,认为人类有四大角色。一是成为各类玩家,参与体育、电竞、音乐等娱乐活动;二是成为探索者、旅行者,受好奇心驱动产生新想法;三是与AI共同创造新系统、新世界;四是担任守门人,确保AI安全、可靠,避免其完全控制。最后说话人表示这是最后一次参会。
现场幻灯片 · 9 张
📷 参会者现场拍摄的演讲幻灯片 · 点击放大翻看(支持 ← → ↑ ↓ 键、滑动、自动播放 ▶)。为保护隐私,画面中的人脸已自动打码;按拍摄归集,个别可能串场。
本场涉及 · 知识库
Ai Vision Forum
GOSIM
2026 AI 愿景论坛(上海站)
智能体 / Agent
大模型 LLM
形式化方法 / 验证
清华大学
Specification / SBD
Arc(Agentic Requirement Compilation)
M code 工作台
董劲松(Jin Song Dong)
以上为飞书妙记 AI 自动生成的纪要与章节摘要,可能存在识别误差,仅供参考。
← Rust AgentOS
Panel:Agent 软件工程的理 →