日程 › Agentic AI 软件工程方法论与形式化验证 › 纪要

Formal Method by Agents

董劲松（Jin Song Dong）
新加坡国立大学（NUS）计算机系教授

主题二 Agentic AI 软件工程方法论与形式化验证⏱ 13:15–13:30🎙 18 分钟现场录制

📊 信息图 · 一图读懂🎙 18 分钟 · 5 章节 · 11 关联实体

音频围绕形式化方法在程序生成与汽车设计中的应用、大语言模型的局限性、体育策略分析以及超级智能时代人类角色等内容展开讨论

运用概率模型分析，建议费德勒多打反手直线球，其提高 2% 赢球几率可增加 5%

费德勒听从建议，2017 年反手直线球提高 3%，24 次全部打败纳达尔

①

形式化方法与程序生成

形式化思维链确保程序正确

②

形式化方法在汽车设计中的应用

特斯拉设计缺陷案例

③

体育策略分析

大语言模型在体育策略中的不足：大语言模型为费德勒提供的打败纳达尔的策略全

④

超级智能时代人类角色

玩家角色：许多人将成为玩家，参与体育、电子竞技、音乐、舞蹈等娱乐活动。

智能纪要

音频围绕形式化方法在程序生成与汽车设计中的应用、大语言模型的局限性、体育策略分析以及超级智能时代人类角色等内容展开讨论，内容如下：

形式化方法与程序生成

形式化思维链确保程序正确

运用 refinement calculus 作为形式化的思维链，能产生 100% 正确的程序，如解决平方根问题，通过 separational composition law、assignment law 和 integration law 等可保证程序代码的正确性。
相关成果已发表在去年和凌云合作的 poco paper 中，但复杂程序或系统设计生成可能面临新挑战。

大语言模型在程序生成中的不足

让大语言模型生成平方根程序时，GPT5 和 Gemini3 都出现错误，原因是其长思维链不正式，各环节间缺乏形式化连接和保证。
目前大语言模型在解决复杂问题上还不够擅长，不过结合研究有望生成自动的大语言模型 agent。

形式化方法在汽车设计中的应用

特斯拉设计缺陷案例

特斯拉汽车水传感器检测到车辆浸入水中时，未触发车门解锁，导致车内人员被困淹死，这是设计失误。
大语言模型给出的改进建议多聚焦于用户界面，未抓住关键的传感器触发车门锁状态问题，而形式化方法可解决此问题。

小米汽车安全问题

小米汽车在高速行驶遇障碍物时，仅给用户 3 秒手动控制时间，碰撞后车门仍处于锁定状态，导致车内人员被烧死。
应在碰撞传感器检测到重大撞击时，同时触发气囊弹出和车门解锁，以保障人员安全。

体育策略分析

大语言模型在体育策略中的不足：大语言模型为费德勒提供的打败纳达尔的策略全错，如建议多用反手削球，而纳达尔擅长处理上旋球，此策略会让费德勒更吃力。
概率模型助力体育策略

运用概率模型分析，建议费德勒多打反手直线球，其提高 2% 赢球几率可增加 5%。费德勒听从建议，2017 年反手直线球提高 3%，24 次全部打败纳达尔。
为无名小将 Muelman 提供概率监督报告，助其 2018 年首次打败费德勒。还为小德分析对阵费德勒的策略，助其 3：0 战胜对手。
对郑钦文比赛进行分析，助其在意大利公开赛首次打败萨门。

超级智能时代人类角色

玩家角色：许多人将成为玩家，参与体育、电子竞技、音乐、舞蹈等娱乐活动。
探索者角色：当麻烦成本变大时，人们会因好奇心成为探索者和旅行者，在玩乐和探索中产生新想法。
共创者角色：与 AI 共同创造新系统和新世界。
守门人角色：人类需成为守门人，确保 AI 的安全、可靠、对齐和鲁棒性，防止 AI 完全控制。

章节速览

00:00形式化方法用于程序生成及复杂程序挑战探讨

本章节中说话人1表示自己是讲形式化验证且能说中文的资深人士，因早年出国电脑术语多讲英文。他主要谈用形式化方法看后三代情况，还提及让海报用大语言模型生成平方根程序，GTP5和Gemini3都出错。他与玲玲合作，用refinement calculus作为形式化思维链可使程序100%正确，但复杂程序或系统设计生成可能有新挑战。

02:30特斯拉事故案例及形式化方法改进设计方案

本章节以特斯拉车事故为例，讲述两年前赵安杰倒车入半米深湖，因车水感器未触发开门致其被淹死，认为这是设计失误。大语言模型提出的建议未抓住关键，而可用形式化方法解决。介绍了自己和PhD学生合作的PAD系统，有商业和教育版，用其并发模块可解决问题，保证一秒内生成新设计避免类似现象。

05:59小米汽车安全问题及大语言模型应用探讨

本章节主要围绕小米汽车问题及技术研究展开。去年小米汽车有学生被烧死事件，今年2月又出现类似情况，汽车碰撞后车门未解锁致学生被烧死，小米未召回汽车重新设计系统。同时提到利用大语言模型自动生成规范的可能性，近期有代码生成和模型检查相关工作文章将发表，还谈到物理世界的挑战及决策分析需求。

09:43概率模型助力网球选手战胜对手案例分享

本章节以费德勒和纳达尔的比赛为例，指出大语言模型给出的建议错误，而用概率模型建议费德勒多打反手直线球，使其2017年多次打败纳达尔。之后帮助无名小将Muelman打败费德勒，还为小德提供训练建议。最后提及对郑钦文比赛进行分析，助其打败萨门，近期她受伤表现不佳，不必埋怨。

16:34超智能时代人类的四大角色及AI管控要点

本章节说话人1围绕“超级智能后的生活”话题展开，认为人类有四大角色。一是成为各类玩家，参与体育、电竞、音乐等娱乐活动；二是成为探索者、旅行者，受好奇心驱动产生新想法；三是与AI共同创造新系统、新世界；四是担任守门人，确保AI安全、可靠，避免其完全控制。最后说话人表示这是最后一次参会。

现场幻灯片 · 9 张

📷 参会者现场拍摄的演讲幻灯片 · 点击放大翻看（支持 ← → ↑ ↓ 键、滑动、自动播放 ▶）。为保护隐私，画面中的人脸已自动打码；按拍摄归集，个别可能串场。

本场涉及 · 知识库

Ai Vision ForumGOSIM2026 AI 愿景论坛（上海站）智能体 / Agent大模型 LLM形式化方法 / 验证清华大学Specification / SBDArc（Agentic Requirement Compilation）M code 工作台董劲松（Jin Song Dong）

以上为飞书妙记 AI 自动生成的纪要与章节摘要，可能存在识别误差，仅供参考。