日程 › Agent 开发实践 › 纪要

开源项目实践 ① — Arc:Agentic Requirement Compilation

林云老师团队
上海交通大学计算机科学与技术系
主题三 Agent 开发实践⏱ 14:45–14:55🎙 6 分钟现场录制
📊 信息图 · 一图读懂🎙 6 分钟 · 3 章节 · 9 关联实体
音频围绕构建软件功能智能体平台展开,介绍了平台的目标、界面设计、运行流程、追溯关系维护、可视化交互、数据集开源、评估系统等内容,以及后续开源项目的计划
平台目标与面向对象
教育场景支持:搭建 playground 帮助学生理解软件功能智能体,就
平台界面与运行流程
界面设计
数据集与评估系统
数据集开源:希望以开源方式让大家贡献不同难度(简单、中等、难)的题目,仅
后续工作计划
在 Exceed deadline 过后,正式开源整个项目,并在微信公众

智能纪要

音频围绕构建软件功能智能体平台展开,介绍了平台的目标、界面设计、运行流程、追溯关系维护、可视化交互、数据集开源、评估系统等内容,以及后续开源项目的计划,内容如下:

  • 平台目标与面向对象
      • 教育场景支持:搭建 playground 帮助学生理解软件功能智能体,就像学生通过练习来驾驭 20 个智能体,避免直接进入就业市场却无法胜任相关工作。
      • 科研比赛一体化:形成科研和比赛的一体化平台,通过 competition 推动相关领域的发展。
  • 平台界面与运行流程
      • 界面设计
          • 任务范围:界面的 task band 包含 web、mobile 以及算子生成等内容,目前刚上线只有 web 和部分 mobile 功能,未来将拓展更多。
          • 用户选择系统:用户进入后可选择感兴趣的系统,看到复杂的需求文档,该文档目前为 demo,包含四个高层模块和几十个细致的需求场景。
      • 运行流程
          • 需求建模:用户可在多模态需求文档中导入需求文档并为自己的需求进行建模,构建需求模型。
          • 智能体系统上传:将自己的智能体系统上传到平台,平台会展开需求模型,让智能体系统对需求文档进行编码。
          • 追溯关系维护:平台自动维护需求、模块、测试和底层数据库之间的追踪性关系,形成追溯关系,同时进行运行时分析。
          • 可视化交互与干预:平台维护所有追溯关系,提供 API 让智能体系统可视化,人可实时监控和干预,通过版本管理日志,可随时回退和调整。
          • 结果展示:编译完成后,展示格式化的操作系统,让学生和参赛者快速看到构建的软件系统的样子。
  • 数据集与评估系统
      • 数据集开源:希望以开源方式让大家贡献不同难度(简单、中等、难)的题目,仅靠交大的力量是不够的。
      • 多维度评估系统
          • 信息记录:记录编译需求量时的 token 消耗、使用的模型(如 Claude、DPC7B 模型)和花费的时间。
          • 综合评估:形成综合的多维度评估系统,对参赛者进行评估。
          • 参考文献与方法论公开:为参赛者提供参考文献,若参赛者打榜成绩优异,其方法论将公开,有望形成新的论文。
  • 后续工作计划:在 Exceed deadline 过后,正式开源整个项目,并在微信公众号平台上进一步发展。

章节速览

00:08构建软件功能智能体及教育竞赛平台设想
本章节说话人1表示接到组织任务,争取5分钟阐述想法。基本想法是构建软件功能的智能体,这要求需求文档足够复杂、软件系统足够可靠。希望有个Arena来测试,还提出两方面目标,一是面向教育,有个playground帮助学生理解;二是形成科研和比赛的一体化competition平台。
01:17网站界面及智能体系统构建与追溯功能介绍
本章节介绍了构建网站的界面,涵盖web、mobile等。用户进入后选感兴趣系统,会看到多模态需求文档,可导入、建模。构建需求模型后将智能体系统上传,系统会对需求文档编码,自动维护追溯关系。平台可维护追溯关系,支持人监控干预,日志用版本管理。最后编译结果可视化,提供API让人机交互可控。
04:38开源数据集、多维度评估及项目公开计划
本章节介绍了比赛相关计划。希望以开源方式让大家贡献不同难度题目形成数据集;构建综合多维度评估系统,记录 token 花费、使用模型、用时等;为参赛者提供参考文献,鼓励方法论公开;Exceed 截止日期后正式开源项目,后续会在微信公众号平台进一步发展。

现场幻灯片 · 5 张

📷 参会者现场拍摄的演讲幻灯片 · 点击放大翻看(支持 ← → ↑ ↓ 键、滑动、自动播放 ▶)。为保护隐私,画面中的人脸已自动打码;按拍摄归集,个别可能串场。

本场涉及 · 知识库

以上为飞书妙记 AI 自动生成的纪要与章节摘要,可能存在识别误差,仅供参考。
← 驾驭未来:智能体软件的起源和演进开源项目实践 ② — OpenFab →