日程 › Agentic AI 愿景与软件工厂 › 纪要

多云统一 Agentic Infra

刘向阳
美的集团首席信息安全官兼软件工程院院长;欧洲科学院院士、IEEE / IET Fellow、ACM 杰出科学家
主题一 Agentic AI 愿景与软件工厂⏱ 09:40–09:50🎙 16 分钟现场录制
📊 信息图 · 一图读懂🎙 16 分钟 · 8 章节 · 13 关联实体
音频围绕个人工作经历、大模型与软件发展趋势以及企业数字化底座痛点等内容展开讨论
个人工作经历
美的集团:负责集团的数字化底座、信息安全和智能办公业务,工作近 5 年。
大模型与软件发展趋势
大模型与互联网类比:大模型的出现可类比互联网,互联网初期大家不知如何应用
企业数字化底座痛点
不统一问题
数字化底座能力
功能需求
云计算实践
部署模式
AI 原生与全栈建设
AI 原生

智能纪要 (第 1 段,11 分钟)

音频围绕个人工作经历、大模型与软件发展趋势以及企业数字化底座痛点等内容展开讨论,内容如下:

  • 个人工作经历
      • 美的集团:负责集团的数字化底座、信息安全和智能办公业务,工作近 5 年。
      • 蚂蚁集团:负责智能运维、程序分析和混沌工程三个方向,从零开始搭建相关业务。
      • 学术界:有 20 年的学术背景,学生及学生的学生在美国大学任职。
  • 大模型与软件发展趋势
      • 大模型与互联网类比:大模型的出现可类比互联网,互联网初期大家不知如何应用,直到 web 出现才创造出众多价值;大模型中,agent 可类比 web,是应用变化的形式。
      • 软件发展方向
          • 终极状态:软件的终极状态是 agent 加 info,未来软件开发将从自然语言写软件演进到业务人员用自然语言定义业务流程,软件使用者也将变为 agent。
          • 组织形态变化:未来 AI 原生的组织形态将是超级个体加上众多数字员工,组织将大大简化,损耗降低,管控变小。
  • 企业数字化底座痛点
      • 不统一问题
          • 表现:各云之间、数据中心与云下云上、多公民之间均不统一,无法实现 “write once run anywhere”。
          • 原因:多云存在利益冲突,导致不兼容,架构体系割裂,应用跨云迁移困难,技术、代码、架构、平台、监控、运维等均不统一。
      • 数据中心能力差:多数企业数据中心只有 IaaS 能力,缺乏 PaaS 能力,产品杂乱,存在稳定性和安全性等问题。
      • agent 底座能力缺失
          • 管理问题:agent 开发应以自然语言为主,会话管理、记忆管理等应是底座的问题,而非开发人员的事情。
          • 平台需求:agent 运行时需要 agent 平台,包括 session 管理、记忆管理、skills 工具等,还需要有 PaaS 能力、模型层和数据层。

章节速览

00:00说话人工作经历及人工智能应用情况介绍
本章节说话人1介绍自身经历,其在美的集团工作近5年,负责集团数字化底座、信息安全和智能办公三块业务;此前在蚂蚁集团从零做起负责智能运维等三个方向;更早前在学术界待了20年。还提及在场有学术界和工业界朋友,以前在学术界时在人工智能方面主要偏应用,最后提到H100现在是80。
00:57大模型时代软件未来形态及企业数字化痛点
本章节说话人1主要分享对未来的看法,将大模型与互联网、agent与web作对比,认为软件终极是agent加info。回顾人工作方式的演变,指出人跟应用系统工作缺乏灵活性。未来AI原生组织形态是超级个体加数字员工,软件开发可用自然语言写agent,还提到企业数字化底座痛点是不统一,info应AI原生且全栈。
05:59数字化底座三大痛点及 agent 平台能力要求
本章节主要讨论企业数字化底座的三个痛点问题。一是多云导致不兼容,架构体系割裂,应用跨云迁移难,技术、代码等多方面不统一;二是企业数据中心能力差,多数只有 IaaS 能力,产品杂,存在稳定性和安全性问题;三是 agent 底座能力缺失,运行时需 agent 平台,还应具备 PaaS 能力、模型层和数据层相关功能。

智能纪要 (第 2 段,5 分钟)

音频围绕企业数字化底座、云计算实践、AI 原生及商用软件替换等方面展开,介绍了相关技术架构和实践经验,内容如下:

  • 数字化底座能力
      • 功能需求
          • 全链路追踪:需具备 agent 全链路追踪,包含监控告警、故障定位等功能。
          • 自动化智能化:涵盖自动化、智能化应用,提升系统效率。
          • 安全管理:有密钥及凭证管理、统一身份权限管理,建立 agent 账号和权限体系。
          • 通讯层优化:实现人跟 agent 通讯,支持在手机上操作,避免逐个建立对话页面。
      • 开发方式:具备企业级数字化底座能力后,多数开发可用自然语言,通过表单或直接对话生成。
  • 云计算实践
      • 部署模式
          • 本地数据中心:从裸金属开始部署自研云计算能力。
          • 公有云:从虚拟机开始,使用公有云硬件,虚拟机镜像由己方提供。
      • 统一管理
          • 网络统一:通过虚拟网络统一数据中心和公有云的割裂网络,可在一个地址空间形成集群。
          • 资源统一:实现软件一次开发全球部署,资源统一纳管,如几千张 GPU 资源不够时自动上云,足够时自动下云。
  • AI 原生与全栈建设
      • AI 原生
          • 用户运营:在数字化底座云平台上,用各种 agent 解决用户问题。
          • 群聊机器人:设置群聊机器人,用于与客户聊天解决问题。
          • 专家应用:为云底座专家提供读类、分析类、写作动作等功能,部分动作采用 agent human in the loop 方式。
      • 全栈建设:涵盖 AI 平台、云底座、运维平台、数据库、大数据研发、性能、安全培训等方面。
      • 技术架构
          • AI 平台:包括算力平台、模型平台、知识平台和 Agent 平台,开发人员无需管理 session 管理、记忆管理等。
          • 其他平台:有通讯平台、运维平台(监控和自动化运维)、数据库平台(引擎和管理)、大数据平台(引擎和管理)、研发效能平台和安全平台(机密管理和身份安全,含 agent 身份安全)。
  • 商用软件替换
      • 替换情况:实现多种商用软件替换,如大数据引擎平台替换 Flare 的 CDP、云服务器替换 VMware、去掉使用多年的 Databricks 并替换为自研大数据开发平台。
      • 替换原因:自研平台在数据治理能力上比被替换软件更强,且之前使用的 CDH 故障频繁,替换为 CDP 后稳定性提升,同时开始自研并已全部新开。

章节速览

00:00Agent全链路追踪及企业数字化底座能力要点
本章节主要介绍企业级数字化底座能力。涵盖 agent 全链路追踪、监控告警、故障定位等,具备自动化与智能化;安全方面需有密钥、凭证及统一身份权限管理,建立新的 agent 账号与权限体系;通讯层实现人跟 agent 通讯,支持手机操作。有此能力后,多数开发可用自然语言,通过表单或对话生成。
00:58自研云计算能力实现云下云上及资源统一管理
本章节介绍了在北京的云计算实践,自研云计算能力可部署在本地数据中心或公云。本地从裸金属开始,公云从虚拟机且镜像自研,仅用其硬件,实现云下云上、多云统一。通过虚拟网络统一割裂网络,可跨数据中心和公有云成集群,达成软件一次开发全球部署,还能对资源统一纳管,GPU资源可按需在本地和云间自动调配。
02:15数字化底座AI原生建设及全栈内容介绍
本章节主要强调要做到AI原生,在数字化底座方面做了大量工作。一方面在云平台上要有能解决用户问题的agent及群聊机器人;另一方面为云底座专家配备读类、分析类、写作类等工具,做动作的一般采用agent, human in the loop。此外,要做到全栈,涵盖AI平台、云底座、运维平台等多方面。
03:05技术架构图组成及各平台功能介绍
本章节介绍了大体的技术架构图,下层包括us、PAAS等,上层是AI平台。AI平台主要有算力、模型、知识、Agent四个平台,有Agent平台开发人员无需管session和记忆管理。还包括通讯、运维、数据库、大数据平台,以及研发效能和安全方面,安全涵盖机密管理、身份安全,含agent身份安全。
03:51商用软件替换情况及自研大数据平台介绍
本章节说话人1介绍了在美商用软件替换情况,如大数据引擎平台替换Flare的CDP、云服务器替换VMware、去掉并替换Databricks等,强调自家大数据开发平台数据治理能力强。还提及曾将CDH替换成CDP,因其更稳定,同时开展自研,目前CDP已全部新开,欢迎感兴趣者加微信交流技术。

本场涉及 · 知识库

以上为飞书妙记 AI 自动生成的纪要与章节摘要,可能存在识别误差,仅供参考。
← AI 在工业场景落地的挑战AI Dev 方法与实践 →