日程 › Agentic AI 愿景与软件工厂 › 纪要

AI 在工业场景落地的挑战

陶建辉
涛思数据(TDengine)创始人、CEO
主题一 Agentic AI 愿景与软件工厂⏱ 09:25–09:40🎙 15 分钟现场录制
📊 信息图 · 一图读懂🎙 15 分钟 · 12 章节 · 12 关联实体
音频由北京涛思数据创始人陶建辉分享公司在 AI 赋能及工业领域数据处理的经验与见解,介绍了公司在组织架构调整、AI 在工业场景落地面临的问题及解决方案等方面的情况
效率提升:调整后研发效率至少提高了五六倍,代码量较去年同期增加了 5 倍
AI 赋能与组织架构调整
研发团队架构调整
AI 在工业领域落地的挑战
数据烟囱:工业企业存在严重的数据烟囱问题,控制系统众多且孤立,导致 AI
工业数据底座解决方案
数据处理流程
无问自推
降低行业知识依赖:传统数据分析强依赖行业知识和业务经验,而无问自推通过将
智能问数与报表分析
智能问数:用户提出问题,智能问数能给出相应回答。
事件根因分析
算法运用:背后使用 Panda、PyTorch 等,结合标准统计方法,由

智能纪要 (第 1 段,8 分钟)

音频由北京涛思数据创始人陶建辉分享公司在 AI 赋能及工业领域数据处理的经验与见解,介绍了公司在组织架构调整、AI 在工业场景落地面临的问题及解决方案等方面的情况,内容如下:

  • AI 赋能与组织架构调整
      • 研发团队架构调整
          • 架构变革:将研发团队的存储组、查询组等功能组全部打散,让一人负责从连接器到内核到查询的全流程。
          • 效率提升:调整后研发效率至少提高了五六倍,代码量较去年同期增加了 5 倍。
      • 销售模式调整计划:计划几个月后撤销售前岗位,让销售依靠 AI 承担售前工作,加快销售过程。
  • AI 在工业领域落地的挑战
      • 数据烟囱:工业企业存在严重的数据烟囱问题,控制系统众多且孤立,导致 AI 难以发挥作用。
      • 标准不统一:工业企业中数据命名和计量单位不统一,同物不同名、同名不同物的情况普遍,影响 AI 应用。
      • 情景化缺失:工业数据的正确性取决于上下文,缺乏情景化信息,AI 无法解决实际问题。
  • 工业数据底座解决方案
      • 数据处理流程
          • 数据汇聚与转化:将各种数据源进行汇聚,并对计量单位和命名进行转化,以便存入数据库。
          • 流计算引擎:由于 AI 无法处理实时数据,需要流计算引擎对连续数据流进行本地计算,将其转化为有意义的业务上下文后再交给 AI 处理。
      • AI 模块与数据目录
          • AI 模块:公司内部开发的 TDGBD 模块,专门用于时序数据预测和异常检测。
          • 数据目录:包括数据标准化、数据情景化和图谱关系构建,为 AI 提供数据地图,帮助其找到资产并理解数据上下文,从而发挥作用。

章节速览

00:06涛思数据AI赋能下的研发与销售架构调整
本章节由北京涛思数据创始人陶建辉发言。他介绍公司专注物联网和工业数据处理,19年开源核心代码。提及公司1 - 5月代码量较去年同期增5倍,因受AI时代启发,将研发团队打散重组,研发效率至少提高五六倍。他还打算撤掉售前岗位,让销售依靠AI完成售前工作,认为AI赋能要与组织结构结合。
01:56AI在工业领域应用现状及数据基础设施问题
本章节指出AI需落实到具体场景,在工业领域雷声大、雨点小,多数企业处于POC观望状态。虽模型已足够聪明且在进步,但工业企业数据基础设施差,数据烟囱问题严重,控制系统众多且孤立,导致AI难以发挥作用。不过,因外部AI迭代快,国民经济主战场还有较长时间窗口可利用。
03:30工业企业标准不统一及AI对命名问题的挑战
本章节指出工业企业存在标准不统一的问题,以选矿回收率为例,其在不同系统命名不同,会给 AI 应用带来麻烦。AI 最怕同物不同名、同名不同物的情况,如“收入”一词,不同人理解有差异。公司内部可通过制定 glossary 明确词的定义,避免因表述模糊引发争议,影响 AI 发挥作用。
04:23AI解决问题需情景化及依赖上下文
本章节强调情景化的重要性,说话人以温度85度为例,指出明确事故涉及的设备、工段、时间段、班组及框式类型等信息很关键,没有这些AI无法解决问题。还提到处理的场景是7×24小时连续数据流,因生产产品不同,其成分、配置参数有差异,数据正确与否取决于上下文。
05:07工业企业数据底座方案及处理思路
本章节中说话人1指出,全球包括欧美的制造业、工业企业数据封闭,不像IT行业强调自由流动,真正问题是缺少工业数据底座。接着分享方案思路,提到要对左边各种数据源进行汇聚,在处理数据时需做转化,如计量单位命名转化,以便存入数据库,且数据库要有查询功能。
05:49AI 无法实时处理数据,需流计算引擎辅助
本章节主要讨论了AI存在的问题,说话人认为AI虽分析能力强,但无法进行实时处理,尤其不能直接分析传感器车队等实时数据。为此需要一个迅流计算引擎进行本地计算,将连续数据流转化为有意义的业务上下文后返回给AI,AI才可能处理。此外还提到TDGBD是内部开发的,但未作详细说明。
06:31AI模块的数据目录、标准化及其工业应用重要性
本章节说话人1介绍了一个AI模块,可进行时序数据预测和异常检测。他两年多前做的数据目录工作与当下热门的本体论类似,包含数据标准化、情景化三个大模块。以三峡新能源为例说明数据目录的重要性,众多传感器需它来定位资产、明确图谱关系,此外还要进行标准化,统一命名和计量单位。
07:35情景化与本体论构建及AI发挥作用的探讨
本章节主要围绕情景化展开,指出要在现有基础上做出本体论,如 Pandate 做出本体论后 AI 就能发挥作用。提到 Pandate 苦做定制一二十年摸索出方法,将 model 变成自己的东西,使 AI 能读懂组织架构数据。还列举了常见场景包括看面板、报表、分析、事件等,最后提及软件形态相关的一张图。

智能纪要 (第 2 段,6 分钟)

音频围绕公司在数据分析领域的多项创新成果展开,介绍了无问自推、智能问数、报表 AI 分析、事件根因分析等功能,还提及企业私域知识技能、时序数据基础模型及标准化 SQL 函数等内容,同时分享了售前工作的创新工具,内容如下:

  • 无问自推
      • 降低行业知识依赖:传统数据分析强依赖行业知识和业务经验,而无问自推通过将数据接入,正确命名数据,让数据主动说话,自动推荐报表和提示问题,适用于电解铝、水泥、咖啡、糖等不同行业。
      • 改变数据消费范式:以往数据需查询、拉取,现在无问自推主动推送,此模式在海外反响大,相关博客点赞和转化多。
  • 智能问数与报表分析
      • 智能问数:用户提出问题,智能问数能给出相应回答。
      • 报表 AI 分析
          • 功能受欢迎:在报表和列表上有按钮,可让 AI 进行分析,操作简单,受用户欢迎。
          • 可个性化定制:分析可转化为 skills,用户能修改、添加自己的 skills,融入行业知识和公司数据分析流程。
  • 事件根因分析
      • 算法运用:背后使用 Panda、PyTorch 等,结合标准统计方法,由 AI 大模型生成程序。
      • 优化策略:为避免浪费 token,要求程序员固化部分算法,封装本地库,让 AI 先调用本地库,不足时再生成。
  • 企业私域知识技能
      • 用户流程处理:可上传用户首是要处理流程。
      • 专家分析技能:可将专家分析技能变成 skills,如根因分析步骤可自行定义流程。
  • 时序数据基础模型
      • 市场关注度低:在 Hugging Face 上很少有人关注。
      • 易获项目:在中国可借此忽悠部分领导获取项目,但实际数据并无特别之处。
  • 标准化 SQL 函数
      • 传统方式耗时:以往编写 UDF 需用 C 和 Python,编写、编译、部署到数据库耗时久,至少一天。
      • AI 带来效益:现在领导只需说计算需求,AI 能生成 C 语言代码,完成测试、验证并上传到平台,几分钟即可完成。
  • 售前工作创新:用 AI 做的工具生成客户场景,让售前工作简单,给客户带来震撼效果。

章节速览

00:01无问自推与智能问数革新数据消费范式
本章节主要介绍了“无问自推”和“智能问数”。“无问自推”指数据自己说话,把数据接入并正确命名,系统会自动推荐报表、提示问题,降低对行业知识的依赖,改变数据消费范式,在海外反响大。“智能问数”则类似 chatbi,提出问题即可得到回答。
02:09分享报表AI分析功能及个性化技能改进
本章节说话人1分享了一项受欢迎的功能,即任何时候看到报表或列表都有按钮让AI做分析,该功能操作简单。此外,还介绍这个功能的改进之处,将分析方式变成skills,用户可以修改、添加skills,能把行业知识和公司数据分析流程放进去,实现完全个性化。
02:45工业事件根因分析及企业私域知识技能介绍
本章节主要介绍了工业行业的三项内容。一是事件根因分析,AI可极稀生成Python程序,背后算法有Panda、PyTorch等,为节省token正封装库;二是企业私域知识技能,可上传处理流程、定义专家分析技能;三是时序数据基础模型,在Hugging Face上少有人关注,在中国较易靠此忽悠项目。
05:14AI助力数据库开发及售前工作提效显著
本章节说话人1分享了AI带来的效益。在数据库方面,过去写UDF若C库中没有对应函数,用C编写、编译并部署到数据库至少需一天,现在AI能生成C语言代码,几分钟就能完成并投入使用。此外,售前工作因用AI做工具生成客户场景变得简单,常让客户感到震撼,说话人还表示值得专门做报告分享经验。

现场幻灯片 · 1 张

📷 参会者现场拍摄的演讲幻灯片 · 点击放大翻看(支持 ← → ↑ ↓ 键、滑动、自动播放 ▶)。为保护隐私,画面中的人脸已自动打码;按拍摄归集,个别可能串场。

本场涉及 · 知识库

以上为飞书妙记 AI 自动生成的纪要与章节摘要,可能存在识别误差,仅供参考。
← 硅基时间时刻多云统一 Agentic Infra →