章节 01
【导读】Elastic ML生命周期自动化实战指南核心概览
本文是开源工作坊项目,展示如何在Elastic Stack中结合Data Frame Analytics(DFA)、AI Agent Builder和Workflows实现ML全流程自动化,解决工程化最后一公里难题。通过虚构LendPath公司场景,演示手动建模(理解底层机制)与自动化路径(提效)双设计,覆盖从数据探索到实时推理的完整生命周期。
正文
一个完整的机器学习工程化工作坊,展示如何在Elastic Stack中结合Data Frame Analytics、AI Agent Builder和Workflows,实现从数据探索、模型训练到实时推理的全流程自动化。
章节 01
本文是开源工作坊项目,展示如何在Elastic Stack中结合Data Frame Analytics(DFA)、AI Agent Builder和Workflows实现ML全流程自动化,解决工程化最后一公里难题。通过虚构LendPath公司场景,演示手动建模(理解底层机制)与自动化路径(提效)双设计,覆盖从数据探索到实时推理的完整生命周期。
章节 02
模型开发后需解决部署、实时推理、性能监控与自动重训练等问题。Elastic Stack的DFA功能允许在ES中训练模型,但手动操作DFA jobs、管理版本、协调管道仍繁琐易出错。
章节 03
项目目标:将抵押贷款平台审计日志转化为欺诈检测模型。双路径设计:手动路径(Dev Tools逐步创建DFA任务)、自动化路径(AI Agent+Workflows智能流程)。多源数据融合:整合IAM审计(PingOne)、数据库审计(Oracle)、内部审计(自定义系统)三类异构数据源;数据生成器通过相关性规则(如异常事件的风险评分、off_hours等特征关联)确保模型学到业务模式。
章节 04
通过bootstrap-classification.py实现IaC:创建显式数据流、一致映射模板、修补差异、生成Kibana数据视图。
自动化EDA步骤(索引列表、schema分析、类别平衡评估),聚焦专家决策环节。
章节 05
精细考虑工作日/周末、节假日、峰值时段的交易量与风险权重,提升欺诈检测准确性。
章节 06
章节 07
作为可运行模板,展示Elastic从日志平台到智能数据平台的进化,覆盖ML全生命周期,提供全景视角。