OpenMLDB+OneFlow:链接特征工程到模型训练,加速机器学习模型开发

2022年7月31日(周日)下午 14:00-16:30,开源机器学习数据库 OpenMLDB 第五期 Meetup 将通过线上直播的形式展开。

活动背景

提供生产级实时数据及特征开发全栈解决方案的开源学习数据库 OpenMLDB 邀请静态编译和流式并行的深度学习框架 OneFlow 合作带来 OpenMLDB Meetup 第五期。欢迎进群了解更多细节~

本期线上分享将带领大家深入了解迭代升级后的 OpenMLDB 和 OneFlow,解析产品背后的架构思路和硬核技术,并演示如何通过 OpenMLDB  轻松计算特征,结合 OneFlow 流畅训练模型,加速机器学习模型开发,助力  AI  低门槛低成本落地!

简要介绍

OpenMLDB PMC core member 卢冕,将从低成本、高性能的线上线下一致性特征平台开源解决方案切入,为大家介绍最新版本的 OpenMLDB 以及其性能改进、成本降低、灵活性增加的新特性。

OneFlow PMC core member 成诚,将以 OneFlow —— 让大规模分布式深度学习变得更方便为议题,为听众介绍易用性和完备性进一步完善、模型迁移更方便快捷、大模型支持更高效的 OneFlow v0.8.0 以及其他高可用易扩展的方案和组件。

OpenMLDB 系统架构师 黄威,将演示如何通过 OpenMLDB 计算特征以及如何使用 OneFlow 加载特征数据并进行训练,用实操演练展现如何结合 OpenMLDB 和 OneFlow 轻松实现特征计算与模型训练。

OpenMLDB 平台架构师 邓龙,将深入解析 OpenMLDB 架构设计背后的硬核技术,引导各位了解 OpenMLDB 毫秒级实时在线特征计算引擎内部实现。
具体日程参见海报,直播信息会在 OpenMLDB 技术交流群中同步,欢迎未进群的朋友入群收看~

file
        

分享抢先看

OpenMLDB:线上线下一致的生产级特征平台

【演讲提纲】

  1. 人工智能工程化落地的数据和特征挑战
  2. OpenMLDB:线上线下一致的生产级特征计算平台
  3. v0.5.0 新特性介绍:性能改进、成本降低、灵活性增加
    【听众收益】
  4. 了解目前企业进行人工智能工程化落地过程中碰到的数据和特征的痛点
  5. 了解低成本高性能的线上线下一致性特征平台开源解决方案:OpenMLDB
  6. 了解 OpenMLDB 的线上线下一致设计架构理念和企业级产品特性
  7. 了解 OpenMLDB v0.5.0 特性,性能改进、成本降低、灵活性增加

OneFlow —— 让大规模分布式深度学习变得更方便

【演讲提纲】

  1. OneFlow v0.8.0 全新版本解读
  2. Global Tensor:OneFlow 为社区带来的分布式执行易用方案
  3. Graph:高效快捷的动静转换方案,提供简单易用的高级分布式并行优化配置
  4. LiBai:基于 OneFlow 开发的高效易扩展的大规模分布式预训练代码库
  5. OneEmbedding:专为大规模推荐系统设计的高效灵活的扩展组件
    【听众收益】
  6. 了解 OneFlow 提供的分布式执行易用方案
  7. 了解大规模分布式并行训练中的高阶优化技术和分布式并行的本质
  8. 了解 LiBai 大规模预训练模型库的特色和相较于业内其他解决方案的优势
  9. 了解 OneEmbedding 在解决大规模推荐系统问题中的特点与优点

OpenMLDB+OneFlow,手把手教你快速链接特征工程到模型训练
【演讲提纲】

  1. 演示使用 OpenMLDB 计算特征与 OneFlow 加载特征数据进行训练
    【听众收益】
  2. 了解如何使用 OpenMLDB 计算特征
  3. 了解如何使用 OneFlow 加载特征数据与训练
  4. 了解 OpenMLDB 和 OneFlow 如何结合使用

深度揭秘 OpenMLDB 毫秒级实时在线特征计算引擎

【演讲提纲】

  1. OpenMLDB 在线架构
  2. 存储引擎的设计与实现
  3. 打造高可用数据库的原理

【听众收益】

  1. 了解 OpenMLDB 整体的架构设计 
    2.了解毫秒级实时在线特征计算引擎的实现路径