11月19日 13:30-17:30,OpenMLDB 项目发起人、第四范式技术副总裁 郑曌作为出品人发起 DataFunSummit 2022 MLOps 及 AI 工程化落地论坛。OpenMLDB PMC、第四范式资深系统架构科师 卢冕,将在论坛中为大家带来议题为《开源机器学习数据库 OpenMLDB:线上线下一致的生产级特征平台》的内容分享。

MLOps 及 AI 工程化落地 论坛

活动时间: 11月19日 (周六) 13:30-17:30

活动形式: 线上直播

出品人: 第四范式技术副总裁、OpenMLDB 项目发起人 郑曌

主讲嘉宾:

-阿里云 高级技术专家 林东

-浪潮 产品经理 董天骄

-OPPO 机器学习技术专家 谢堉鑫

-微软 首席数据科学家 朱晓勇

-第四范式资深系统架构师 卢冕

-倍赛科技 CTO刘世林

参与方式:扫码报名

file

关于出品人

file

Image

出品人:郑曌 第四范式 技术副总裁

Image

Image

第四范式研发副总裁,OpenMLDB 项目发起人

  • Linux 基金会 Al & Data Board member
  • 开源机器学习数据库 OpenMLDB 、 AI 操作系统内核 OpenAlOS 项目发起人
  • 开源推荐算法工具 SVDFeature 作者
  • SageOne AI 算力基础设施首席架构师,设计开发 ATX 系列机器学习全生命周期加速卡
  • 主持中国市场份额第一的 AI 操作系统 Sage AIOS 的系统设计与研发
  • 曾任 Google 展示广告架构团队架构师、 Pinterest 个性化推荐与搜索部门技术负责人,研究领域覆盖分布式机器学习系统架构、个性化推荐架构、高维稀疏机器学习框架等方向
  • 2010 年 ACM 大赛世界冠军、 KDD Cup 2012 冠军,腾讯云 TVP

    关于嘉宾

file

Image

林东 阿里云 高级技术专家

Image

Image

介绍:在宾夕法尼亚大学获得计算机博士学位。曾在 LinkedIn 从事 Apache Kafka 开发,是 Apache Kafka committer 和 PMC 成员。在加入阿里巴巴前,曾在谷歌大脑参与了下一代 TensorFlow 计算引擎的多项模块的开发设计。目前在阿里云开源大数据平台团队,负责 FeatHub, Apache Flink 机器学习库等 Flink 生态项目的开发工作。

演讲主题:FeatHub:流批一体的实时特征工程平台

演讲提纲:本次演讲中,我们将介绍 FeatHub,一个由阿里云自研并开源的实时特征平台。我们将介绍 FeatHub 的架构设计,已经完成的工作,以及近期的发展计划。我们为 FeatHub 设计了易于使用的 Python SDK,来方便用户开发,分享,以及部署特征工程作业到生产环境。FeatHub 目前支持使用Flink作为计算引擎来完成流批一体的特征计算,支持在 Kafka, 文件系统等多种存储引擎中读取和存储特征。用户可以使用声明式的 API 来定义特征,无需担心特征穿越的问题,也无需使用相对复杂的底层计算引擎 API 来计算特征。我们希望通过提供这些功能,来提升特征工程作业的开发效率,并推动实时特征工程的应用发展。FeatHub 已经在 https://github.com/alibaba/feathub 开源。欢迎大家尝试使用并提供反馈。

听众收益:如何更容易的使用 Flink 完成实时特征工程作业的开发,测试和部署

file

Image

董天骄 浪潮 产品经理

Image

Image

介绍:董天骄,浪潮人工智能软件产品经理。长期从事人工智能平台建设,致力于构建高效、智能、易用的企业级AI平台。

演讲主题:AIStation 智能业务创新生产平台

演讲提纲:

  1. 企业 AI 转型之路

  2. AIStation 助力企业AI转型

听众收益:

  1. 了解企业在 AI 转型中遇到的问题

  2. 了解浪潮 AIStation,帮助企业提升 AI 竞争力

file

Image

谢堉鑫 OPPO 机器学习技术专家

Image

Image

介绍:加入 OPPO 前,曾在京东、阿里多年从事大型搜推广系统、深度机器学习等领域开发工作。加入 OPPO 后,作为机器学习技术专家,主要负责 OPPO 机器学习平台 StarFire 研发,主要研究方向是:端云协同机器学习、模型训练与推理优化、模型训练调度等。

演讲主题:StarFire:OPPO AI工程平台实践

演讲提纲:

  1. AI 工程化的发展趋势与技术挑战

  2. OPPO AI 工程化实践:端云一体 AI 平台 StarFire

  3. 端云协同计算的 AI 范式

  4. 未来展望

听众收益:

  1. 了解 AI 工程化的发展趋势及在 OPPO 内部技术实践

  2. 了解端云一体机器学习的技术体系

  3. 了解下一代 AI 范式的设计思路

file

Image

朱晓勇 微软 首席数据科学家

Image

Image

介绍:朱晓勇 - Microsoft Principal Data Scientist,专注于机器学习基础设施及应用,包括超大规模模型训练与部署,特征中台等。

演讲题目:Feathr - 源于领英及微软的企业级高性能 Feature Store

演讲提纲:Feathr 是由领英以及微软维护,在 Linux Data & AI Foundation 下运作的企业级开源 Feature Store。项目于 2022 年 4 月开源,在开源前已经在微软与领英内部得到了大规模的使用,服务了内部大量的机器学习应用。在这次演讲中,我们主要会介绍 Feature Store 的一些基本概念,Feathr 的设计理念,内部的一些用例,以及一些 demo。Feathr 的主要特性包括原生的 transformation/aggregation 以及 point-in-time join 的支持,云原生的开放架构,以及企业级安全性的支持等。

听众收益:

  1. Feature Store 的基本概念

  2. Feathr 的设计理念

  3. Feathr 的使用场景

file

Image

卢冕 第四范式 资深系统架构师

Image

Image

介绍:博士毕业于香港科技大学计算机系。开源项目 OpenMLDB 研发负责人,第四范式系统架构师,数据库团队和高性能计算团队负责人。

演讲主题:开源机器学习数据库 OpenMLDB:线上线下一致的生产级特征平台

演讲提纲:

  1. 人工智能工程化落地的数据和特征挑战

  2. OpenMLDB:线上线下一致的生产级特征平台

  3. 使用案例分享

听众收益:

  1. 深刻了解到目前企业进行人工智能工程化落地过程中碰到的数据和特征的痛点

  2. 了解低成本高性能的实时特征平台开源解决方案 – OpenMLDB

  3. 了解 OpenMLDB 整体的线上线下一致性的设计理念,以及面向企业级应用的产品特性

file

Image

刘世林 倍赛科技 CTO

Image

Image

介绍:现任倍赛科技 CTO,负责公司的整体研发和 Data-Centric MLOps 产品规划,https://github.com/basicai/xtreme1 项目的主要发起人。先后毕业于浙江大学和新加坡国立大学,获学士和博士学位。曾发表数十篇语音识别领域的国际顶级期刊杂志和会议论文,曾任IEEE期刊审稿人。在语音识别、自然语言处理、机器视觉等领域有十年以上的科研和工程落地经验。申请了上百项发明专利,并获得了16项的授权。2018年成都市高层次创新创业人才“顶尖创新创业团队”成员之一。曾担任新加坡国立大学助理研究员,百度高级研究员,数联铭品人工智能VP。

*演讲题目:Xtreme1:下一代多模态训练数据平台*

演讲提纲:

  1. 训练数据平台的起源

  2. 平台的核心功能亮点

  3. 平台建设的技术挑战

  4. 平台的未来规划设想

听众收益:

  1. 轻松上手玩转多模态训练数据

  2. Data-Centric MLOps 实践落地

  3. 如何加速多模态数据治理效率

了解更多:

OpenMLDB GitHub:

https://github.com/4paradigm/OpenMLDB

OpenMLDB 官网:

https://openmldb.ai/

OpenMLDB 文档:

https://openmldb.ai/docs/zh/