OpenMLDB 进阶使用攻略和高级特性介绍
本文整理自 OpenMLDB PMC 张浩在 OpenMLDB Meetup No.6 中的分享 ——《OpenMLDB 进阶使用和高级特性介绍》。
本文整理自第四范式资深架构师、OpenMLDB PMC 卢冕在第四范式技术日「高效落地的AI开源生态」分论坛的主题分享——《开源机器学习数据库 OpenMLDB:提供线上线下一致的生产特征平台》。内容包括:
感恩 OpenMLDB 贡献者
OpenMLDB 发展历程
OpenMLDB 架构设计
0.6.0 最新版本讲解
落地案例分享
本文整理自 OpenMLDB Meetup No.5 中 OpenMLDB PMC 邓龙的演讲。本文深入解析 OpenMLDB 架构设计背后的硬核技术,带领大家了解 OpenMLDB 毫秒级实时在线特征计算引擎内部实现。
本文整理自 OpenMLDB Meetup No.5 中 OpenMLDB PMC 黄威的演讲,将以 **京东高潜用户购买意向预测问题** 为例,示范如何使用 OpenMLDB 和 OneFlow 联合来打造一个完整的机器学习应用。分享视频如下
OpenMLDB 是一个开源机器学习数据库,提供线上线下一致的生产级特征平台。Jupyter Notebook 提供了基于浏览器网页的数据计算、代码开发、文档编辑、代码执行以及结果展示等功能,是目前最流行和最易用的开发环境之一。本篇文章介绍 OpenMLDB 与 Notebook 的深度整合,充分利用了 OpenMLDB 强大的功能特性和 Notebook 的便利性,从而打造一个快捷易用的机器学习开发环境。
基于真实的企业业务场景,将线上实时数据更好更快地转化为 AI 可用特征是加速人工智能落地的有效路径之一。因此,OpenMLDB 积极打通数据生态上游,继面向实时消息队列 Pulsar、分布式流处理平台 Kafka 的两款 connector 发布后,OpenMLDB 和 RocketMQ 合作推出 RocketMQ OpenMLDB Connector,助力实时数据到特征工程的高速传输,加速人工智能工程化落地。
未来 OpenMLDB 社区也将推出面向 Flink 的 connector,为开发者提供丰富的实时数据生态,为各类应用场景赋予高效特征工程能力。
在近期的 meetup 中 OpenMLDB PMC 卢冕以《OpenMLDB v0.5.0介绍:线上线下一致的生产级特征平台》为议题,从「 人工智能工程化落地的数据和特征挑战」 ,「OpenMLDB:构建线上线下一致的生产级特征平台」,「 OpenMLDB v0.5.0:性能、成本、易用性升级」三个方面介绍开源机器学习数据库 OpenMLDB。本文节选演讲中首次对外展示的 OpenMLDB v0.5.0 性能升级展示 和 OpenMLDB 应用案例介绍 部分整理而成。
随着业务的发展,模型应用场景的增加,AI 工程化落地成为了不少企业面对的切实挑战。近几年,应对这个痛点的新概念——MLOps 逐渐成为了机器学习领域的热门话题。OpenMLDB 提供FeatureOps 全栈解决方案,积极打通 MLOps工具链,建立起一个标准化的模型开发、部署与运维流程,降低开发者落地 AI 的门槛,使得企业组织能够更好地利用机器学习的能力来促进业务增长。
希望这场分享能够帮助大家了解 OpenMLDB 是什么,能做什么,适用于哪些场景。同时本文也将首次介绍 OpenMLDB的使用场景和生态构建。