OpenMLDB v0.5.0 于近期正式发布,性能和功能实现重大优化更新和升级。

三大核心升级带来性能、成本、灵活性的全面优化:

  • 在线性能数量级提升:引入预聚合技术,优化长窗口实时处理效率
  • 低成本落地选择:线上引擎引入基于外存的存储引擎
  • 使用场景灵活性扩展:支持用户自定义函数(UDF)开发

OpenMLDB v0.5.0 发布 | 性能、成本、灵活性再攀高峰!

升级一:预聚合技术,优化长窗口实时处理效率

  • 应用场景:一个时间窗口内包含上百万条记录的业务场景(比如横跨数年的长时间窗口),基于纯计算的特征生成方式会带来较高的延迟,并且可能包含了大量的重复计算。
  • 版本升级:OpenMLDB v0.5.0 版本引入全新的预聚合技术,在数据到达时,由数据驱动计算,实时更新预聚合表,大幅节省实时计算时的工作量,部分场景实现超10倍的性能提升。

升级二:线上引擎引入基于外存的存储引擎

  • 应用场景:对于成本较为敏感,但是可以容忍一定性能下降的场景(OpenMLDB 的线上引擎默认使用自研的高性能内存时序数据存储引擎。基于内存的存储引擎虽然带来了极致的存取性能,但是当数据量较大时,内存会带来显著的成本开销)。
  • 版本升级:OpenMLDB v0.5.0 引入了基于外存的存储引擎作为一个额外的选择,使用基于 HDD/SSD 的存储引擎,可将 OpenMLDB 整体的使用成本降低75%以上。

升级三:支持用户自定义函数(UDF)开发

  • 应用场景:非常复杂的应用场景(OpenMLDB 虽然提供了扩展的 SQL 用于特征开发,但是对于非常复杂的场景,依然可能存在表达能力不足的情况,导致用户场景无法上线)。
  • 版本升级:OpenMLDB v0.5.0 版本开放了基于 C/C++ 的用户自定义函数(UDF)的功能,并且支持动态注册。用户的复杂场景可轻松通过 UDF 扩展实现,突破原有 SQL 表达能力的限制。

预告 | 测试报告

OpenMLDB 第一版官方性能基准测试报告将于近期发布,带你详细了解不同场景下 OpenMLDB 的预期性能表现,敬请关注~

预告 | OpenMLDB Kafka Connector

OpenMLDB Kafka Connector已完成开发,原理及操作指南也将于近期发布,欢迎关注~

相关链接:

OpenMLDB 官网:OpenMLDB - 生产级特征开发全栈解决方案

OpenMLDB GitHub链接:GitHub - 4paradigm/OpenMLDB: OpenMLDB is an open-source machine learning database that provides a feature platform enabling consistent features for training and inference.

OpenMLDB v 0.5.0:Release v0.5.0 · 4paradigm/OpenMLDB · GitHub

OpenMLDB v0.5.0 发布 | 性能、成本、灵活性再攀高峰!