会议内容

OpenMLDB 社区于 2022 年 6 月 25 日举行了第四期 meetup,会议相关视频及资料如下:

OpenMLDB PMC core member 卢冕,从低成本、高性能的线上线下一致性特征平台开源解决方案切入,为大家介绍线上线下一致的生产级特征平台 OpenMLDB 以及其在 v0.5.0 新版本中新增的性能改进、成本降低、灵活性增加三个特性。 视频连接:https://www.zhihu.com/zvideo/1525167543303700480 资料链接:https://pan.baidu.com/s/12Vk0syf-WgqQ1uBAXtTNBw 提取码:open

Apache RocketMQ PMC member 丁磊,以万亿洪峰锤炼下的消息处理平台——Apache RocketMQ 为议题,帮助大家了解 Apache RocketMQ 的高可用架构以及云原生时代 RocketMQ 面临的新的挑战。 视频链接:https://www.zhihu.com/zvideo/1525170014009634816 资料链接:https://pan.baidu.com/s/1vU8K1CA7D1aUO3-vggEXRw 提取码:open

Apache RocketMQ connect contributor 孙晓健,深度解析 Apache RocketMQ 的技术原理和应用场景,借 RocketMQ OpenMLDB Connector 带领听众探寻如何基于 RocketMQ 快速构建轻量的数据流转平台。 视频链接:https://www.zhihu.com/zvideo/1525170045735370752 资料链接:https://pan.baidu.com/s/1fJHmiC_-awjKPtkQFvaTYg 提取码:open

讨论交流

Q1: 请问 Scala 接口在 OpenMLDB 的后续开发计划中吗? A1: Scala 理论上也可以调用我们的Java SDK来进行连接。Scala 原生的 SDK目前在我们的 Roadmap 上,但是还没有具体推进展开。如果对这个需求感兴趣,也欢迎加入社区和我们一起开发。

Q2: OpenMLDB 支持向量化吗? A2: 目前 OpenMLDB 主要是结构化表格数据,不支持向量搜索功能(这一部分功能有不少优秀的开源工具可以支持)。如果要做向量化数据的存储,其实也能转换成表格形式,如果有用向量化数据做特征计算的需要可以用 OpenMLDB 。

Q3: 请问 OpenMLDB 怎么设置 lable?只是特征计算的话,配合哪个模型训练比较好呢? A3: OpenMLDB 提供特征计算功能,但不能做模型训练和推理,所以 label 这一列在 OpenMLDB 这边并不需要特别处理,直接保留并给到后面的模型训练就可以。 模型训练后面可以接的选择比较多。你可以参照我们的案例,接 LightGBM,或是其他模型,比如 XGBoost, Sklearn 等 。

Q4: 最近刚接触 featurestore 产品,发现 OpenMLDB 和 Feast 这类的开源产品对比,看起来缺少 feature view 元数据管理。以及 feast 这类产品是把计算能力交给其他云计算,OpenMLDB 更强调的是 sql engine 的计算能力。不知道理解是否正确? A4: feature view 的定义看起来和我们用 SQL 定义 feature 的概念是类似的,我们通过表格 schema, 以及 SQL 来描述数据源格式和 feature 抽取逻辑。当然这一块 Feast 的定义可能更加具象一些,我们会学习这种描述。 相比较 Feast 我们强调实时的特征计算,基于最新鲜的数据,而不是离线的特征计算以后线上再取。

OpenMLDB 社区

在此感谢大家对于本次 meetup 的大力支持,如果想进一步了解 OpenMLDB 或者参与社区技术交流,可以通过以下渠道获得相关信息和互动。 Github: https://github.com/4paradigm/OpenMLDB 官网:https://openmldb.ai/ Email: contact@openmldb.ai OpenMLDB 微信交流群: file