十一月,OpenMLDB 进行了高频的小版本迭代,共发布四个版本,平均每周一次。v0.6.5、v0.6.6、v0.6.7 和 v0.6.8 陆续与广大开发者见面,在增强功能的同时,也提高了运维效率,对易用性、可观测性、自动化等方面进行了改进。

技术动态

十一月 v0.6.5 - v0.6.8 新特性

  • 优化表分区的分布(Optimize the distribution of table partitions)

  • 添加一个新的工作流来自动生成内置函数的文档(Add a new workflow to generate the documents of built-in functions automatically)

  • 支持新的 SQL 语句 show joblog (Support the new SQL statement show joblog )

  • 添加显示表状态的警告消息(Add a warning message for show table status )

  • 添加用于数据恢复和横向扩展/纵向扩展的新工具(Add a new tool for data recovery and scale-out/scale-in )

  • 支持新的内置函数 hash64 (Support the new build-in function hash64)

  • 支持从/向配置单元导入和导出数据 (Support importing and exporting data from/to Hive)

  • 改进了 autof 的模块 (Improve the module of autofe)

  • 改进了 TaskManager 客户端的错误消息 (Improve error messages of the TaskManager client)

  • 支持 SQL 批处理引擎中的 where 子句 (Support the where clause in the SQL batch engine)

  • 在 APIServer 中支持 JSON 格式的输入和输出 (Support input and output with the JSON format in APIServer)

十一月主要 Bug 修复

  • 当模式与 parquet 文件不匹配时会在脱机模式下加载错误数据 (Incorrect data will be loaded in offline mode if the schema mismatches with parquet files. )

  • 如果在 SQL 语句中指定数据库,则创建索引失败(Creating index fails if specifying a database in SQL statement)

  • 提交作业后,start_time 不可读(start_time is not human-readable after submitting a job)

  • MemTable 中产生了错误的 GetRecordIdxCnt 结果(Incorrect result of GetRecordIdxCnt is produced in MemTable )

  • 在 MacOS 虚拟机中找不到 pytest 命令。(pytest command is not found in the MacOS virtual machine.)

  • 错误的输出架构传递到 WindowAggRunner。 (Wrong output schema passes to the WindowAggRunner.)

  • 如果未指定数据库,则执行 showopstatus 命令时没有输出 (There are no outputs when executing showopstatus command if no database is specified)

  • 数据恢复工具在某些情况下会失败 (The data recovery tool fails in some cases )

  • Python SDK 工作流在 MacOS 上可能会失败。 (Python SDK workflow may fail on MacOS.)

  • 某些日志消息中存在语法错误。(There are syntax errors in some log messages. )

  • 安装 Python SDK 需要冗余的安装包。 (Installing Python SDK requires unnessary packages.)

社区动态

社区活动

分享活动

  • 11月16日 19:30-21:00
    OpenMLDB 项目发起人、第四范式技术副总裁 郑曌 受邀主持 DataFunSummit 2022 AI基础软件架构峰会圆桌会,与一流科技创始人 袁进辉、百度飞桨总架构师 于佃海等资深专家在线上做深度的交流分享。

  • 11月19日 13:30-17:30
    OpenMLDB 项目发起人、第四范式技术副总裁 郑曌 作为出品人发起 DataFunSummit 2022 MLOps 及 AI 工程化落地论坛,与阿里云高级技术专家 林东、微软首席数据科学家 朱晓勇等业界专家共话 AI 应用落地。其中 OpenMLDB PMC 卢冕 在论坛中为大家带来议题为《开源机器学习数据库 OpenMLDB:线上线下一致的生产级特征平台》的内容分享。

  • 11月19日 14:30-15:30
    OpenMLDB PMC 祁利国在 GIAC 全球互联网架构大会人工智能基础设施专题 中为大家带来议题为《开源数据库 OpenMLDB:线上线下一致的实时特征平台》的内容分享。

贡献活动

  • OpenMLDB Bug 悬赏令仍在进行中。

  • 开源摘星活动活动也在持续进行。

  • OpenMLDB 贡献者任务第五期、开发者嘉年华在十一月落下帷幕。

  • OpenMLDB 参与的高校开源活动——2022 开源之夏和 GLCC 编程夏令营于十一月圆满结束并完成公示。

希望各位开发者在开源活动中获得技术上成长进步,也在测试使用中加深对 OpenMLDB 的了解掌握,与 OpenMLDB 共建包容有活力的开源生态。

后续,OpenMLDB 也会积极合作或组织开展开源活动,为各位提供更丰富的开源实践机会、更广阔的开源参与平台。

Meet us

OpenMLDB Github 主页(更多动态请关注这里!)

https://github.com/4paradigm/OpenMLDB

OpenMLDB 微信交流群