刚刚过去的OceanBase 2025年年度发布会AI含量较高,简单梳理一下:
OceanBase观察到面向Agent的混合搜索需求,会上提出了对AI原生数据库的一个论断:能不能支持混合搜索是AI原生数据库核心能力的分水岭。
1、数据库内核层面两大产品发布
OceanBase 4.4一体化融合版本,首次将TP、AP与AI能力集成于单一内核,商用LTS版本将于2026年2月2日推出。
OceanBase在一体化架构下持续演进,OceanBase 4.4是一个里程碑版本,这个产品实现了TP、AP和AI的三负载合一,能够同时兼顾核心系统以及多元化业务系统对数据库的需求,将是面向AI时代的底座基础,是主版本,在AI时代持续打造一体化AI原生能力。
AI原生数据库seekdb,基于Apache 2.0协议开源。seekdb支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容Hugging Face、LangChain等30余种主流AI框架。
此外,seekdb有一个比较大的特点是轻量化,最低仅需1核CPU、2GB内存,支持pip install一键安装。
seekdb值得说一说,创新性地从OceanBase主版本新开了一个面向AI的分支快速演进:
从用户角度来看, seekdb的轻量化降低了开发者的使用门槛,而且开源免费,兼容嵌入式与客户端/服务器双部署模式,可以快速部署开发。据悉,seekdb未来还会进一步降低内存。虽然轻量,但是能力还挺强,已经有企业通过seekdb构建统一AI知识库、实现AI Agent实时在线搜索。
从产品演进角度来看,轻量化可以快速迭代优化。这种轻量化的方式非常适合AI初期的创新探索,更具适应性和灵活性,应对不断变化的用户需求和市场环境,也便于从不确定中快速找到确定性的需求,并内化为产品功能特性,OceanBase主版本也会快速跟进这些AI功能特性。
AI与数据库的碰撞还在初级阶段,业内对什么是AI原生数据库也没有形成共识,不确定性是AI时代的一大挑战,轻量化的seekdb是一个不错的解决方案,开启了OceanBase面向AI时代探索的新篇章,当然也对其多版本控制和工程化能力提出了更高的要求。
2、围绕混合搜索的两个基础组件开源
AI场景需要RAG和上下文的能力,为了更好地支持Agent混合多模搜索落地,OceanBase开源了PowerRAG智能文档解析框架和PowerMem分层记忆架构。
PowerRAG基于RAGFlow构建,有较好的文档解析处理能力,以及最终召回的效果,已在蚂蚁集团内部真实业务场景中落地应用,具备企业级能力。
PowerMem兼容Mem0接口,帮助开发者、用户去管理大语言模型的上下文。在LOCOMO Benchmark上以73.70分登顶SOTA,Token消耗降低96%,大幅节省推理成本,在大规模、高频次调用大模型的场景中,可显著减少开支。
3、数据库工具中的AI发布升级
面向开发者的工具ODC推出DataPilot,为了避免Text2SQL解决方案SQL生成准确率低的问题,DataPilot采用Text2Metrics解决方案,先定义统一指标,对领域术语进行标准化规范,再通过这些指标约束大语言模型的生成范围。通过这一方式,将NL2SQL的转化准确率提升至92.2%,具备了业务实用性。
诊断监控产品OAS采用Agentic AI Multi-Agent架构重新设计,即通过一个主Agent负责核心任务的拆解与分配,再将不同细分任务精准下发给对应的专项Agent执行,实现了从“查指标找问题”到“AI助手通过对话送答案”的跨越。用户只需通过自然对话,就能全程完成诊断流程,系统还会一步步呈现诊断过程中的详细信息,方便进行过程干预。
4、OceanBase AI Stack智能一体机
新发布的OceanBase AI Stack智能一体机,提供基于OceanBase多模混合搜索数据的软硬一体解决方案,能完整覆盖企业从底层算力、模型、数据底座搭建到AI应用开发的全生命周期需求。
今年4月27日,OceanBase迎来组织人才升级,OceanBase CEO杨冰发布全员信,宣布OceanBase将全面进入AI时代,打造“DATA×AI”核心能力,建设AI时代的数据底座。为保障战略推进,OceanBase启动人才和组织体系升级,任命CTO杨传辉担任AI战略一号位,并成立AI平台与应用部、AI引擎组等新部门。
这次AI含量较高的年度发布会,OceanBase的AI战略交出了一份不错的答卷。