2月数据库圈值得关注的事 | 2025

2月,数据库圈是比较热闹的。Redgate和IDC的相关报告值得关注。Redgate 的研究表明,61% 的企业仍然担心使用人工智能会带来安全和隐私风险,57% 的企业对其准确性持谨慎态度;IDC的报告指出,经过多年的洗牌,中国分布式事务型数据库市场供应侧正在逐步的收缩集中,2024年市场竞争格局愈发清晰;Databricks、MongoDB、IBM继续收购整合……

市场动态

Redgate报告显示数据库管理行业将迎来整合之年

随着数据量和复杂性的快速增长,企业正努力通过重新评估其数据库战略来提高效率。许多企业不是扩大数据堆栈,而是进行私有化整合。

根据数据库管理解决方案提供商Redgate的《2025 年数据库现状》报告,只坚持使用一种数据库平台的企业数量已从2023年的21%跃升至2024年的26%。使用多种数据库技术面临的最大挑战是技能要求和个人/团队培训,这一比例从2023年的38%上升到2024年的26%。该报告显示,近四分之三(74%)的公司目前只使用三种或更少平台,使用四个或更多数据库的公司从 29% 下降到 9%。这一趋势表明,今年将是整合之年,企业将更注重效率和可管理性,而非单纯的扩张。

Redgate 的报告显示,甲骨文、MySQL、SQL Server 和 PostgreSQL 等传统关系型数据库仍占主导地位,但 MongoDB 和 Redis 等 NoSQL 平台正日益受到重视。

今年报告的一个重要启示是,为满足不断增长的人工智能应用、云的广泛采用和多种数据库平台的需求,技能差距正在扩大,提升专业技能的机会一直匮乏。

企业正在努力平衡使用人工智能的风险,这并不奇怪。Redgate 的研究表明,61% 的企业仍然担心使用人工智能会带来安全和隐私风险,57% 的企业对其准确性持谨慎态度。

报告指出人工智能的采用率从2023年的20%下降到2024年的仅15%,这反映出由于安全性、准确性和合规性方面的担忧,人们一直在犹豫不决。尽管增速放缓,但那些利用人工智能的企业却看到了实实在在的收益。受访者认为,在数据库管理中使用人工智能的最大好处包括自动化(47%)、任务简化(45%)和标准化(42%)。

IDC:中国分布式事务数据库进入规模化应用阶段

2月24日消息,近日,国际数据公司(IDC)首次发布的《2024年上半年中国分布式事务数据库软件市场跟踪报告》显示,2024上半年中国分布式事务数据库软件市场规模为1.5亿美元,同比增长18.5%。

2024年,分布式事务数据库产品和技术逐步成熟,已广泛应用于泛互联网、金融、运营商等行业,产品应用已经进入规模化阶段。IDC预测,2024年全年,中国分布式事务数据库市场规模预计为8.1亿美元,同比增长20.3%。到2028年,中国分布式事务数据库市场规模将达到18.2亿美元,2023-2028的5年市场年复合增长率(CAGR)为22.0%。

由于2024年下半年分布式数据库安全可靠测评名单的发布,未来针对本地部署分布式事务数据库的采购和落地将大幅加速。预计从2025年开始,本地部署分布式事务数据库软件市场的增速将超过公有云市场,2023-2028的5年市场年复合增长率(CAGR)将达到24.4%。

经过多年的洗牌,中国分布式事务型数据库市场供应侧正在逐步的收缩集中,2024年市场竞争格局愈发清晰,市场正在向以阿里云、腾讯、华为、金篆信科(中兴)等为代表的平台厂商,和以Oceanbase、Pingcap等为代表的独立分布式数据库厂商集中。

Databricks收购AI驱动的BladeBridge以简化数据迁移

2月7日,Databricks 收购了专门从事企业数据仓库迁移解决方案的初创公司BladeBridge,从而扩大了其产品组合。此次收购旨在帮助企业从亚马逊Redshift、Snowflake和Teradata等20多个数据仓库轻松迁移到Databricks SQL。

这家总部位于旧金山的大数据公司计划利用此次收购将BladeBridge技术与自己的平台整合,增加人工智能驱动的ETL功能,以简化和加速企业数据仓库迁移。交易的财务条款尚未披露。

BladeBridge 平台的一个关键优势是,与传统迁移工具不同,它使用大型语言模型(LLM)在转换前自动执行代码评估。通过优化这一过程,可以更快、更高效地将数据迁移到Databricks SQL 中。

MongoDB收购Voyage AI,帮助企业构建值得信赖的人工智能应用

2月24日,MongoDB公司今天宣布收购Voyage AI公司。将Voyage AI的技术与MongoDB集成,将使企业能够通过提供与运营数据深度集成的高准确性和相关性信息检索,轻松构建值得信赖的、AI驱动的应用。

为了解决AI幻觉挑战,企业需要高质量的检索,这是确保从数据中精确提取最相关信息的关键AI能力。Voyage AI 先进的嵌入和重排模型使应用程序能够从高度专业化和特定领域的文本和非结构化数据(从法律和财务文档到图像、代码和企业知识库)中提取意义。

Voyage AI的嵌入模型是Hugging Face社区评分最高的zero-shot模型。Voyage AI是人工智能驱动的搜索和检索领域的领导者,由斯坦福大学、麻省理工学院、加州大学伯克利分校和普林斯顿大学的世界级人工智能研究人员组成的团队提供支持。他们在尖端嵌入模型和检索架构方面的专业知识将增强MongoDB的人工智能能力,以解决构建和扩展人工智能应用方面最具挑战性的问题。

Voyage AI的嵌入和重排模型将继续通过voyage.ai、AWS Marketplace和Azure Marketplace提供,今年晚些时候将进一步推出MongoDB集成。

IBM收购DataStax以增强其数据库和生成式AI能力

2月25日,IBM宣布收购Apache Cassandra的商业公司DataStax,以增强其数据库和生成式AI能力。2020年5月,DataStax推出了Astra DB,这是Cassandra的完全托管版本,在云端为客户提供NoSQL数据库的可扩展性和可用性。后来,该公司开始将业务扩展到NoSQL数据库之外。2021年,DataStax推出了Astra Streaming,与Apache Kafka竞争。

DataStax通过自建和收购积累的所有能力显然引起了IBM的注意,IBM看重DataStax如何在单一产品下构建其非结构化数据管理能力。IBM数据和人工智能业务总经理Ritika Gunnar表示,IBM希望将DataStax的开源产品与其watsonx产品组合(特别是Apache Iceberg、Apache Spark、Velox和Presto)相结合,帮助客户利用大量非结构化数据。

达梦数据2024年营收突破10亿元,实现营收净利双增长

2月25日晚,达梦数据发布的2024年度业绩快报显示,公司2024年实现营业收入10.44亿元,同比增长31.49%;归母净利润3.62亿元,同比增长22.26%。

对于业绩增长原因,达梦数据表示,公司产品、技术和解决方案获得市场充分认可,公司品牌知名度和影响力稳步提升,综合实力显著增强,实现了营业收入和利润的双增长。

星环科技发布2024年度业绩快报

2月28日,星环科技发布2024年度业绩快报。业绩快报显示,2024年星环科技实现营业总收入3.71亿元,同比下降24.31%;归属于母公司股东的净利润-3.42亿元,同比下降18.76%。截至报告期末,星环科技总资产13.98亿元,较期初下降22.02%;归属于母公司的所有者权益11亿元,较期初下降23.81%。

星环科技表示,本报告期业绩同比下降,主要系受宏观经济影响,2024年度客户在采购决策上更为谨慎,招标时间点较往年出现后置,且验收流程耗时延长,致使公司整体收入确认时间延后,进而导致公司收入下降、亏损扩大。

产品与解决方案

Memgraph通过支持GraphRAG加强人工智能开发

2月10日,图数据库Memgraph 3.0正式发布,Memgraph 3.0将推出一系列新功能,使数据库更适用于新兴的生成式人工智能工作负载,例如为聊天机器人或人工智能代理提供服务。

Memgraph 3.0 的第一个新功能是增加了向量搜索。通过将图数据存储为向量嵌入,用户就能将明确的关系(由图节点和边定义)输入语言模型的上下文窗口,从而作为 RAG 或 GraphRAG 的一部分获得更好的结果。

语言模型的上下文窗口越来越大。例如,谷歌Gemini 2.0模型现在可以在上下文窗口中接受 200 万个tokens。这是一个很大的数据量,相当于约 150 万个单词,但这本身可能不足以确保准确性。可以利用一些具有社群检测功能的传统图算法,将数据分成有意义的组,然后对每个组进行部分总结。

Memgraph对GraphRAG的支持还将减少语言模型产生幻觉的倾向,并提供更高质量的答案。Memgraph 3.0还增强了Cypher的自然语言界面GraphChat。有了这个版本,Memgraph 客户可以用简单的英语提出,GraphChat 会将其转换为 Cypher 格式,以便在 Memgraph 上执行。Tomicevic 说,这将降低获取复杂图数据科学功能的门槛。

Snowflake 释放人工智能代理,解锁企业数据

2月12日,Snowflake 今天宣布了 Cortex Agents 的公开预览版,这是一类新的人工智能代理,可以使用结构化和非结构化数据执行一系列业务任务。该公司还宣布,得益于 Anthropic 最新的 Claude 3.5 Sonnet 模型,Cortex Agents 正在实现同类最 佳的代理性能。

Cortex Agents 是一类新的生成式人工智能应用,其设计功能类似于人类工作者。它们可以自动执行多步骤、数据密集型任务,如访问结构化和非结构化数据、运行复杂查询并将数据反馈给用户。

目前有两个 Cortex Agents 代理,包括:

Cortex Analyst 是基于 Anthropic 最新的 Claude 模型,提供文本到 SQL 的转换,专为处理数据库表和视图等结构化数据而设计;

Cortex Search 基于 Snowflake 的 Arctic AI 模型,专门用于回答有关非结构化数据(如 PDF 或 .txt 文档)的问题。

甲骨文将19c数据库支持期延长至2032年,成为 “最长的战略版本”

近日,甲骨文公司推迟了其流行的19c数据库的支持终止日期,因为用户正在等待其最新数据库23ai的主流内部部署版本的消息。

甲骨文在最近发布的一份公告中表示,将把19c的支持截止日期推迟到2029年12月31日(高级支持)和2032年12月31日(扩展支持)。

除了 23ai 之外,19c 是最新的 “长期版本”。21c 是 “创新版本”,其支持时间不长,也没有资格获得扩展支持。截至 2022 年,甲骨文公司为 19c 提供了直至 2024 年 4 月的 “高级支持 ”和直至 2027 年 4 月的 “扩展支持”。2023 年,甲骨文免除了 19c 的扩展支持费用,直至 2026 年 4 月 30 日。

去年 5 月,甲骨文推出 23ai 时放弃了 “c ”系列, 23ai 推出了新功能,包括本地向量数据类型和 “优化的 ”向量相似性搜索索引。

InfluxData和 AWS推出了用于InfluxDB读取副本的Amazon Timestream

2月21日,InfluxData和AWS推出了用于InfluxDB读取副本的Amazon Timestream,扩大了双方的战略合作范围。

对于运行InfluxDB 2.7 OSS的开发人员来说,读取副本(Read Replicas)通过在不同可用性区域创建主数据库实例的副本,提供了一种处理扩展工作负载的简单方法。这可以提高查询性能、可扩展性和可靠性,而无需管理多节点集群的复杂性。

读取副本的推出建立在InfluxData与AWS合作的基础上。去年,两家公司推出了针对InfluxDB 的 Amazon Timestream,使开发人员能够在AWS上原生运行开源InfluxDB--完全托管,没有自托管开销,并能在几分钟内开始运行。 现在,InfluxData和AWS将通过读取副本(Read Replicas)进一步提高关键任务工作负载的可扩展性。

读取副本是中小型工作负载的理想选择,这些负载需要持续的正常运行时间和一致的性能,而不需要操作开销或复杂性。用户可以利用它们实现以下目的:分布式查询扩展、热备故障切换、提高写吞吐量等

阿里云PolarDB重磅发布云原生与Data+AI新特性

2月26日 2025阿里云PolarDB开发者大会上,云原生数据库PolarDB正式推出内置大模型的PolarDB AI版本,帮助个人和企业开发者快速部署并上线AI应用。

PolarDB AI新版本提供3大Data+AI特性:植入通义千问和DeepSeek全系产品,同时支持用户自定义模型,帮助个人和企业开发者快速部署并上线AI应用;PolarDB AI节点采用模型算子化(Model as an Operator)形态,支持客户直接在数据库内部(In-DB)进行搜索推理优化,推动用户进入数智时代;通过基于KV Cache等技术优化,在相同GPU条件下,PolarDB在线推理吞吐量可提升10倍以上,同时帮助客户降低部署成本。

阿里云在会上透露,PolarDB秉承软硬件协同设计理念,即将于2025年下半年发布全球首款基于CXL(Compute Express Link)交换机的数据库专用服务器。利用CXL高速互联技术,进一步提升三层分离架构下计算与内存之间的通信带宽与效率。

The Others

TiCDC 新架构试用通道已开启,解锁 TiDB 数据同步新体验

一直以来,TiCDC 作为 TiDB 生态系统中不可或缺的增量数据同步工具,在数据库灾备、数据集成、流处理与实时分析、业务连续性保障、多写多活等场景都扮演着重要的角色。为了给大家带来更好的产品体验,研发团队在提升 TiCDC 性能、稳定性、扩展性方面不断发力,为 TiCDC 设计了全新的架构。

2 月 13 日 - 3 月 14 日,TiCDC 新架构试用活动正式开启。试用过程中你不仅可以熟悉 TiCDC 新老架构原理与使用方法以提升技术水平,还能够参与新架构测试与反馈,影响其未来优化方向,成为 TiDB 产品发展的参与者与推动者。

GBASE南大通用与东华医为完成产品兼容认证

2月14日消息,日前,GBASE南大通用与东华医为科技有限公司完成产品兼容联合认证。南大通用集中式事务型数据库GBase 8s V8.8、分布式事务型数据库GBase 8c V6与全民健康平台、检查检验结果互认平台、医共体平台、超声影像信息系统iUS4.8、放射影像信息系统iPACS4.8、内镜影像信息系统iES4.8等二十余款软件产品完成兼容性、功能、性能等方面的深度适配与调优。

Bytebase签约Dwango

2月17日消息,Bytebase签约是日本知名的互联网与数字娱乐公司Dwango。为了提升数据库管理的效率与安全,Dwango 选择了 Bytebase 来优化其数据库变更与查询操作。Bytebase 通过一体化的数据库 CI/CD 流程,简化了数据库变更管理,涵盖了 SQL 审核策略、自定义审批流、批量变更、一键回滚及历史查询等功能,确保了数据库操作的准确性与流畅性。

“网络发展新图景”成就展开幕,自研数据库OceanBase参展

2月20日,“网络发展新图景”成就展在中国国家博物馆开幕,国产自研分布式数据库OceanBase参展。

此次展览,OceanBase的新一代数据库一体机作为展品亮相。该一体机是基于可信硬件打造的软硬一体化数据库产品,其操作系统、数据库、核心处理器、存储、网络交换机等核心软硬件均为国内自主研发,通过全链路、全体系自研帮助企业实现高质量转型。

EDB Postgres AI在新基准测试中超越甲骨文、SQL Server和MongoDB

2月20日,EnterpriseDB(EDB)宣布了McKnight Consulting Group的一项新基准研究结果。该研究证实,EDB Postgres AI在事务处理、分析和人工智能工作负载方面的性能优于Oracle、SQL Server、MongoDB和MySQL,可提供更好速度、成本效益和可扩展性,同时让企业完全控制其主权数据。

世界第 一!阿里云PolarDB刷新全球数据库性能及性价比记录

2月26日,在2025阿里云PolarDB开发者大会上,阿里云宣布PolarDB登顶全球数据库性能及性价比排行榜。根据国际数据库事务处理性能委员会(TPC,Transaction Processing Performance Council)官网披露,阿里云PolarDB云原生数据库以超越原记录2.5倍的性能一举登顶TPC-C基准测试排行榜,以每分钟20.55亿笔交易(tpmC)和单位成本0.8元人民币(price/tpmC)的成绩刷新TPC-C性能和性价比双榜的世界纪录。

该记录是中国基础软件取得的又一里程碑式成就,标志着PolarDB创新的云原生架构不仅突破了单集群的扩展性瓶颈,还成功抗住了全球最大规模的并发交易峰值,在性能、可扩展性等多个维度均处于全球领跑者位置。

打开APP阅读更多精彩内容