数据库有哪些(数据库种类及特点)

作者|李冬梅修改|蔡芳芳本文是“2022 InfoQ年度技术盘点与展望”系列文章之一,由InfoQ编辑部制作并呈现,聚焦2022年数据库领域的重要进展和趋势,希

作者|李冬梅

数据库有哪些(数据库种类及特点)

修改|蔡芳芳

本文是“2022 InfoQ年度技术盘点与展望”系列文章之一,由InfoQ编辑部制作并呈现,聚焦2022年数据库领域的重要进展和趋势,希望帮助您准确把握2022年数据库领域的核心发展脉络,始终保持足够的行业技术敏锐性。

“InfoQ年度技术盘点与展望”是InfoQ全年内容评选最重要的议题之一,将涵盖操作系统、数据库、AI、大数据、云原生、架构、大前端、编程语言、开源安全、数字化等十个方向。随后,聚合将扩展为话题、迷你书、直播周、收藏页,陆续在InfoQ media matrix发布。欢迎继续关注。

我要感谢Jags Ramnarayan、Pater、Michael Cahill、孙元昊、陶建辉和阳传会(按字母顺序排列)对本文的贡献。他们的见解是在这篇文章中与你相遇的关键。

对于数据库技术来说,2022年是激动人心的重要一年。在过去的一年中,数据库技术仍然围绕云原生、无服务器、分布式等核心方向快速发展。但与前几年相比,数据库市场的客户逐渐成熟,对产品的理解更加理性,要求也相应越来越高。不难看出,数据库领域的发展已经进入深水区。

如果说过去数据库厂商更注重框架和架构建设,那么在2022年,他们进入了数据库性能、成本、易用性等细节的打磨阶段,开始了对性能的极致追求。

2022 年数据库领域大事件回顾

1月21日,北京国家金融科技认证中心正式发布2021年分布式数据库标准符合性测试参与机构名单,其中腾讯云分布式数据库TDSQL榜上有名,成为首个通过测试的互联网公司数据库产品。

2月11日,elastic版本正式发布,重点完善Elasticsearch的向量搜索功能,为现代自然语言处理模型提供原生支持,进一步简化数据上线流程,精简安全防护体验。弹性8.0在速度、可扩展性、相关性和简单性方面开创了一个全新的时代。

2月17日,由信通院主办的国内首届金融数据库性能测试工具开源大会在线举行。会上,金融数据库性能测试工具DataBench-T正式开放。

4月1日,TiDB宣布官方开源分析引擎TiFlash,这是为TiDB提供HTAP能力的重要一环。t flash的框架代码是基于ClickHouse的,但是和ClickHouse有着完全不同的场景,t flash完全专注于事务性数据的分析。

4月,星环科技升级多模型大数据基础平台TDH 9.0,实现9个存储引擎支持10个数据模型。

4月27日,Redis正式发布7.0版本,增加了近50个新的命令和选项来支持这种演进,并扩展了Redis的现有功能。

5月12日,在谷歌I/O 2022开发者大会上,谷歌云平台GCP宣布推出AlloyDB for PostgreSQL,这是一项完全托管且兼容PostgreSQL的数据库服务。

5月16日,在中国信通院组织的第十四批“可信数据库”产品能力评估中,华为云数据库GaussDB(for openGauss)完成了信通院首次防篡改数据库产品评估。

6月8日,MongoDB World 2022大会,MongoDB宣布推出查询加密功能和关系数据库迁移器。有了这项技术,没有密码学经验的开发人员可以在不影响性能的情况下,以简单直观的方式查询加密的敏感数据。

6月29日,武汉大梦数据库股份有限公司正式提交招股说明书,拟在科技创新板上市。招股书显示,大梦本次公开发行不超过1900万股,拟募资23.51亿元。

6月29日,HTAP综合实时数据库StoneDB正式开放。StoneDB是一个HTAP数据库,支持行列混合存储和内存计算。它采用了自主研发的存储和计算引擎,可以将MySQL的分析性能提升100倍。

7月23日,蚂蚁集团时间序列数据库CeresDB正式开源,并发布开源版本CeresDB 0.2.0。蚂蚁集团表示:“通过开源,我们希望帮助用户解决时间序列数据存储的横向扩展和高可用的痛点,甚至对时间序列数据复杂的分析和计算能力的需求。”

8月10日,OceanBase4.0(小鱼)正式发布,这是业内首个单机分布式集成数据库。可以实现单机部署,兼顾分布式架构的可扩展性和集中式架构的性能优势。RTO从30秒到8秒,进入了真正的秒级容灾时代。大会还宣布OceanBase Cloud全球开放。

8月13日,淘思数据发布了TD引擎3.0版本,带来了几大核心特性,包括云原生架构、流计算和增强的数据订阅功能。更重要的是,3.0系列版本开始提供全平台支持,服务器/客户端已经支持Linux、Windows、MacOS。

10月18日,国内首个大数据基础软件星环科技正式登陆科创板,发行价47.34元/股,开盘后报72元/股,上涨52%。

10月18日,甲骨文宣布推出MySQL HeatWave Lakehouse云数据湖库。Oracle表示,MySQL HeatWave可以在多个云上提供集成服务,用于事务处理、跨数据仓库和数据湖的分析以及无需ETL的机器学习。

11月,MariaDB团队宣布准备在中国成立实体公司,并积极准备拓展中国市场。明年,MariaDB将有一个专门的本地团队来服务中国市场,并将发布新产品,如XPAND(Maria db的分布式SQL数据库)。此外,Maria DB团队还计划将云版本的SkySQL引入中国市场。

12月19日,MariaDB Plc。表示已完成与特殊目的收购公司Angel Pond Holdings Corporation的合并,合并后的公司更名为MariaDB Plc。MariaDB的普通股和认股权证已于12月19日在纽约证券交易所注册,合并已获得两家公司董事会和股东的批准。

数据库领域年度关键词

数据库不是一个新领域。已经发展了40年。作为基础软件之一,它是一个传统而古老的领域。然而,近年来,数据量的爆炸式增长和云化趋势的不断深化,正推动数据库领域进入一个新的发展阶段。

在采访了众多国内外资深数据库专家后,InfoQ得出了2022年数据库领域的三个关键词,其中“集成”一词成为被提及频率最高的词。

融合

这里所说的“融合”不仅指各类数据库的融合,还包括软硬件融合、混合负载、分布式和单机、多模态融合等。,但实际上融合问题并不容易解决。

比如软件和硬件的整合就是一个难题。数据库经历了多年的发展,其底层架构和算法已经完全为过去的硬件网络和其他基础设施设计,以获得最佳性能。然而,随着新硬件的发展,如新的CPU架构、新的存储介质以及新的网络架构的发展和成熟,数据库的底层机制必须进行相应的调整,以充分发挥新硬件的特性。

另外,分布式和单机的集成也有一定的技术难度。与分布式数据库相比,单核数据库不需要大量的分布式事务处理,因此性能高于分布式数据。但是数据库面对的市场是一个复杂多样的市场,有些场景可能是单机数据库可以支持的。使用分布式数据库显然有点大材小用,但有些场景需要分布式数据库来支持海量数据和海量事务。那么如何在数据库规模比较小的情况下表现为一个单机数据库,不需要复杂的分布式事务机制,并且随着数据规模的增长,能够自动成长为一个分布式数据库,不需要大规模的数据库迁移等。,是必须考虑的关键问题。

很多厂商如TDSQL开始尝试采用对等架构实现存储和计算的平衡,使数据库产品兼顾不同规模的场景,达到不同的平衡;而OceanBase则推出单机分布式集成架构,打造更加开放、灵活、高效、易用的下一代企业级分布式数据库。在不增加分布式相关开销的情况下实现在线横向扩展,使其可以部署在类似集中式数据库的小规模服务器上,单个节点的性能可以达到甚至超过集中式数据库的水平。

AI与数据库的融合也在不断深入。进入2022年后,AI与数据库的融合趋势越来越明显,AI成为企业挖掘数据商业价值的最大驱动力。以前企业数据可用性不高,样本量有限,无法在毫秒级分析大量数据;人工智能和机器学习技术让企业在数据容量和数据源可用性上有了质的飞跃,才有了真正的大数据接入和实时处理能力。

大统一是很多自然科学领域的终极梦想,数据库的大融合也是数据库从业者的梦想,但往往涉及诸多因素的平衡,面临越来越复杂多样的场景,现阶段很难做到完美的统一。

数据云

数据云也是今年被频繁提及的关键词之一。它更多的是一个数据基础设施的概念。从技术角度来说,数据云是提高整体数据分析能力,提高数据分析的实时性;从业务角度来看,数据云可以帮助数据库供应商在云上扩展更多不同的客户。

可以看到,今年很多开源数据库产品都发布了自己的云版本,即云服务订阅版本,包括TiDB、OceanBase、SelectDB、TDengine等国内知名数据库厂商。这无疑是探索开源数据库产品商业化的较好路线。相比云厂商通过数据库的深度软硬件协同提供产品竞争力,开源厂商基于多个云平台提供的云容灾切换方案也有一定的市场发展空。

Serverless

近年来,无服务器数据库的大火被称为下一代数据库的演进方向。事实上,无服务器数据库并不是近两年的新概念。早在2004年,由于亚马逊的电子商务网站面临着数据库可扩展性的挑战,无服务器数据库的探索之旅就已经开始。

无服务器数据库可以根据应用程序的要求自动扩展和收缩,并具有内置的高可用性和容错能力。云服务提供商动态管理无服务器数据库背后的计算资源分配,云服务提供商将计算资源变成一个池,用户无需创建实例即可快速完成部署。

具体到数据库层面,只要用户使用基于无服务器特性的数据库,就可以根据函数操作所消耗的内存和执行时间,按照使用量进行收费,大大降低了数据库的使用成本。

自从无服务器开发以来,无服务器数据库开始强调极端的资源分配曲线与实际业务需求曲线之间的匹配。目前可以实现秒级按需计费,既可以提高资源利用率,又可以影响业务的突发流量,因此被越来越多的企业采用。

2022 年,数据库领域这些趋势值得关注

作为三大基础软件之一的数据库领域,如今面临着巨大的发展机遇——据IDC预测,2022年全球数据管理软件市场规模将达到849.7亿美元,2026年将增至1378.2亿美元。这么大的市场空,隐藏着哪些机遇和挑战?展望2022年,有哪些值得关注的重要趋势?

自研分布式数据库迎来落地爆发期

在云计算发展和本地化趋势的推动下,国内数据库的需求正呈现爆发式增长。在过去的几年中,分布式数据库发展迅速,成为面对海量规模和高并发的利器。通过几年的实践,产品的基本功能、稳定性、性能已经趋于成熟,各数据库厂商开始在产品可用性、可观测性、诊断能力、生态兼容性等方向发力,并陆续取得成果。

回顾过去的一年,随着国内数据库合作生态的日益壮大,以及降本增效的迫切需求,传统行业开始了向分布式数据库的转型升级之路。国内数据库生产的广度和深度一直在不断增加,广度就是商机的增加,这一方面为众多厂商提供了巨大的机会,另一方面也给目前尚不成熟的国内数据库产品能力和服务能力带来了更大的挑战;从深层次来看,分布式数据库已经真正在金融业、证券业、餐饮业、汽车业、房地产业等传统企业的核心系统中落地。

比如TDSQL今年已经服务了10大银行中的7家,OceanBase也在富滇银行、招商证券、红塔银行等企业关键系统中发挥了作用,服务了1/4的头部金融机构。这些无疑证明了国内自研数据库的能力,但也对数据库的稳定性和数据一致性提出了更高的要求。

上云趋势持续火热

近日,Gartner发布了最新的数据库中国市场指南报告,该报告指出,中国的数据库行业将加速增长,并逐步迁移到云。

事实上,数据库上云的趋势并不是今年才有的。早在几年前,很多外企甚至很多民营医院都已经在云端部署了数据库。过去,特定行业的组织,如金融、政府和公共服务,对数据和信息的保密性要求较高,因此担心公有云的数据安全、数据主权和合法合规性,首选私有云或本地部署。但Gartner观察到,国内部分企事业单位正在考虑将具有核心任务的事务型数据库迁移到公有云,这反映出近期业界对公有云的关注度在下降,混合云模式的比例将进一步增加。

云数据库凭借其按需付费和按需扩展、高可用性和存储集成等优势,已经占据了海外市场的半壁江山。据行业权威人士称,美国至少有一半以上的数据库运行在云上。虽然国内数据库上云的趋势没有国外那么迅猛,但是非常明显。

对数据安全的重视达到了前所未有的程度

近年来,全球关键信息基础设施网络安全事件层出不穷,涉及电力、石油、制造业等国计民生领域。2022年初,由于勒索软件的攻击,比利时阿姆斯特丹、鹿特丹和安特卫普多个港口的石油装卸和转运受阻,进一步将国际油价推至近年来的最高水平。数据面临的威胁从未像今天这样严重。

目前,用户面临的主要数据库安全威胁包括SQL注入攻击、缓冲区溢出、默认设置或弱密码、配置错误、用户账户破坏等。泄露或篡改数据可能导致企业面临许多负面影响,如资产负债、监管罚款、利润损失或客户投诉等。作为承载数据的数据库系统,其安全性也关系到企业的生存和发展。

尤其是今年,政府和企业各界对数据安全给予了前所未有的重视。今年8月,国家互联网信息办公室编制了《数据出境安全评估申请指南(第一版)》,对数据出境安全评估的申请方式、申请流程、申请材料等具体要求进行了说明。10月12日,国家市场监督管理总局(国家标准化管理委员会)发布公告,批准两项国家标准。其中,《信息安全技术关键信息基础设施安全保护要求》作为2021年9月1日《关键信息基础设施安全保护规定》正式发布后的首个关键标准,将于2023年5月1日实施。

产研结合,深化数据库人才培养

除了数据和数据库系统的安全,数据库行业的人才生态培养也在今年达到了新的高度。为促进高校与企业创新合作,推动创新链产业链深度融合,教育部、工业和信息化部、国家知识产权局决定联合组织开展“千校千企”协同创新伙伴行动(简称“千校千企”行动)。这项行动的主要目标是将这些与数据库和其他“瓶颈”技术相关的企业与大学联系起来,将基础软件,即数字化转型的基础,建设得更加坚实和安全。

以星环科技为例,今年星环科技与国内多所知名高校达成合作,共同培养创新人才。通过这种创新的合作模式,以信息化手段建立和完善校企对接的常态化机制,降低对接成本,提高对接效率,促进协同创新。

数据库未来展望

如上所述,在过去的2022年,以云原生和分布式为主的新型数据库开始大规模登陆各行业核心系统。此外,各种类型的数据库集成的趋势越来越明显。数据库未来会如何发展?InfoQ综合了许多受访专家的想法,可以总结如下:

国内数据库厂商 3~5 年内将仅存个位数

随着基础软件领域成为资本热点,2020-2021年超过40家国内数据库公司获得融资。值得一提的是,仅2021年,新成立的数据库公司就超过30家,获得新一轮融资的企业多达20家。

资本的青睐带来了数据库厂商过去几年的井喷式增长,但资本的过热也带来了相应的弊端:产品能力参差不齐,同质化严重,技术储备不足。......

虽然近几年国内数据库行业发展迅速,在开源和云计算的帮助下,中国的数据库有机会在全球市场占据一席之地,但国内数据库市场整体相比已经发展了四五十年的海外数据库市场还是略显不足。

许多受访者表示,2021年,中国的数据库资本处于泡沫的顶峰,未来三到五年,数据库厂商的数量会越来越少,因为客户和应用开发者无法以如此高的成本适应和选择不同的数据库,这个市场无法容纳数百个数据库。随着客户逐渐开始使用国产数据库,只有那些长期坚持投入数据库领域,打磨数据库产品的积极分子,才能提供优秀的服务,最终生存下来。

抢夺本土市场之外,出海成为新增量

IDC发布的《2021年下半年中国关系数据库软件市场跟踪报告》显示,除亚马逊云技术、甲骨文和微软外,前八名中的其他五家都是中国厂商,占据了超过74%的市场份额。

来源:IDC 中国,2022来源:IDC中国,2022年

在国内做大做强之后,数据库出海成为国内厂商新的增量逻辑,欧美航线和东南亚航线是国内厂商出海的最佳选择。两年前,腾讯云数据库TDSQL在印尼Bank Neo Commerce Bank的新核心系统中完成并投入使用。蚂蚁集团的Oceanbase已经服务了印度、印尼、菲律宾、巴基斯坦等国家的金融科技公司,并开始进军北美市场。淘思数据、星环科技等企业的海外业务也持续增长;数据库创业公司,如PingCap、Zilliz、奇点等。,从一开始就定位国际化。

然而,中国企业出海面临的障碍是不可避免的,如信任、监管、地理位置、地缘政治等。上云、开源、对新技术的敏感,成为国产数据库除了基础技术之外,能否顺利出海的关键要素。

开源与商业化相辅相成

进入21世纪以来,数据本身的增长速度极快,尤其是近年来各行各业的数字化,如智能汽车、物联网、VR/AR等。,每年产生和存储的数据一直保持着较高的增长率。但从管理数据的规模来看,Oracle/ Microsoft /Teradata等传统商业数据库的比例在逐渐下降,而开源数据库的比例在不断上升。

根据2022年12月DB-Engines公布的全球数据库排名可以看出,以MySQL、PostgreSQL、MongoDB为代表的开源数据库占据了数据库市场的半壁江山。对于这些软件来说,开源是它们成功的关键。

虽然开源的增长会对传统的商业数据库市场造成一定的冲击,但是开源也帮助了云数据库市场的发展。客观来说,开源本身和商业并不冲突。许多开源数据库和云结合起来产生了许多新的商业模式。比如很多开源数据库都推出了云服务版本,可以部署云灾备,为客户提供订阅服务。

此外,云厂商本身也提供很多开源的数据库服务,如MySQL、PostgreSQL等。开源也在一定程度上帮助了云数据库订阅商业模式的发展。

下一步多模数据库?

根据IDC发布的《2025年数据时代》报告,全球每年产生的数据将从2018年的33ZB增长到175ZB(1 ZB=1024 EB),以25 MB/ s的网速下载,大约需要18亿年,除了数据量巨大,数据类型也变得复杂多样。如何统一管理多种类型的数据已经成为数据库领域迫切需要解决的问题之一。

近年来,多模态数据库开始兴起,并逐渐发展成为一个主要的技术方向。多模态数据库是指能够在同一系统中聚合分散数据的数据库。因其多模型数据管理和存储功能而得名。多模型数据库可以有效地支持图形、键值、关系和文档等数据库模型。多模态数据库代表了云架构下多类型数据管理的新概念,也是简化运维、节约开发成本的新选择。

随着NoSQL系统在单模能力上的成熟和应用数据需求的多样化,业界已经开始探索和实践多模数据库。通过DB-Engine数据库排名可以看出,越来越多的热门数据库走向了多模式数据库。

受访嘉宾(按字母顺序排列):

郭,MariaDB中国

Jags Ramnarayan,MariaDB全球副总裁&SkySQL总经理

Michael Cahill,MongoDB R&D实验室副总裁

腾讯云副总裁佩特

星环科技创始人兼CEO孙元浩

淘思数据创始人&CEO陶建辉

海洋基地CTO阳传会(花名日照)

如果你觉得这篇文章对你有帮助,或者你对数据库领域的技术发展有自己的想法,请在文末留言告诉我们!也可以加入InfoQ写作平台发表自己的看法:https://xie.infoq.cn/.

随后,迷你书和专题将在InfoQ官网发布,在InfoQ官网:https://www.infoq.cn/注册并添加到收藏夹,这很棒。

此外,InfoQ年度直播周将于2023年1月3日首次启动,持续输出精彩内容,关注InfoQ视频号,连线行业技术大牛~(附视频号卡)。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/396424.html

发表回复

登录后才能评论