改变旧有软件生态 开源数据库引领风暴
3881
2016-06-04 17:35
文章摘要:  Gartner预言全球数据库市场总额大约是140亿美元,并将以每年7%的速度增长。Gartner的一份调查结果显示到2008年,将有70%以上的IT组织使用开源数据库;到2008年,MySQL将会成为关键应用的重要选择;被调查的56%的公司计划选用Linux作为第一数据库管理系统平台;Linux将在3年内超过Unix成为主要的数据库管理系统平台,即使是



  Gartner预言全球数据库市场总额大约是140亿美元,并将以每年7%的速度增长。Gartner的一份调查结果显示到2008年,将有70%以上的IT组织使用开源数据库;到2008年,MySQL将会成为关键应用的重要选择;被调查的56%的公司计划选用Linux作为第一数据库管理系统平台;Linux将在3年内超过Unix成为主要的数据库管理系统平台,即使是对于最苛刻的数据库应用;被调查公司中的40%计划用开源取代商业数据库;49%的回答已经开始使用MySQL,17%计划使用它。


  所有的调查结果显示,开源数据库正大踏步的前进,不仅成为开源领域的一支新生力量,也日益影响着原有的数据库市场。从开源数据库的旗舰品牌MySQL到企业级应用数据库PostgreSQL再到嵌入式数据库Berkeley DB,开源数据库已经形成了一条完整的生态链,在各行业、各领域得到了充分的应用。开源正在改变着旧有的软件生态和产业规则,开源数据库也随着开源的步伐掀起了一场数据库的风暴,并将席卷原有的数据库市场。


  开源数据库在流行


  最近一年IT的流行词离不开“SOA”、“虚拟化”、“SaaS”,但更为流行的可能就是“开源”了,在开源领域,数据库也随着开源流行趋势而逐渐流行起来,选择开源数据库已经成为一种集实用与性能为一体的时尚选择。


  开源数据库软件已经不再是实验室和教学用的“小白鼠”,随着产品功能的日益完善,越来越多的企业已经开始将开源数据库产品应用于企业当中。这种应用对商业数据库市场产生着重要影响,其直接导致了商业数据库产品价格的持续降低,甚至有专家指出,未来开源数据库有可能改变整个数据库产品的销售模式。


  开源数据库最初的诞生和发展大都依靠自由软件开发者,但是,现在越来越多的IT公司开始把触角伸向了开源数据库。而早期投身于其中的IT厂商早已获利,比如Sleepycat公司从1996年就开始盈利,收入来源主要是向使用其产品的软件商收取年费。


  而最为成功的开源数据库公司则是MySQL。较商业化的开源数据库有SQLite、SimpleSQL、Berkely DB、Minosse、Firebird(前身是是Borland公司的InterBase)和PostgreSQL等,这些开源数据库项目的存在为Linux、整个开源生态链做出了强有力的支撑。


  MySQL引领开源数据库


  MySQL的由来已经无从查找,带有前缀“My”的相关资料和大量的数据库产品、工具已经存在10年以上。有趣的是,MySQL AB创始人之一的Monty Widenius的女儿也叫“My”。MySQL的海豚标志的名字叫“Sakila”,它是由MySQL AB的创始人从用户在“海豚命名”的竞赛中建议的大量名字表中选出的。选中的名字是来自非洲斯威士兰的开源软件开发者Ambrose Twebaze提供的。根据Ambrose所说,Sakila是来自一种叫SiSwati的斯威士兰方言,也是在Ambrose的家乡乌干达附近的坦桑尼亚的Arusha的一个小镇的名字。



  MySQL堪称开源数据库领域中的领军产品,其名衔众多:ACM/SIGMOD(美国计算机学会数据库专委会)列出的60种公众可以使用的开放源代码数据库系统中,MySQL居榜首;Linux下最受欢迎的数据库排名中,MySQL居第一(第二位是PostgreSQL,第三位是Oracle 9i);在开源数据库市场占有率中,MySQL居第一;在世界5000家IT企业内,MySQ承担着各种处理任务关键状态的工作。


  2006年,MySQL在中国成立了研发中心,正式进入了中国,与万里开源公司进行了广泛的合作。万里开源公司总经理周群表示:“去年建立的中国技术支持中心发展速度非常快,去年有四个工程师是参与MySQL的Class的研发,今年MySQL有一个自己的存储引擎,这个地方我们大概还有另外三位工程师参与研发,所以大家会看到越来越多的中国的工程师参与到MySQL的核心开发里面,回馈社区,向社区作出贡献,我们也希望有这个技术能力的网友积极报名,也能够参与到MySQL中国研发中心技术队伍里面来。”


  自MySQL推出开源数据库以来,其下载量已经超过1亿次,其中中国已经一跃成为下载量第一的国家。据2005年Evans Data Corporation的调查,MySQL在开源数据库市场已拥有40%的占有率,安装量超过500万套。而MySQL宣称其安装用户目前已经达到了600万,包括了1500家网上签约客户和合作伙伴,以分发产品和提供服务。


  Novell、Dell和HP等公司已经开始出售MySQL的数据库产品,并为其提供支持服务。MySQL同Novell和Dell之间结成的分销伙伴关系将充分拓展它的发行。MySQL的客户包括NASA(美国国家航空和宇宙航行局)、Google、Yahoo,国内的有新浪、网易。尽管MySQL的绝对用户数量不大,但在份额相近的商业数据库市场上已经具有一定冲击力和影响力,此外,MySQL在中小企业和开发人员心目中的超强人气也很有商业价值。


  开源数据库“众生相”


  在充满传奇色彩的软件行业,开源运动早已不再是一种哗众取宠的时尚,而是成为一种潜移默化的文化。这里包括“最受欢迎的开源数据库”MySQL、“最先进的开源数据库”PostgreSQL、“新世纪的关系型数据库” Firebird,此外还包括将嵌入式作为自己重要使命的Berkeley DB和曾经在ERP领域取得不俗业绩的SAP DB(MaxDB),以及伴随着Java技术而快速发展的功能同样出色的Apache组织的Derby(由IBM著名的Cloudscape 10演化而来)、Hypersonic的HSQL等, 开源数据库阵营可谓“乱花渐欲迷人眼”。


  MySQL的发展在一开始便定位于快速、稳定的大型关系型数据库的目标,因而在设计上当性能和标准不相协调时,更主要的是性能和稳定性的考虑。


  如今的MySQL版本可以运行于多种操作系统平台,支持全文搜索,提供了常见开发语言的编程接口,最大可支持64TB的表空间,而可伸缩的设计体系使得MySQL既能够提供企业级的客户机/服务器工作方式和复杂的集群工作方式, 也能够作为嵌入式的数据库引擎集成到其他的应用系统之中。


  对于那些需要海量数据的检索,不需要复杂的事务操作的用户,MySQL应该是一个比较理想的选择。



  MaxDB是2003年SAP公司和MySQL AB公司合作之后SAP DB新的名称。MaxDB是一款重量级的、获得SAP R/3认证,适宜于联机事务处理和联机分析处理等多种业务类型的高可用性、高可靠性和极具伸缩性的数据库,支持大容量的用户和并发业务操作,采用多线程多进程的服务器设计,支持多处理器的应用,并通过集群和热部署提供高可靠性,支持TB级的海量数据,支持企业级的数据同步和复制等复杂应用。


  上述的功能如此强大,就难怪Intel、Toyota、DaimlerChrysler、Yamaha等选择了它。应该说,对于开展ERP业务的用户,尤其是采用SAP ERP系统的用户,如果考虑较高的性价比,采用MaxDB应该是非常明智的选择。


  PostgreSQL自1986年发展迄今已有近20年的历史了。如今的PostgreSQL 8.0可谓身怀绝技,它支持一系列关键特性:支持分布式的事务处理;支持外键功能,以及所有的SQL 99的连接类型、触发器;支持用户自定义的对象数据类型和操作;支持子查询、部分索引和表达式索引;支持多种语言产生的存储过程,同时PostgreSQL提供了多种编程接口,拥有热备份和选择性备份恢复工具等。如此奇妙的特性,使其享有“最先进”的美誉,印度的农业信用社就使用PostgreSQL处理金融业务。


  但是,和MySQL相比,PostgreSQL的性能一直被视为弱项。对于那些需要复杂业务操作,而对性能要求不是过于苛刻,同时期望系统的设计富于扩展性的用户而言,不妨采用PostgreSQL。


  FireBird数据库是Inprise公司在自己的IDPL(Initial Developer’s PUBLIC LICENSE)许可协议基础上,将Interbase 6.0数据库贡献给开源组织后的产品。


  FireBird全面支持SQL 92 Entry Level 1的功能和绝大部分的SQL 99功能,能够运行于Windows、Linux或其它Unix等多种平台上。但是由于未知的原因,FireBird的后续开发比较缓慢,迄今为止的1.5版本,仅仅是用C++重写原有的C代码,缺乏新的功能点,而且其开源部分似乎并不完整,比如缺乏企业级应用的复制机制。然而,作为一款成熟的数据库管理系统,FireBird还是值得被研究和分析的。如果用户不更改FireBird的数据库引擎,那么可以将FireBird任意应用到商业应用之中。


  严格地讲,Berkeley DB并不是一个数据库管理系统,它是作为嵌入式的数据库引擎来设计的。例如MySQL的数据存储引擎便可以在Berkeley DB和InnoDB之间选择。


  Berkeley DB提供了一个可伸缩、高性能和能够进行事务处理的数据管理和数据访问服务库,通过应用编程接口的普遍支持, 可以很容易地嵌入到其他的应用之中, 所有数据库相关的底层操作都是由Berkeley DB的库函数来完成。最新的Berkeley DB也提供了对XML进行操作的服务。


  如果需要在应用程序中嵌入数据库操作功能,而又追求较高的性能,那么Berkeley DB正合适。这也就是为什么Berkeley DB能够得到Cisco等设备巨头青睐的原因。


  开源的数据库种类多种多样,无论是关系型数据库还是分析型数据库,也无论是嵌入式数据库还是专为特殊应用开发的数据库,它们的存在,为开源的发展贡献着自己的力量,也为用户提供了更多的选择。



版权声明:

凡本网内容请注明来源:T媒体(http://www.cniteyes.com)”的所有原创作品,版权均属于易信视界(北京)信息科技有限公司所有,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,易信视界(北京)信息科技有限公司将追究其相关法律责任。

评论