地球自诞生到2003年,人类一共创造了5 EB(=5000 PB)的信息,而现在我们每两天就能生成5 EB数据。人们用这样一组描述这个信息爆炸的时代,但还有一点更关键的:这些数据中有80%的数据是非结构化或者半结构化的,更有一大部分是在不断流动变化的数据,这完全符合对“大数据”的定义,即数据量大(Volume)、变化速度快(Velocity)且种类繁多(Variety)。大数据时代已经到来,如果你还没有意识到,那就回想一下我们平时接触到的数据:文本文档、图片、视频还有微博。非结构化数据不断蔓延,这样一个时代我们需要对这些数据进行有效的管理和利用。
信息管理(Information Management)又一次被放到了企业IT部门的重要议事日程上,如何寻求一个针对大数据的管理分析解决方案成为目前急需解决的问题。拿一直以来非常火的云计算来说,无论基础架构的搭建和还是前端应用的交付都是以数据的可靠性、可用性以及可管理性为基础的,在信息管理层面上,我们看到真正能够提供一套完整解决方案的厂商其实寥寥无几,IBM是其中一个。对此,IBM软件集团大中华区信息管理软件总经理卢伟权在IM产品年度发布会上表示,IBM能够为用户提供一套完整的信息管理解决方案,从数据的管理、集成再到分析,并在整个过程中提供对数据的治理,从而对整个数据生命周期进行有效的管理。而IBM在接下来一年中的重点工作,就是大数据。
IBM软件集团大中华区信息管理软件总经理卢伟权先生
大数据时代的信息管理
作为传统的四大数据库软件厂商之一,IBM在数据管理方面的经验和技术储备在业内称得上是数一数二。而DBA最熟悉的关系型数据库概念也是由IBM公司的研究员E.F.Cobb最先提出的。依靠数据库领域的优势,并通过一系列的收购,IBM对信息管理软件产品线进行了最大限度的扩充,其中包括数据库基础软件:DB2、Informix、SolidDB(内存数据库);数据集成:InfoSphere;数据分析与BI:Cognos、SPSS;数据治理:Guardium、Optim;数据仓库一体机:Netezza。
此前TechTarget数据库网站曾对IBM信息管理平台进行过一个比较深入的解读,可以总结为三个方面,即数据库、数据整合以及DSCO(Data Security,Compliance and Optimization)数据治理。其中也曾经提到过大数据平台的相关信息,而从今年IBM IOD大会上所发布的产品来看,包括Hadoop MapReduce以及NoSQL在内的一系列开源技术将更多的融合到产品中来。不难看出,在提供完整的解决方案基础上,IBM IM软件部门的下一步棋将走向大数据。
卢伟权表示:“对更多的数据源进行整合,对非结构化数据进行分析是接下来工作的重中之重。明年我们将会看到IBM在大数据方面有更多创新的应用,目前IBM已经有足够的技术储备来完成这一目标。”
IBM数据库产品更新版本
其实IBM在大数据领域早已经行动了起来,包括数据库以及数据分析软件方面都推出了新的版本。卢伟权向TechTarget数据库记者介绍了IBM IOD 2011大会上发布的几款重要产品,其中包括:
- IMS 12:IMS(Information Management System)是IBM最早的事务和层次数据库管理系统,是主机上的数据库。最新的IBM IMS 12版本在交易处理方面得到了较大的提升,目前一秒钟可以处理61000条交易。
- DB2 10 For z/OS:DB2是IBM的旗舰级数据库产品,在大型系统中应用的较多。目前DB2最新的版本是针对z/OS操作系统的第十版数据库。同上一版9.7相比,成本将节约20%,并提供即插即用的特性。据了解,新的集群功能PureScale也将正式成为DB2 10的一部分,而不再作为额外的功能集。
- Informix 11.7:Informix是IBM收购来的产品,在大型金融机构有着比较广泛的应用。虽然收购之后的Informix在IBM数据库产品中显得有些低调,但是几乎每年都会有新的版本发布。卢伟权介绍,本次的Informix 11.7版本在查询速度方面提升了30倍之多,目前四大银行都有使用。
- InfoSphere Information Server 8.7:Information Server是IBM的重要数据集成平台,在之前的8.5版本中,已经积累了超过1000个客户。而Information Server 8.7可在后台筛选所有类型数据,并按照数据质量级别进行排列,有效维护数据安全,为商业决策提供可靠依据。
- Netezza:作为近期最重要的收购之一,Netezza填补了IBM在集成系统产品上的空白。其实IBM并不是没有能力去这么做,但Netezza一些专利技术的吸引力的确值17亿美元。在此之前,Netezza就同IBM保持了不错的合作关系,这也是它能够这么快速融入IBM的一个重要原因。据了解,IBM已经发布了针对Netezza的DB2 Analytics Accelerator加速器,实现了与DB2进一步集成。
- InfoSphere BigInsights v1.3 & Streams 2.0:这两款产品是IBM发布的专门针对大数据的分析软件,其中用到了Hadoop MapReduce、Jaql等开源技术,提供内存以及磁盘的分析功能。它们是IBM大数据平台中的最重要产品,也是目前业界唯一的针对大数据的分析软件产品。
点击继续阅读:解读InfoSphere大数据分析平台
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
相关推荐
-
Azure数据湖分析从U-SQL中获得提升
大数据的发展已经让许多精通SQL的数据专业人员不知所措。微软的U-SQL编程语言试图让这些人回归数据查询游戏。
-
如何使用SAP HANA Vora规划HANA大数据战略?
SAP努力将HANA定位为一个大数据平台。要制定可行的大数据战略,您需要了解诸如SAP HANA Vora之类的工具。
-
GPU技术仅局限于游戏领域?当心大数据应用的小船说翻就翻
GPU技术的使用是一些机器学习应用的前沿和核心。Facebook,百度、亚马逊和其他一些公司正在使用的GPU集群来研究深层神经网络相关的机器学习应用程序。
-
Big Data Discovery或将助力Oracle回归BI魔法象限
Oracle在Gartner公司商业智能分析平台“魔力象限”中连续上榜十年以后,在2016年并未上榜,Oracle公司失去了在魔力象限的位置可能会影响未来的选择。