扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:IT专家网 2011年3月5日
1. 导言
分析解决方案正在快速成为许多公司的关键任务。这导致了在这些系统中存储的数据数量急剧增大,因此需要快速而有效地创建和开发支持更大、更快的解决方案。
2. 建立企业级解决方案
Microsoft SQL Server 2008分析服务旨在提供极好的性能,并升级为可支持具有数百万记录和成千上万个用户的应用程序。创新的、改良的工具帮助提高开发人员生产力,使得可以设计得更好,执行得更快。
2.1 较高的开发人员生产力
开发人员一般需要学习和使用多种工具来建立和部署一个解决方案。然而有了分析服务之后,开发人员就可以在整个开发周期——从项目的开始到开发到部署都可以使用SQL Server 商业智能开发套件(BIDS)。因为商业智能开发套件是基于Visual Studio开发环境的,它与Visual Studio Team System完全集成,Visual Studio Team System提供设计、开发、协作、优化和测试资源。这提供了一个集成的、直接的环境,使得开发人员可以工作得更加快速更加高效。此外,为了进一步提高生产力,BIDS还提供了经验丰富的商业智能向导。一组易于使用的向导会帮助哪怕是新手的用户为一些更加复杂的商业智能问题建模,使得商业智能项目的开发对于更多的人们和公司来说更加易于得到。
在之前的开发阶段低效的设计往往会浪费大量的开发时间,因为当设计错误被调整过来后,开发人员基于原来的错误设计完成的工作需要重做。SQL Server 2008分析服务推出了一组新的、创新的最佳实践设计警告(Best Practice Design Alerts),它们提供了在开发过程的早期阶段自动通知潜在的设计问题的功能,这减少了由于设计错误引起的时间浪费,并使得开发过程更加快速。图1显示了一个对于时间维度和日历层级的警告。正如你在图1中所看到的,警告强调了问题区域。然而,它们决不会影响功能,因为可以简单的忽略或解除单个警告或所有警告。
图 1
除了实时警告,你还可以扫描你所有警告的解决方案设计。图2显示了对一个设计的当前警告。
图2
SQL Server 2008分析服务通过新的、改良的立方体、维度和属性设计器进一步提高了开发人员的生产力。图3显示了新的属性关系(Attribute Relationships)设计器。
图3
2.2 可扩展的基础构造
分析服务可以升级到支持规模为数GB、具有成千上万用户的数据库。为了支持大量用户、避免竞争以及降低成本,你可以升级分析服务解决方案。升级一个分析服务解决方案通常会增加存储和同步几个版本数据的处理和存储费用,但是SQL Server 2008分析服务可以在几个分析服务服务器之间共享一个只读的分析服务数据库,从而节省了这个费用。
实时资源监控成为了系统在规模和用户数量方面升级的要素。SQL Server 2008分析服务提供了与数据库引擎中可用的相类似的动态管理视图(Dynamic Management Views)。这些提供了用于监控、分析和性能调整的实时企业系统信息。
随着数据库规模的增长,维护备份的时间和成本也相应的增加了。当使用OLAP数据库时,一旦数据库达到了一定规模,备份时间就会呈指数级增长,但是有了SQL Server 2008分析服务,一个新的备份存储子系统会使得备份时间与数据库规模呈线性增长。这消除了对备份规模的限制,从而消除了对数据库规模的限制。
随着数据库变得越来越大,用户需要的信息就越来越难找。透视图提供了一个UDM的过滤视图,它提供了数据集市(data marts)的所有优势,同时消除了冗余的存储,降低了处理成本,去除了数据集市间同步的要求,并解决了由存储相同数据的多个拷贝而引起的数据一致性和完整性问题。
随着全球化的发展,解决方案需要展示给全世界的观众。全球的数据一般是一样的,但是元数据,例如立方体、测量、维度名称和级别,以及关键性能指示器(Key Performance Indicators,KPI’s)将会随语言的不同而不同。翻译提供了为每一种语言创建不同元数据以及使你的解决方案适用于全球的能力。财政信息还需要进行本地化以正确的货币显示。通过提供强大的翻译能力和自动的货币转换,分析服务以用户自己的语言为其提供了本地化分析数据。
2.3 出众的性能
分析服务立方体是多维结构,使得可以访问大量的预先聚合的数据,使得终端用户可以立即获得对相关商业数据的洞察。分析服务将它的数据以高度优化和压缩的格式进行存储,这种格式叫做多维OLAP(MOLAP)。它还使得可以在关系型数据库中像关系型OLAP(ROLAP)或以一种混合的模式——叫做混合型OLAP(Hybrid OLAP,HOLAP)灵活地存储数据(部分或全部)。
多维数据本身就是稀疏的。例如,你不会每天购买一个零售商每一分店的每一个产品。SQL Server 不像大多数的OLAP系统,它不存储这些NULL值,这使得大大减小了数据库的规模,防止数据爆炸,并使得性能得到了提高。许多OLAP系统浪费了一部分查询处理时间,将具有NULL值的单元数据聚合,而它得到的结果还是NULL。SQL Server 2008分析服务使用一个叫做块计算的技术,这个技术通过只关注非NULL数据从而处理了立方体的稀疏并提高了性能。这可以将查询性能提高几个数量级,因此提供粒度更好的分析。
SQL Server提供优越性能的另一个方面是基于属性的层级。一般情况下,数据库包含共享通用属性的层级。在大多数OLAP系统中,这些通用属性必须为每一个层级进行复制,但是SQL Server 提供了基于属性的层级,它不再需要做任何复制,提高了性能和可扩展性。
回写是分析服务的核心功能,它允许用户修改单元值。它普遍用在计划、预算、和预测应用程序中。之前的分析服务版本要求回写数据以ROLAP格式存储。SQL Server 2008分许服务允许回写数据以MOLAP格式存储,这使得查询和回写操作的性能大大提高。
预先缓存提供了具有实时分析的MOLAP执行。这是通过保持一份使用UDM结构作为它的基础、为高速访问而组织的最新数据拷贝而实现的。这提供了一个高性能、透明、同步的聚合缓存,从而防止了用户超载关系型数据库。
3. 使用广泛的分析来扩展解决方案
当想到OLAP时,大多数人都想到一个存储和聚合引擎。这对于分析服务也是对的。然而,分析服务将分析平台带到了一个新的水平,它提供了比那些过去与OLAP相关的功能更高级的功能。这使得公司可以在一个提供比传统的OLAP平台多得多的解决方案中满足多种需求。在这种情况下,统一多维模型(Unified Dimensional Model,UDM)扮演一个核心的角色,提供了广泛的分析能力。
3.1 统一多维模型
UDM是分析服务的一个新概念,它随着SQL Server 2005的发布而被推出的。UDM在作为数据源使用的物理关系型数据库和用于解决用户查询的私有立方体和维度结构之间提供了一个中间逻辑层。在这种方式下,你可以将UDM看作是OLAP解决方案的中心部分。然而,如同先前所提到的,UDM概念影响了分析服务解决方案的许多方面。UDM的一个重要好处是将传统关系型报表模型的灵活性和丰富性与优秀的OLAP模型的强大分析和出众的性能结合起来的能力。此外,这个模型包含了广泛的高级商业智能功能来提供最好的关系型和OLAP分析,以及进一步使得公司可以利用通过UDM提供的独特关键性能指示器框架和经验丰富的预测分析功能来轻松地扩展解决方案。
3.2 集中管理主要的企业度量
在SQL Server 2008分析服务中,企业级关键性能指示器(KPI’s)可以集中存储和管理。这为用户提供了一个中央仓库,用于通过许多应用程序访问关键企业信息,包括Microsoft Office PerformancePoint Server 2007、Microsoft Office Excel 2007、Microsoft Office SharePoint Services 2007和Microsoft SQL Server报表服务。
3.3 预测分析
传统的数据分析关注于历史数据和快速返回基于这个数据的结果。但是,商业用户的许多问题不能通过这类分析获得答案,因为他们不是要了解发生了什么,而是要预测会发生什么。预测未来趋势的能力是所有公司成功的一个最重要的潜在因素之一。但是它不是简单地延伸一个趋势线。成员需要分组以创建行为相似的集群;需要对起作用的因素进行评估以确定它们对一个特定结果的作用;以及需要确定相关性。
在分析服务里的数据挖掘算法提供了这个预测分析,SQL Server 2008分析服务改进了数据挖掘算法使得分析更加广泛。
用于Office 2007的Microsoft SQL Server数据挖掘插件
用于Office 2007的数据挖掘插件是一组易于使用数据挖掘功能的插件集合,它使得你可以从Office 2007里面访问数据挖掘功能,因此在每一个桌面电脑上都可以进行预测分析。可以在熟悉的 Office环境中利用Microsoft SQL Server 2008分析服务高效的数据挖掘算法,商业用户就可以轻松地只点击几下鼠标就能够获得对复杂数据的有用洞察。设计时为终端用户考虑,用于Office 2007的数据挖掘插件使得终端用户可以直接在Microsoft Excel和Microsoft Visio中执行高级分析。
有三个单独的组件:
· 用于Excel 的数据挖掘客户端 使得你可以在Excel 2007里面创建和管理一个完整的分析服务数据挖掘项目。
· 用于Excel 的表分析工具 使得你可以使用强大的分析服务数据挖掘功能分析存储在Excel电子数据表中的数据。
· 用于Visio 的数据挖掘模版 使得你可以在Visio图表里渲染决策树、回归树、集群图,以及依赖网。
4. 通过熟悉的工具提供具有行动力的洞察
如果信息很容易就可以被所有用户访问到,那么强大的分析解决方案就提供不了什么商业利益。SQL Server 2008分析服务超出了商业用户的范围,它使用熟悉的Microsoft Office工具为公司内的每一个人提供了分析信息。更深一层的客户端接口可以使用开放的SQL Server 2008分析服务架构来开发,并且开发人员可以利用产品的可扩展性来扩展它的功能。
4.1 最佳的Office协作能力
2007 Microsoft Office 系统提供了与SQL Server 2008分析服务最佳的协作能力。信息是在桌面电脑上通过熟悉的工具提供的,扩展了你获得的分析信息范围。举例来说,Excel 2007是一个功能强大、丰富的分析服务客户端,而Microsoft Office PerformancePoint Server 2007分析提供了一个瘦分析服务客户端。下面的2007 Office系统组件提供了分析服务协作能力:
4.1.1 Microsoft Office Excel
Excel 2007是一个功能强大的分析服务客户端。Excel 2007提供了在下面领域的功能:
· Excel提供了对存储在分析服务OLAP立方体中数据的访问。Excel提供了透视表,它为用户显示了多维数据,并且允许用户将数据切割。服务器执行处理过程,而结果将缓存到服务器和客户端上以增强性能。
· Excel为用户带来了分析服务特性和分析功能,例如KPIs、计算成员、命名集、动作和翻译。
· Excel可以使用用于Office 2007的数据挖掘插件,为终端用户提供丰富的预测和统计分析数据。
· Excel可以添加自动分析特性,例如强调其数据看起来与数据表其它地方的格式不同或数据范围不同的异常、基于现在的趋势预测未来的值、分析各种场景下的情况,以及决定需要改变什么来满足特定目标。
· 报表服务可以根据分析服务数据创建报表,并将它们渲染为Excel 电子数据表,为终端用户增加可用性。
图4 显示了用于客户端访问分析服务数据的Excel 透视表。
图4
4.1.2 Microsoft Office Word
报表服务可以用分析服务数据创建报表,将它们渲染为Microsoft Office Word 文档以增加终端用户的可用性。这些报表然后可以直接以Microsoft Office Word 来编辑。
4.1.3 Microsoft Office Visio
你可以使用Microsoft Office Visio 来注释、提高和展示数据挖掘图表型视图。有了SQL Server 2008 和Visio 2007,你就可以:
· 渲染决策树、回归树、集群图,以及依赖网。
· 将数据挖掘模型保存为内嵌入其它Office文档的Visio 文档,或者保存为一个Web网页。
4.1.4 Microsoft Office SharePoint Server 2007
它是一个广泛的协作、发布、以及状态面板解决方案,你可以将它当作一个核心,用它来提供一个集中放置你所有的企业级分析服务数据的地方,以便你公司的所有人都可以查看以及与相关的、实时的分析视图、报表和KPIs进行交互。
4.1.5 Microsoft Office PerformancePoint Server 2007
它是一个集成的性能管理应用程序,雇员可以用它来监控、分析和计划基于SQL Server 2008分析服务所提供数据的商业活动。Office PerformancePoint Server 2007提供了记分卡、状态面板、管理报表、分析、计划、预算、预测、以及合并功能,从而提供了广泛的性能管理能力。
4.2 丰富的合作者扩展能力
SQL Server 2008提供了一个开放的架构,允许开发人员在分析服务之上建立解决方案和扩展它的函数。分析服务包含有存储过程以提供对分析服务函数、外部编程语言的直接访问。存储过程提供了交叉语言异常处理、翻译和部署支持。
数据挖掘显示了任何形式的统计分析数据,并且因为这个领域在不断地发展,新的数据挖掘算法会使一个分析系统变得过时。分析服务支持算法插入,以扩展数据挖掘功能,并允许第三方或内部开发人员添加新的数据挖掘算法。
4.3 开放的可嵌入架构
许多公司会要求一个定制的客户端接口或他们会在另一个服务或应用程序力需要使用分析服务数据。
分析服务很久以前就支持OLE DB for OLAP、ADOMD和ADOMD.Net了,但是这被SQL Server 2008分析服务进一步扩展了,它可以使用XML for Analysis(XML/A)标准显示数据。现在每一个分析服务的服务器都是web services的一个提供者,而这使得它可以直接将分析数据集成到现在的应用程序中。
5. 总结
Microsoft SQL Server 2008分析服务建立在分析工具的强大基础上,提供了一个真实的企业级解决方案。充分改进了性能和可扩展性,使得处理更快,改进了大型数据库备份以及监控能力。通过将数据集市结合到一个UDM中,以及做到集中访问和关键企业数据的可管理性,使得数据对用户来说更加有用。分析能力扩大了,具有增强的数据挖掘工具集预测能力。
对数据的访问不足以使这个信息放入公司。用户需要熟悉的工具而应用程序开发人员需要能够将这个数据整合进他们的应用程序。分析服务提高了优化的Office协同性,从而提供了一个熟悉的界面和一个开放的、可嵌入的架构,使得开发人员可以集成这个数据。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者