返回首页
当前位置: 主页 > SQL2008专题 > 基础知识 >

SQL Server 2008集成服务详解

时间:2008-04-30 17:12来源: 作者: 点击:
这篇文章讨论了依赖于数据集成技术的业务要提供有用的、可靠的信息来维护在现今世界中的竞争优势所要面临的挑战。它讨论了SQL Server 2008集成服务(SSIS)可以怎样帮助信息技术部门达到他们公司的数据集成要求。文章中包含真实案例。
  

3.2.3 SSIS和数据质量

SSIS的一个主要特性,以及它的集成数据的能力,是它集成不同技术来操纵数据的能力。这使得SSIS包含了创新的基于“模糊逻辑”的数据清理组件。Microsoft研究实验室开发了这些组件,并且他们展示了在这个领域的最新研究。采用的方法是一个独立的域而且不依赖于任何特定的域数据,例如地址/邮编参考数据。这使得你可以将这些转换用于清理大多数类型的数据,而不仅仅是地址数据。

SSIS与分析服务的数据挖掘功能深度集成。数据挖掘抽取了数据集的格式并将它们封装到一个挖掘模型里。然后你可以使用这个挖掘模型来预测一个数据集包含什么数据以及什么数据是反常的。这样你就可以将数据挖掘作为一个实现数据质量的工具。

在SSIS中对复杂数据路由的支持不仅帮助你确认异常数据,而且还可以自动修改并用更好的值来替代它。这使得“闭环”清理场景可用。图6显示了一个闭环清理数据流的例子。


图6

图1

除了它的内置数据质量特性,SSIS还可以扩展为与第三方数据清理解决方案紧密协作。

3.2.4 超出传统ETL的SSIS应用程序

数据流管道操纵几乎任何类型数据的能力、与分析服务的深度集成、对使用许多数据操纵技术对它进行扩展的支持,以及包含了一个丰富的工作流引擎,这些使得SSIS可以用在很多不是传统的ETL场景中。

服务面向架构

SSIS包括对数据流管道中源XML数据的支持,包括从磁盘上文件中获得的数据以及通过HTTP的URL。XML数据是“粉碎”放到表格数据中的,然后它就可以在数据流中很容易地进行操纵。这个对XML的支持可以与对Web services 的支持一起使用。SSIS可以与控制流中的Web services进行交互以捕捉XML数据。

你可以从文件中、从Microsoft Message Queuing(MSMQ)中,以及通过HTTP从Web捕捉XML。SSIS使得可以操纵具有XSLT、XPATH、diff/merge、等等的 XML。并且可以将这个XML放到数据流中。

这个支持使得SSIS可以成为灵活的服务面向架构(SOA)的一部分。.

数据和文本挖掘

SSIS不只具有与分析服务数据挖掘功能的深度集成,它还具有文本挖掘组件。文本挖掘(也被成为文本分类)围绕确定商业种类和文本数据(单词和短语)之间的关系。这使得可以发现文本数据中的关键术语,并且基于此,自动地确认“感兴趣”的文本。这反过来可以驱使“闭环”动作以完成商业目的,例如增加客户满意度和增强产品和服务的质量。.

按需数据源

SSIS中的一个特有功能是DataReader 目的地,它将数据放到一个ADO.NET DataReader 中。当这个组件被包含进一个数据流管道中时,你可以使用包含了DataReader 目的地作为一个数据源的包,它作为ADO.NET DataReader 来显示。所以你可以将SSIS不仅作为一个传统的ETL来加载数据仓库,还可以作为一个可以按需地从多个数据源发送集成的、一致的和干净数据的数据源。例如,你可以通过使用一个SSIS包作为报表服务的数据源,从而帮助它使用从多个不同数据源而来的数据。

一个集成所有这些特性的可能场景包含从RSS feeds确认和发送感兴趣的文章作为一个常规报表的一部分。图7显示了一个SSIS包通过Internet 获得从RSS feeds而来的源数据,与从Web service 而来的数据相集成,执行文本挖掘从RSS feeds找到感兴趣的文章,然后将感兴趣的文章放到一个DataReader目的地中去,最后由一个报表服务的报表使用。


图7

图1

图8显示了在Report Wizard里SSIS包作为一个数据源来使用。


图8

图1


顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
最新评论 查看所有评论
发表评论 查看所有评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 密码: 验证码:
发布者资料
today 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2008-02-27 10:02 最后登录:2008-12-25 09:12
推荐内容