Integration Services:数据流任务(上)2010-12-29 博客园 巴山游子数据流任务是SSIS中的一个核心任务,估计大多数ETL包中,都离不开数据流任务。所以我们也从数据流任务学起。数据流任务包括三种不同类型的数据流组件:源、转换、目标。其中:源:它是指一组数据存储体,包括关系数据库的表、视图;文件(平面文件、Excel 文件、Xml 文件等);系统内存中的数据集等。转换:这是数据流任务的核心组件,如果说数据流任务是ETL的核心,那么数据流任务中的转换,则是ETL核心中的核心了。它包含非常丰富的数据转换组件,比如数据更新、聚合、合并、分发、排序、查找等。可以说SQL语句中有的功能,它都基本上运用起来了。目标:与“源”相对应,也是一组数据存储体。包含表、视图;文件;多维数据集、内存记录集等。除以上三类组件外,还有一种组件,那就是”流(Flow)“,它形象地显示了数据从”源“,经过”转换“,最后到达”目的“地的一组路径。我们可以利用”流“,来查看数据,添加备注说明等。下面一幅图,就充分展示了源、转换、目的、流的关系。

下面我们以将IIS Log 导入数据库为例,来介绍如何进行数据流任务开发。在开发之前,我们先来看看IISlog 的结构,如图: