.NET深入学习笔记(1):DataSet和SqlDataReader性能差异深入剖析2011-01-06 博客园 Frank Xu LeiDataSet和SqlDataReader的比较的文章和帖子网上已经很多,我也看了很多前辈的随笔.自己在面试和实际工作中也遇到这样的问题.但是始终是没深入进行学习.最近在工作空闲之余,特地查阅了一些文章,也包括msdn的官方文档.自己建立数据库和测试程序,对DataSet和SqlDataReader做了比较.首先关于两者比较主流的观点就是:1.DataReader使用时始终占用SqlConnection,在线操作数据库.DataSet则是将数据一次性加载在内存中.支持数据库访问的断开连接模型.2.DataReader每次只在内存中加载一条数据,节约内存.DataSet将数据全部加载在内存中.比较消耗内存.3.DataReader单向只读.DataSet支持查询修改删除等操作,比较灵活.4.DataReader与 SqlCommand搭配.DataSet与DataAdapter 结合使用.为什么会这样呢?我们就来分析一下具体的原因.查看一下msdn关于 两者的不同描述:1>SqlDataReader 类提供一种从 SQL Server 数据库读取行的只进流的方式。无法继承此类。命名空间:System.Data.SqlClient程序集:System.Data(在 System.Data.dll 中).可以使用 ADO.NET DataReader 从数据库中检索只读、只进的数据流。查询结果在查询执行时返回,在并存储在客户端的网络缓冲区中,直到您使用 DataReader 的 Read 方法对它们发出请求。使用 DataReader 可以提高应用程序的性能,原因是它只要数据可用就立即检索数据,并且(默认情况下)一次只在内存中存储一行,减少了系统开销。2>DataSet 对象是支持 ADO.NET 的断开式、分布式数据方案的核心对象。DataSet 是数据的内存驻留表示形式,无论数据源是什么,它都会提供一致的关系编程模型。它可以用于多种不同的数据源,用于 XML 数据,或用于管理应用程序本地的数据。DataSet 表示包括相关表、约束和表间关系在内的整个数据集。下图将显示 DataSet 对象模型。

从上面的描述可以看出,DataReader和DataSet具有不同的结构模型.在数据的方式处理上也存在显著的差别.SqlDataReader 会避免创建不必要的对象或复制不必要的数据.DataSet 可以表示完整的数据模型,包括表格、约束条件和表关系.在对象的创建和销毁等环节需要消耗更多的资源,因此在性能上也稍显逊色.因此很多文章得出的结论也是在只进行读数据操作的情况下,DataReader的性能要强于DataSet.但是很多文章都没有相应的测试,就盲目下结论.但是好奇心理的驱使使我很想来做个试验来验证一下这个结论,到底DataReader比DataSet在查询数据的时候,性能会不会胜出,如果前者更优的话那么会超出多少?我自己写了个小程序,自己建立的数据库进行了实验. 实验测试环境如下:硬件:
CPU | Intel T2300 1.66GHz |
内存 | Kingston DDR2 667 1G |
硬盘 | 80G 5400转 8m |
软件:
操作系统 | Windows Server 2003 |
数据库系统 | SQL Server 2005 Enterprise |
数据规模 | 1000000条数据 |