Objective-C中的Block

1.相关概念在这篇笔记开始之前，我们需要对以下概念有所了解。1.1 操作系统中的栈和堆注：这里所说的堆和栈与数据结构中的堆和栈不是一回事。我们先来看看一个由C/C++/OBJC编译的程序占用内存分布的结构： 栈区（stack）：由系统自动分配，一般存放函数参数值、局部变量的值等。由编译器自动创建与释放。其操作方式类似于数据结构中的栈，即后进先出、先进后出的原则。例如：在函数中申明一个局部变量int b;系统自动在栈中为b开辟空间。堆区（heap）：一般由程序员申请并指明大小，最终也由程序员释放。如果程序员不释放，程序结束时可能会由OS回收。对于堆区的管理是采用链表式管理的，操作系统有一个记录空闲内存地址的链表，当接收到程序分配内存的申请时，操作系统就会遍历该链表，遍历到一个记录的内存地址大于申请内存的链表节点，并将该节点从该链表中删除，然后将该节点记录的内存地址分配给程序。例如：在C中malloc函数 1 char p1; 2 p1 = （char ）malloc（10）; 但是p1本身是在栈中的。链表：是一种常见的基础数据结构，一般分为单向链表、双向链表、循环链表。以下为单向链表的结构图：单向链表是链表中最简单的一种，它包含两个区域，一个信息域和一个指针域。信息域保存或显示关于节点的信息，指针域储存下一个节点的地址。上述的空闲内存地址链表的信息域保存的就是空闲内存的地址。全局区/静态区：顾名思义，全局变量和静态变量存储在这个区域。只不过初始化的全局变量和静态变量存储在一块，未初始化的全局变量和静态变量存储在一块。程序结束后由系统释放。文字常量区：这个区域主要存储字符串常量。程序结束后由系统释放。程序代码区：这个区域主要存放函数体的二进制代码。下面举一个前辈写的例子： 1 //main.cpp 2 int a = 0; // 全局初始化区 3 char *p1; // 全局未初始化区 4 main { 5 int b; // 栈 6 char s[] = "abc"; // 栈 7 char *p2; // 栈 8 char *p3 = "123456"; // 123456在常量区，p3在栈上 9 static int c =0； // 全局静态初始化区10 p1 = （char *）malloc（10）;11 p2 = （char *）malloc（20）; // 分配得来的10和20字节的区域就在堆区12 strcpy（p1, "123456"）; // 123456在常量区，这个函数的作用是将"123456" 这串字符串复制一份放在p1申请的10个字节的堆区域中。13 // p3指向的"123456"与这里的"123456"可能会被编译器优化成一个地址。14 } strcpy函数原型声明：extern char *strcpy（char* dest, const char *src）;功能：把从src地址开始且含有NULL结束符的字符串复制到以dest开始的地址空间。1.2 结构体（Struct）在C语言中，结构体（struct）指的是一种数据结构。结构体可以被声明为变量、指针或数组等，用以实现较复杂的数据结构。结构体同时也是一些元素的集合，这些元素称为结构体的成员（member），且这些成员可以为不同的类型，成员一般用名字访问。我们来看看结构体的定义：struct tag { member-list } variable-list; struct：结构体关键字。tag：结构体标签。member-list：结构体成员列表。variable-list：为结构体声明的变量列表。在一般情况下，tag，member-list，variable-list这三部分至少要出现两个。以下为示例： 1 // 该结构体拥有3个成员，整型的a，字符型的b，双精度型的c 2 // 并且为该结构体声明了一个变量s1 3 // 该结构体没有标明其标签 4 struct{ 5 int a; 6 char b; 7 double c; 8 } s1; 9 // 该结构体拥有同样的三个成员10 // 并且该结构体标明了标签EXAMPLE11 // 该结构体没有声明变量12 struct EXAMPLE{13 int a;14 char b;15 double c;16 };17 //用EXAMPLE标签的结构体，另外声明了变量t1、t2、t318 struct EXAMPLE t1, t2[20], *t3; 以上就是简单结构体的代码示例。结构体的成员可以包含其他结构体，也可以包含指向自己结构体类型的指针。结构体的变量也可以是指针。下面我们来看看结构体成员的访问。结构体成员依据结构体变量类型的不同，一般有2种访问方式，一种为直接访问，一种为间接访问。直接访问应用于普通的结构体变量，间接访问应用于指向结构体变量的指针。直接访问使用结构体变量名.成员名，间接访问使用（*结构体指针名）.成员名或者使用结构体指针名->成员名。相同的成员名称依靠不同的变量前缀区分。 1 struct EXAMPLE{ 2 int a; 3 char b; 4 }; 5 //声明结构体变量s1和指向结构体变量的指针s2 6 struct EXAMPLE s1, *s2; 7 //给变量s1和s2的成员赋值,注意s1.a和s2->a并不是同一成员 8 s1.a = 5; 9 s1.b = 6;10 s2->a = 3;11 s2->b = 4; 最后我们来看看结构体成员存储。在内存中，编译器按照成员列表顺序分别为每个结构体成员分配内存。如果想确认结构体占多少存储空间，则使用关键字sizeof，如果想得知结构体的某个特定成员在结构体的位置，则使用offsetof宏（定义于stddef.h）。 1 struct EXAMPLE{2 int a;3 char b;4 };5 //获得EXAMPLE类型结构体所占内存大小6 int size_example = sizeof（ struct EXAMPLE ）;7 //获得成员b相对于EXAMPLE储存地址的偏移量8 int offset_b = offsetof（ struct EXAMPLE, b ）; 1.3 闭包（Closure）闭包就是一个函数，或者一个指向函数的指针，加上这个函数执行的非局部变量。说的通俗一点，就是闭包允许一个函数访问声明该函数运行上下文中的变量，甚至可以访问不同运行上文中的变量。我们用脚本语言来看一下： 1 function funA（callback）{ 2 alert（callback（））; 3 } 4 function funB（）{ 5 var str = "Hello World"; // 函数funB的局部变量，函数funA的非局部变量 6 funA（ 7 function（）{ 8 return str; 9 }10 ）；11 } 通过上面的代码我们可以看出，按常规思维来说，变量str是函数funB的局部变量，作用域只在函数funB中，函数funA是无法访问到str的。但是上述代码示例中函数funA中的callback可以访问到str，这是为什么呢，因为闭包性。2.blcok基础知识block实际上就是Objective-C语言对闭包的实现。2.1 block的原型及定义我们来看看block的原型：NSString * （ ^ myBlock ）（ int ）; 上面的代码声明了一个block（^）原型，名字叫做myBlock，包含一个int型的参数，返回值为NSString类型的指针。下面来看看block的定义：1 myBlock = ^（ int paramA ）2 {3 return [ NSString stringWithFormat: @"Passed number: %i", paramA ];4 }; 上面的代码中，将一个函数体赋值给了myBlock变量，其接收一个名为paramA的参数，返回一个NSString对象。注意：一定不要忘记block后面的分号。定义好block后，就可以像使用标准函数一样使用它了：myBlock（7）; 由于block数据类型的语法会降低整个代码的阅读性，所以常使用typedef来定义block类型。例如，下面的代码创建了GetPersonEducationInfo和GetPersonFamilyInfo两个新类型，这样我们就可以在下面的方法中使用更加有语义的数据类型。 1 // Person.h2 #import // Define a new type for the block3 typedef NSString * （^GetPersonEducationInfo）（NSString *）;4 typedef NSString * （^GetPersonFamilyInfo）（NSString *）;5 @interface Person : NSObject6 - （NSString *）getPersonInfoWithEducation:（GetPersonEducationInfo）educationInfo7 andFamily:（GetPersonFamilyInfo）familyInfo;8 @end 我们用一张大师文章里的图来总结一下block的结构：2.2 将block作为参数传递 1 // .h2 -（void） testBlock:（ NSString * （ ^ ）（ int ））myBlock;3 // .m4 -（void） testBlock:（ NSString * （ ^ ）（ int ））myBlock5 {6 NSLog（@"Block returned: %@", myBlock（7））;7 } 由于Objective-C是强制类型语言，所以作为函数参数的block也必须要指定返回值的类型，以及相关参数类型。2.3 闭包性上文说过，block实际是Objc对闭包的实现。我们来看看下面代码： 1 #import void logBlock（ int （ ^ theBlock ）（ void ）） 2 { 3 NSLog（ @"Closure var X: %i", theBlock（））; 4 } 5 int main（ void ） 6 { 7 NSAutoreleasePool * pool; 8 int （ ^ myBlock ）（ void ）; 9 int x;10 pool = [ [ NSAutoreleasePool alloc ] init ];11 x = 42;12 myBlock = ^（ void ）13 {14 return x;15 };16 logBlock（ myBlock ）;17 [ pool release ];18 return EXIT_SUCCESS;19 } 上面的代码在main函数中声明了一个整型，并赋值42，另外还声明了一个block，该block会将42返回。然后将block传递给logBlock函数，该函数会显示出返回的值42。即使是在函数logBlock中执行block，而block又声明在main函数中，但是block仍然可以访问到x变量，并将这个值返回。注意：block同样可以访问全局变量，即使是static。2.4 block中变量的复制与修改对于block外的变量引用，block默认是将其复制到其数据结构中来实现访问的，如下图：通过block进行闭包的变量是const的。也就是说不能在block中直接修改这些变量。来看看当block试着增加x的值时，会发生什么：1 myBlock = ^（ void ）2 {3 x++;4 return x;5 }; 编译器会报错，表明在block中变量x是只读的。有时候确实需要在block中处理变量，怎么办？别着急，我们可以用__block关键字来声明变量，这样就可以在block中修改变量了。基于之前的代码，给x变量添加__block关键字，如下：__block int x; 对于用__block修饰的外部变量引用，block是复制其引用地址来实现访问的，如下图：3.编译器中的block3.1 block的数据结构定义我们通过大师文章中的一张图来说明：上图这个结构是在栈中的结构，我们来看看对应的结构体定义： 1 struct Block_descriptor { 2 unsigned long int reserved; 3 unsigned long int size; 4 void （*copy）（void *dst, void *src）; 5 void （*dispose）（void *）; 6 }; 7 struct Block_layout { 8 void *isa; 9 int flags;10 int reserved;11 void （*invoke）（void *, ...）;12 struct Block_descriptor *descriptor;13 /* Imported variables. */14 }; 从上面代码看出，Block_layout就是对block结构体的定义：isa指针：指向表明该block类型的类。flags：按bit位表示一些block的附加信息，比如判断block类型、判断block引用计数、判断block是否需要执行辅助函数等。reserved：保留变量，我的理解是表示block内部的变量数。invoke：函数指针，指向具体的block实现的函数调用地址。descriptor：block的附加描述信息，比如保留变量数、block的大小、进行copy或dispose的辅助函数指针。variables：因为block有闭包性，所以可以访问block外部的局部变量。这些variables就是复制到结构体中的外部局部变量或变量的地址。3.2 block的类型block有几种不同的类型，每种类型都有对应的类，上述中isa指针就是指向这个类。这里列出常见的三种类型：_NSConcreteGlobalBlock：全局的静态block，不会访问任何外部变量，不会涉及到任何拷贝，比如一个空的block。例如：1 #include int main（）2 {3 ^{ printf（"Hello, World！ "）; } （）;4 return 0;5 } _NSConcreteStackBlock：保存在栈中的block，当函数返回时被销毁。例如：1 #include int main（）2 {3 char a = "A";4 ^{ printf（"%c ",a）; } （）;5 return 0;6 } _NSConcreteMallocBlock：保存在堆中的block，当引用计数为0时被销毁。该类型的block都是由_NSConcreteStackBlock类型的block从栈中复制到堆中形成的。例如下面代码中，在exampleB_addBlockToArray方法中的block还是_NSConcreteStackBlock类型的，在exampleB方法中就被复制到了堆中，成为_NSConcreteMallocBlock类型的block： 1 void exampleB_addBlockToArray（NSMutableArray *array） { 2 char b = "B"; 3 [array addObject:^{ 4 printf（"%c ", b）; 5 }]; 6 } 7 void exampleB（） { 8 NSMutableArray *array = [NSMutableArray array]; 9 exampleB_addBlockToArray（array）;10 void （^block）（） = [array objectAtIndex:0];11 block（）;12 } 总结一下：_NSConcreteGlobalBlock类型的block要么是空block，要么是不访问任何外部变量的block。它既不在栈中，也不在堆中，我理解为它可能在内存的全局区。_NSConcreteStackBlock类型的block有闭包行为，也就是有访问外部变量，并且该block只且只有有一次执行，因为栈中的空间是可重复使用的，所以当栈中的block执行一次之后就被清除出栈了，所以无法多次使用。_NSConcreteMallocBlock类型的block有闭包行为，并且该block需要被多次执行。当需要多次执行时，就会把该block从栈中复制到堆中，供以多次执行。3.3 编译器如何编译我们通过一个简单的示例来说明： 1 #import typedef void（^BlockA）（void）; 2 __attribute__（（noinline）） 3 void runBlockA（BlockA block） { 4 block（）; 5 } 6 void doBlockA（） { 7 BlockA block = ^{ 8 // Empty block 9 };10 runBlockA（block）;11 } 上面的代码定义了一个名为BlockA的block类型，该block在函数doBlockA中实现，并将其作为函数runBlockA的参数，最后在函数doBlockA中调用函数runBloackA。注意：如果block的创建和调用都在一个函数里面，那么优化器（optimiser）可能会对代码做优化处理，从而导致我们看不到编译器中的一些操作，所以用__attribute__（（noinline））给函数runBlockA添加noinline，这样优化器就不会在doBlockA函数中对runBlockA的调用做内联优化处理。我们来看看编译器做的工作内容： 1 #import __attribute__（（noinline）） 2 void runBlockA（struct Block_layout *block） { 3 block->invoke（）; 4 } 5 void block_invoke（struct Block_layout *block） { 6 // Empty block function 7 } 8 void doBlockA（） { 9 struct Block_descriptor descriptor;10 descriptor->reserved = 0;11 descriptor->size = 20;12 descriptor->copy = NULL;13 descriptor->dispose = NULL;14 struct Block_layout block;15 block->isa = _NSConcreteGlobalBlock;16 block->flags = 1342177280;17 block->reserved = 0;18 block->invoke = block_invoke;19 block->descriptor = descriptor;20 runBlockA（&block）;21 } 上面的代码结合block的数据结构定义，我们能很容易得理解编译器内部对block的工作内容。3.4 copy（）和dispose（）上文中提到，如果我们想要在以后继续使用某个block，就必须要对该block进行拷贝操作，即从栈空间复制到堆空间。所以拷贝操作就需要调用Block_copy（）函数，block的descriptor中有一个copy（）辅助函数，该函数在Block_copy（）中执行，用于当block需要拷贝对象的时候，拷贝辅助函数会retain住已经拷贝的对象。既然有有copy那么就应该有release，与Block_copy（）对应的函数是Block_release（），它的作用不言而喻，就是释放我们不需要再使用的block，block的descriptor中有一个dispose（）辅助函数，该函数在Block_release（）中执行，负责做和copy（）辅助函数相反的操作，例如释放掉所有在block中拷贝的变量等。4.总结以上内容是我学习各大师的文章后对自己学习情况的一个记录，其中有部分文字和代码示例是来自大师的文章，还有一些自己的理解，如有错误还请大家勘误。 Objective-C中@property的所有属性详解 http://www.linuxidc.com/Linux/2014-03/97744.htmObjective-C 和 Core Foundation 对象相互转换的内存管理总结 http://www.linuxidc.com/Linux/2014-03/97626.htm使用 Objective-C 一年后我对它的看法 http://www.linuxidc.com/Linux/2013-12/94309.htm10个Objective-C基础面试题，iOS面试必备 http://www.linuxidc.com/Linux/2013-07/87393.htmObjective-C适用C数学函数 <math.h> http://www.linuxidc.com/Linux/2013-06/86215.htm好学的 Objective-C 高清PDF http://www.linuxidc.com/Linux/2014-09/106226.htm本文永久更新链接地址：http://www.linuxidc.com/Linux/2015-01/111718.htm