PS:那篇文章中在最后我犯了一个错误,误下了一个结论:foreach中不能使用send并猜测这是PHP的bug,实际上并不是,真实的原因粗暴简单的理解就是send会让生成器继续执行一次导致。
回到今天主旨上来,强调几点:
-
虽然文章标题中有“yield和协程”这样的关键字,但实际上yield并不是协程,看起来有不少人直接将yield和协程划了等号。yield的本质是生成器,英文名字叫做Generator。
-
yield只能用在function中,但用了yield就已经不是传统意义上的function了,同时如果你企图在function之外的其他地方用yield,你会被打脸。
-
yield的最重要作用就是:自己中断一坨代码的执行,然后主动让出CPU控制权给路人甲;然后又能通过一些方式从刚才中断的地方恢复运行。这个就比较屌了,假如你请求了一个费时10s的服务器API,此时是可以让出CPU给路人甲。粗暴地说上面的过程就算是协程的基本概念。
多线程和多进程都是操作系统参与的调度,而协程是用户自主实现的调度,协程的关键点实际上是“用户层实现自主调度”,大概有“翻身农奴把歌唱”的意思。
下面我通过一坨代码来体会一把“翻身农奴”,你们感受一下:
<?php function gen1() { for( $i = 1; $i <= 10; $i++ ) { echo "GEN1 : {$i}".PHP_EOL; // sleep没啥意思,主要就是运行时候给你一种切实的调度感,你懂么 // 就是那种“你看!你看!尼玛,我调度了!卧槽” sleep( 1 ); // 这句很关键,表示自己主动让出CPU,我不下地狱谁下地狱 yield; } } function gen2() { for( $i = 1; $i <= 10; $i++ ) { echo "GEN2 : {$i}".PHP_EOL; // sleep没啥意思,主要就是运行时候给你一种切实的调度感,你懂么 // 就是那种“你看!你看!尼玛,我调度了!卧槽” sleep( 1 ); // 这句很关键,表示自己主动让出CPU,我不下地狱谁下地狱 yield; } } $task1 = gen1(); $task2 = gen2(); while( true ) { // 首先我运行task1,然后task1主动下了地狱 echo $task1->current(); // 这会儿我可以让task2介入进来了 echo $task2->current(); // task1恢复中断 $task1->next(); // task2恢复中断 $task2->next(); }
虽然我话都说到这里了,但是肯定还是有人get不到“所以,到底发生了什么?”。你要知道,如果function gen1和function gen2中没有yield,而是普通函数,你是无法中断其中的for循环的,诸如下面这样的代码:
<?php function gen1() { for( $i = 1; $i <= 10; $i++ ) { echo "GEN1 : {$i}".PHP_EOL; sleep( 1 ); } } function gen2() { for( $i = 1; $i <= 10; $i++ ) { echo "GEN2 : {$i}".PHP_EOL; } } gen1(); gen2(); // 看这里,看这里,看这里! // 上面的代码一旦运行,一定是先运行完gen1函数中的for循环 // 其次才能运行完gen2函数中的for循环,绝对不会出现 // gen1和gen2交叉运行这种情况
写到这里后我也开始蹩了,和以往的憋了三天蹦不出来个屁有所不同,我这次蹩出了一个比较典型的应用场景:curl。下面我们基于上面那坨辣鸡代码将gen1修改为一个耗时curl网络请求,gen2将向一个文本文件中写内容,我们的目的就是在耗时的curl开始后主动让出CPU,让gen2去写文件,以实现CPU的最大化利用。
<?php $ch1 = curl_init(); // 这个地址中的php,我故意sleep了5秒钟,然后输出一坨json curl_setopt( $ch1, CURLOPT_URL, "http://www.selfctrler.com/index.php/test/test1" ); curl_setopt( $ch1, CURLOPT_HEADER, 0 ); $mh = curl_multi_init(); curl_multi_add_handle( $mh, $ch1 ); function gen1( $mh, $ch1 ) { do { $mrc = curl_multi_exec( $mh, $running ); // 请求发出后,让出cpu yield; } while( $running > 0 ); $ret = curl_multi_getcontent( $ch1 ); echo $ret.PHP_EOL; return false; } function gen2() { for ( $i = 1; $i <= 10; $i++ ) { echo "gen2 : {$i}".PHP_EOL; file_put_contents( "./yield.log", "gen2".$i, FILE_APPEND ); yield; } } $gen1 = gen1( $mh, $ch1 ); $gen2 = gen2(); while( true ) { echo $gen1->current(); echo $gen2->current(); $gen1->next(); $gen2->next(); }
上面的代码,运行以后,我们再等待curl发起请求的5秒钟内,同时可以完成文件写入功能,如果换做平时的PHP程序,就只能是先阻塞等待curl拿到结果后才能完成文件写入。
<?php $ch1 = curl_init(); // 这个地址中的php,我故意sleep了5秒钟,然后输出一坨json curl_setopt( $ch1, CURLOPT_URL, "http://www.selfctrler.com/index.php/test/test1" ); curl_setopt( $ch1, CURLOPT_HEADER, 0 ); $mh = curl_multi_init(); curl_multi_add_handle( $mh, $ch1 ); function gen1( $mh, $ch1 ) { do { $mrc = curl_multi_exec( $mh, $running ); // 请求发出后,让出cpu $rs = yield; echo "外部发送数据{$rs}".PHP_EOL; } while( $running > 0 ); $ret = curl_multi_getcontent( $ch1 ); echo $ret.PHP_EOL; return false; } function gen2() { for ( $i = 1; $i <= 10; $i++ ) { echo "gen2 : {$i}".PHP_EOL; file_put_contents( "./yield.log", "gen2".$i, FILE_APPEND ); $rs = yield; echo "外部发送数据{$rs}".PHP_EOL; } } $gen1 = gen1( $mh, $ch1 ); $gen2 = gen2(); while( true ) { echo $gen1->current(); echo $gen2->current(); $gen1->send("gen1"); $gen2->send("gen2"); }
我们修改了内容:
将$gen1->next()修改成了$gen1->send("gen1")
在function gen1中yield有了返回值,并且将返回值打印出来
这件事情告诉我们:yield和send,是可以双向通信的,同时告诉我们send可以用来恢复原来中断的代码,而且在恢复中断的同时可以携带信息回去。
文章最后补个小故事:其实yield是PHP 5.5就已经添加进来了,这个模块的作者叫做Nikita Popov,网络上的名称是Nikic。我们知道PHP7这一代主力是惠新宸,下一代PHP主力就是Nikic了。早在2012年,Nikic就发表了一篇关于PHP yield多任务的文章,链接我贴出来大家共赏一下 --- http://nikic.github.io/2012/12/22/Cooperative-multitasking-using-coroutines-in-PHP.html