开始使用Web Workers -

film

浏览: 225617 次
性别:
来自: 北京

最近访客更多访客>>

newmoon

zhangnan_119

starlegend

554797112

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

开始使用Web Workers

原文地址：http://blog.jobbole.com/30445/

英文原文：tutsplus，编译：伯乐在线 -胡蓉（@蓉Flora）

单线程（Single-threaded）运行是JavaScript语言的设计目标之一，进而言之是保持JavaScript的简单。但是我必须要说，尽管JavaScript具有如此语言特质，但它绝不简单！我们所说的“单线程”是指JavaScript只有一个线程控制。是的，这点令人沮丧，JavaScript引擎一次只能做一件事。

“web workers处在一个严格的无DOM访问的环境里，因为DOM是非线程安全的。”

现在，你是不是觉得要想利用下你机器闲置的多核处理器太受限制？不用担心，HTML5将改变这一切。

JavaScript的单线程模式

有学派认为JavaScript的单线程特质是一种简化，然而也有人认为这是一种限制。后者提出的是一个很好的观点，尤其是现在web应用程序大量的使用JavaScript来处理界面事件、轮询服务端接口、处理大量的数据以及基于服务端的响应操作DOM。

在维护响应式界面的同时，通过单线程控制处理如此多事件是项艰巨的任务。它迫使开发人员不得不依靠一些技巧或采用变通的方法（如使用setTimeout()，setInterval()，或调用XMLHttpRequest和DOM事件）来实现并发。然而，尽管这些技巧毫无疑问地提供了解决异步调用的方法，但非阻塞的并不意味着是并发的。John Resig在他的博客中解释了为什么不能并行运行。

限制

如果你已经和JavaScript打过一段时间的交道，那么你一定也遭遇过如下令人讨厌的对话框，提示你有脚本无响应。没错，几乎大多数的页面无响应都是由JavaScript代码引起的。

以下是一些运行脚本时造成浏览器无响应的原因：

过多的DOM操作：DOM操作也许是在JavaScript运行中代价最高的。所以，大批量的DOM操作无疑是你代码重构的最佳方向之一。
无终止循环：审视你代码中复杂的嵌套循环永远不是坏事。复杂的嵌套循环所做的工作常常比实际需要做的多很多，也许你可以找到其他方法来实现同样的功能。
同时包含以上两种：最坏的情况就是明明有更优雅的办法，却还是在循环中不断更新DOM元素，比如可以采用DocumentFragment。

好帮手Web Workers

幸好有了HTML5和Web Workers，你可以真正生成一条异步的线程。当主线程处理界面事件时，新的worker可以在后台运行，它甚至可以有力的处理大量的数据。例如，一个worker可以处理大型的数据结构（如JSON），从中提取变量信息然后在界面中显示。好了，废话不多说，让我们看一些实际的代码吧。

创建一个Worker

通常，与web worker相关的代码都放在一个独立的JavaScript文件中。父线程通过在Worker构造函数中指定一个JavaScript文件的链接来创建一个新的worker，它会异步加载并执行这个JavaScript文件。

var
primeWorker = new
Worker('prime.js');

启动Worker

要启动一个Worker，则父线程向worker传递一个信息，如下所示：

var
current = $('#prime').attr('value');

primeWorker.postMessage(current);

父页面可以通过postMessage接口与worker进行通信，这也是跨源通信（cross-origin messaging）的一种方式。通过postMessage接口除了可以向worker传递私有数据类型，它还支持JSON数据结构。但是，你不能传递函数，因为函数也许会包含对潜在DOM的引用。

“父线程和worker线程有它们各自的独立空间，信息主要是来回交换而不是共享。”

信息在后台运行时，先在worker端序列化，然后在接收端反序列化。鉴于此，不推荐向worker发送大量的数据。

父线程同样可以声明一个回调函数，来侦听worker完成任务后发回的消息。这样，父线程就可以在worker完成任务后采取些必要的行动，比如更新DOM元素。如下代码所示：

primeWorker.addEventListener('message',
function(event){

console.log('Receiving from Worker: '+event.data);

$('#prime').html( event.data );

});

event对象包含两个重要属性：

target：用来指向发送信息的worker，在多元worker环境下比较有用。
data：由worker发回给父线程的数据。

worker本身是包含在prime.js文件中的，它同时侦听message事件，从父线程中接收信息。它同样通过postMessage接口与父线程进行通信。

self.addEventListener('message',
function(event){

var
currPrime = event.data, nextPrime; 

setInterval(
function(){

nextPrime = getNextPrime(currPrime);

postMessage(nextPrime);

currPrime = nextPrime;

}, 500);

});

在本文例子中，我们寻找下一个最大的质数，然后不断将结果发回至父线程，同时不断更新界面以显示新的值。在worker的代码中，字段self和this都是指向全局作用域。Worker既可以添加事件侦听器来侦听message事件，也可以定义一个onmessage处理器，来接收从父线程发回的消息。

寻找下一个质数的例子显然不是worker的理想用例，但是在此选用这个例子是为了说明消息传递的原理。之后，我们会挖掘些可以通过web worker获得益处的实际用例。

终止Workers

worker属于占用资源密集型，它们属于系统层面的线程。因此，你应该不希望创建太多的worker线程，所以你需要在它完成任务后终止它。Worker可以通过如下方式由自己终止：

self.close();

或者，由父线程终止。

primeWorker.terminate();

安全与限制

在worker的代码中，不要访问一些重要的JavaScript对象，如document、window、console、parent，更重要的是不要访问DOM对象。也许不用DOM元素以至不能更新页面元素听上去有点严格，但是这是一个重要的安全设计决定。

想象一下，如果众多线程都试着去更新同一个元素那就是个灾难。所以，web worker需要处在一个严格的并线程安全的环境中。

正如之前所说，你可以通过worker处理数据，并将结果返回主线程，进而更新DOM元素。尽管它们不能访问一些重要的JavaScript对象，但是它们可以调用一些函数，如setTimeout()/clearTimeout()、setInterval()/clearInterval()、navigator等等，也可以访问XMLHttpRequest和localStorge对象。

同源限制

为了能和服务器交互，worker必须遵守同源策略（same-origin policy）(译注：可参考国人文章同源策略)。比如，位于http://www.example.com/内的脚本文件不能访问https://www.example.com的脚本。尽管域名相同，但同源策略要求端口也必须一致。通常，这不会成为一个很大的问题。但是你很有可能会同一个域名编写worker和client，所以知道这点对你总是有所帮助。

Google Chrome与本地访问

Google Chrome对worker本地访问做了限制，因此你无法本地运行这些例子。如果你又想用Chrome，那么你可以将文件放到服务器上，或者在通过命令启动Chrome时加上–allow-file-access-from-files。例如，苹果系统下：

$ /Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome –allow-file-access-from-files

然而，在实际产品生产过程中，此方法并不推荐。最好还是将你的文件上传至服务器中，同时进行跨浏览器测试。

Worker调试和错误处理

不能访问console似乎有点不方便，但幸亏有了Chrome开发者工具，你可以像调试其他JavaScript代码那样调试worker。

为处理web worker抛出的异常，你可以侦听error事件，它属于ErrorEvent对象。检测该对象从中了解引起错误的详细信息。

primeWorker.addEventListener('error',
function(error){

console.log(' Error Caused by worker: '+error.filename

+
' at line number: '+error.lineno

+
' Detailed Message: '+error.message);

});

多个Worker线程

尽管创建多个worker来协调任务分配也许很常见，但还是要提醒一下各位，官方规范指出worker属于相对重量级并能长期运行在后台的脚本。所以，由于Web worker的高启动性能成本和高进程内存成本，它们的数量不宜过多。

简单介绍共享workers

官方规范指出有两种worker：专用线程（dedicated worker）和共享线程（shared worker）。到目前为止，我们只列举了专用线程的例子。专用线程与创建线程的脚本或页面直接关联，即有着一对一的联系。而共享线程允许线程在同源中的多个页面间进行共享，例如：同源中所有页面或脚本可以与同一个共享线程通信。

“创建一个共享线程，直接将脚本的URL或worker的名字传入SharedWorker构造函数”

两者最主要的区别在于，共享worker与端口相关联，以保证父脚本或页面可以访问。如下代码创建了一个共享worker，并声明了一个回调函数以侦听worker发回的消息，同时向共享worker传输一条消息。

var
sharedWorker = new
SharedWorker('findPrime.js');

sharedWorker.port.onmessage =
function(event){

...

} 

sharedWorker.port.postMessage('data you want to send');

同样，worker可以侦听connect事件，当有客户端想与worker进行连接时会相应地向其发送消息。

onconnect = 
function(event) {

// event.source包含对客户端端口的引用

var
clientPort = event.source; 

// 侦听该客户端发来的消息

clientPort.onmessage =
function(event) {

// event.data包含客户端发来的消息

var
data = event.data; 

....

// 处理完成后发出消息

clientPort.postMessage('processed data');

}

};

由于它们具有共享的属性，你可以保持一个应用程序在不同窗口内的相同状态，并且不同窗口的页面通过同一共享worker脚本保持和报告状态。想更多的了解共享worker，我建议你阅读官方文档。

实际应用场景

worker的实际发生场景可能是，你需要处理一个同步的第三方接口，于是主线程需要等待结果再进行下一步操作。这种情况下，你可以生成一个worker，由它代理，异步完成此任务。

Web worker在轮询情况下也非常适用，你可以在后台不断查询目标，并在有新数据时向主线程发送消息。

你也许遇到需要向服务端返回大量的数据的情况。通常，处理大量数据会消极影响程序的响应能力，然后导致不良用户体验。更优雅的办法是将处理工作分配给若干worker，由它们处理不重叠的数据。

还有应用场景会出现在通过多个web worker分析音频或视频的来源，每个worker针对专项问题。

结论

随着HTML5的展开，web worker规范也会持续加入。如果你打算使用web worker，看一看它的官方文档不是坏事。

专项线程的跨浏览器支持目前还不错，Chrome，Safari和Firefox目前的版本都支持，甚至IE这次都没有落后太多，IE10还是不错的。但是共享线程只有当前版本的Chrome和Safari支持。另外奇怪的一点是，Android 2.1的浏览器支持web worker，反而4.0版本不支持。苹果也从iOS 5.0开始支持web worker。

想象一下，在原本单线程环境下，多线程会带来无限可能哦~

译注：本人对此JavaScript技术领域并不是特别熟悉，如有误翻的地方，请大家及时批评指正，我将及时修改!!!最后，推荐两篇相关国人优秀文章

《HTML5 web worker的使用》

《深入HTML5 Web Worker应用实践：多线程编程》

分享到：