.NET4.0并行计算技术基础（4）

这是一个系列讲座，前面几讲的链接为：

================================================

19.3 让一切“并行”——任务并行库原理及应用

19.3.1 任务并行库简介

任务并行库（ TPL ： Task Parallel Library ）是 .NET 4.0 为帮助软件工程师开发并行程序而提供的一组类，位于 System.Threading 和 System.Threading.Tasks 这两个命名空间中，驻留在 3 个 .NET 核心程序集 mscorlib.dll 、 System.dll 和 System.Core.dll 里。使用这些类，可以让软件工程师在开发并行程序时，将精力更关注于问题本身，而不是诸如线程的创建、取消和同步等繁琐的技术细节。

使用 TPL 开发并行程序，考虑的着眼点是“任务 (task) ”而非“线程”。

一个任务是一个 Task 类的实例，它代表某个需要计算机执行的数据处理工作，其特殊之处在于：

在 TPL 中，任务通常代表一个可以被计算机 并行执行 的工作。

任务可以由任何一个线程执行，特定的任务与特定的线程之间没有绑定关系。在目前的版本中， TPL 使用 .NET 线程池中的线程来执行任务。

负责将任务“分派”到线程的工作则“任务调度器（ Task Scheduler ）”负责。任务调度器集成于线程池中。

我们在前面介绍并行计算基本原理时，曾经介绍过 OpenMP ，通过在 Fortran 或 C/C++ 代码中添加特定的编译标记，实现了 OpenMP 标准的编译器会自动地生成相应的并行代码。然而， TPL 采用了另一种实现方式，它自行是作为 .NET 平台的一个有机组成部分而出现的，并不对编译器提出特殊要求，当应用程序使用 TPL 编写并行程序时，所有代码会被直接编译为 IL 指令，然后由 CLR 负责执行之，整个过程完全等同于标准的 .NET 应用程序。换言之，对于应用软件开发工程师而言，使用 TPL 开发并行程序，在编程方式上没有任何变化，只不过是编程时多了几个类可用，并且处理数据时需要使用并行算法。

提示：

之所以微软在设计 .NET 4.0 并行扩展的时候放弃了类似于 OpenMP 的方式，是因为 .NET 平台本身是跨语言的，如果象 OpenMP 那样，就不得不对所有的 .NET 编程语言设定特定的编译指令，并且需要修改现有的各种语言编译器，这无疑是不明智的一个决定。

另外，针对并行程序中令人头痛的异常处理问题， TPL 提供了一个增强了的 .NET 异常处理机制，并且在 Visual Studio 中集成了相应的调试工具。

扩充阅读：

使用 Visual Studio 2010 调试并行程序

Visual Studio 2010 对并行程序的调试提供了强大的手段，给程序设计好断点以后，可以使用 Threads 窗口查看当前程序的所有线程：

在图 19 ‑ 9 中双击某行，可以让指定的线程成为当前“激活”的“被调试”的线程。

另外， Parallel Tasks 窗口展示了当前程序所运行的所有任务：

在 Parallel Stacks 窗口中，则可以直观地看到每个线程的调用堆栈：

有关 Visual Studio 2010 调试器的使用方法，请查询 MSDN 。本书不再赘述。

19.3.2 从线程到任务

在对 TPL 有了基本的了解之后，我们以一个实例来介绍如何使用 TPL 开发并行程序（图 19 ‑ 12 ）。

1 示例简介

示例项目 CalculateVarianceOfPopulation 完成以下任务：

测试一批数据的总体方差。

依据数理统计理论，可以使用以下公式计算方差：

很明显，要完成计算数据总体方差的任务，必须完成以下的工作：

（ 1 ）计算出所有数据的平均值，这很简单，直接求数据的和然后除以数据个数就行了。

（ 2 ）计算所有数与平均值的差值的平方，然后求和

（ 3 ）将第（ 2 ）步求出的各除以数据个数，得到总体方差。

分析一下，在上述 3 个子任务中，第（ 2 ）步是最有可能并行执行的。我们可以将整个数据分成几组，然后对每组数据并行执行处理任务。

下面简要介绍一下示例程序的技术要点，完整代码可以在配套光盘上找到。

2 直接使用线程实现并行处理

在示例程序中，测试数据是随机生成的，放在一个 double 类型的数组中，其大小由常量 DataSize 确定。

示例程序是一个 windows 应用程序，为了保证程序可以及时地响应用户操作，均采用多线程方式在后台执行计算任务，为此设计了一个跨线程安全显示信息的函数：

private void ShowInfo(string Info)

{

if ( InvokeRequired )

{

Action<string> del = (str) => { rtfInfo.AppendText(str); };

this.BeginInvoke(del, Info);

}

else

rtfInfo.AppendText(Info);

}

注意上面用到了 Control.InvokeRequired 属性用于判断是否跨线程访问 RichTextBox 控件。

串行程序没什么好说的，示例程序将其封装为一个 CalculateVarianceInSequence() 函数，直接调用就行了。

有趣的是如何使用线程来并行处理。常量 ThreadCount 用于定义并行执行上述第（ 2 ）个任务的线程数，示例中将其设置为 4 ，因此，在程序运行时，有 4 个线程同时计算“每个数据与总体平均值的差值的平方和”。这是一个典型的线程同步问题。

我们使用一个窗体的成员变量 SquareSumUsedByThread 保存计算结果，由于有 4 个线程要访问它，因此必须给其加上一把锁。这里有一个需要注意的地方，为了提升程序性能，这把“锁”锁定的对象不能是主窗体对象，更不能是主窗体类型，而是一个专用于互斥的对象。为此，在主窗体中我添加了以下变量：

private object SquareSumLockObject = new object();

而在线程函数中这样访问它：

//…

lock (SquareSumLockObject)

{

SquareSumUsedByThread += sum;

}

//…

这是一个很重要的多线程开发技巧，读者需要注意。

另外，工作线程在执行计算任务时需要知道一些信息：

l 它负责处理整个数组中“哪块”区域？这可以通过它要处理的数据的起始索引和要处理的数据个数确定。

l 总体数据的平均值，这个值在算法前一步使用串行算法计算得到的。

读者一看到这，应该马上意识到这是一个典型的“将数据从外界传送到线程中”问题，可以使用本书第 16 章介绍过的相关编程技巧来解决。在本示例中，定义了一个 ThreadArgu 辅助类用于封装这些信息。由此得到线程函数的代码框架：

private void CalculateSquareSumInParallelWithThread( object ThreadArguObject )

{

ThreadArgu argu = ThreadArguObject as ThreadArgu ;

// ……（代码略）

}

另外，由于有 4 个工作线程执行计算任务，因此，我们可以使用第 17 章介绍过的 CountdownEvent 对象来等待这 4 个线程的工作结束。

如果读者掌握了前几章的内容，那么在上面介绍的基础之上，您完全可以不看示例代码自行编出这个程序，这是一个很好的编程练习。

====================================

下一讲《.NET4.0并行计算基础（5）》

.NET4.0并行计算技术基础（4）

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索：z360901061

微信扫一扫加我为好友

QQ号联系： 360901061

您的支持是博主写作最大的动力，如果您喜欢我的文章，感觉我的文章对您有帮助，请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧，狠狠点击下面给点支持吧，站长非常感激您！手机微信长按不能支付解决办法：请将微信支付二维码保存到相册，切换到微信，然后点击微信右上角扫一扫功能，选择支付二维码完成支付。

【本文对您有帮助就好】元

2元

5元

10元

20元

自定义