.NET4.0并行计算技术基础(4)

系统 1358 0
.NET4.0并行计算技术基础(4)
这是一个系列讲座,前面几讲的链接为:
版权声明在第一讲中。
================================================

19.3 让一切“并行”——任务并行库原理及应用

19.3.1 任务并行库简介

任务并行库( TPL Task Parallel Library )是 .NET 4.0 为帮助软件工程师开发并行程序而提供的一组类,位于 System.Threading System.Threading.Tasks 这两个命名空间中,驻留在 3 .NET 核心程序集 mscorlib.dll System.dll System.Core.dll 里。使用这些类,可以让软件工程师在开发并行程序时,将精力更关注于问题本身,而不是诸如线程的创建、取消和同步等繁琐的技术细节。

使用 TPL 开发并行程序,考虑的着眼点是“任务 (task) ”而非“线程”。

一个任务是一个 Task 类的实例,它代表某个需要计算机执行的数据处理工作,其特殊之处在于:

TPL 中,任务通常代表一个可以被计算机 并行执行 的工作。

任务可以由任何一个线程执行,特定的任务与特定的线程之间没有绑定关系。在目前的版本中, TPL 使用 .NET 线程池中的线程来执行任务。

负责将任务“分派”到线程的工作则“任务调度器( Task Scheduler )”负责。任务调度器集成于线程池中。

我们在前面介绍并行计算基本原理时,曾经介绍过 OpenMP ,通过在 Fortran C/C++ 代码中添加特定的编译标记,实现了 OpenMP 标准的编译器会自动地生成相应的并行代码。然而, TPL 采用了另一种实现方式,它自行是作为 .NET 平台的一个有机组成部分而出现的,并不对编译器提出特殊要求,当应用程序使用 TPL 编写并行程序时,所有代码会被直接编译为 IL 指令,然后由 CLR 负责执行之,整个过程完全等同于标准的 .NET 应用程序。换言之,对于应用软件开发工程师而言,使用 TPL 开发并行程序,在编程方式上没有任何变化,只不过是编程时多了几个类可用,并且处理数据时需要使用并行算法。

提示:

之所以微软在设计 .NET 4.0 并行扩展的时候放弃了类似于 OpenMP 的方式,是因为 .NET 平台本身是跨语言的,如果象 OpenMP 那样,就不得不对所有的 .NET 编程语言设定特定的编译指令,并且需要修改现有的各种语言编译器,这无疑是不明智的一个决定。

另外,针对并行程序中令人头痛的异常处理问题, TPL 提供了一个增强了的 .NET 异常处理机制,并且在 Visual Studio 中集成了相应的调试工具。

扩充阅读:

使用 Visual Studio 2010 调试并行程序

Visual Studio 2010 对并行程序的调试提供了强大的手段,给程序设计好断点以后,可以使用 Threads 窗口查看当前程序的所有线程:

.NET4.0并行计算技术基础(4)

19 9 中双击某行,可以让指定的线程成为当前“激活”的“被调试”的线程。

另外, Parallel Tasks 窗口展示了当前程序所运行的所有任务:

.NET4.0并行计算技术基础(4)

Parallel Stacks 窗口中,则可以直观地看到每个线程的调用堆栈:

.NET4.0并行计算技术基础(4)

有关 Visual Studio 2010 调试器的使用方法,请查询 MSDN 。本书不再赘述。

19.3.2 从线程到任务

在对 TPL 有了基本的了解之后,我们以一个实例来介绍如何使用 TPL 开发并行程序( 19 12 )。

.NET4.0并行计算技术基础(4)

1 示例简介

示例项目 CalculateVarianceOfPopulation 完成以下任务:

测试一批数据的总体方差。

依据数理统计理论,可以使用以下公式计算方差:

很明显,要完成计算数据总体方差的任务,必须完成以下的工作:

1 )计算出所有数据的平均值,这很简单,直接求数据的和然后除以数据个数就行了。

2 )计算所有数与平均值的差值的平方,然后求和

3 )将第( 2 )步求出的各除以数据个数,得到总体方差。

分析一下,在上述 3 个子任务中,第( 2 )步是最有可能并行执行的。我们可以将整个数据分成几组,然后对每组数据并行执行处理任务。

下面简要介绍一下示例程序的技术要点,完整代码可以在配套光盘上找到。

2 直接使用线程实现并行处理

在示例程序中,测试数据是随机生成的,放在一个 double 类型的数组中,其大小由常量 DataSize 确定。

示例程序是一个 windows 应用程序,为了保证程序可以及时地响应用户操作,均采用多线程方式在后台执行计算任务,为此设计了一个跨线程安全显示信息的函数:

private void ShowInfo(string Info)

{

if ( InvokeRequired )

{

Action<string> del = (str) => { rtfInfo.AppendText(str); };

this.BeginInvoke(del, Info);

}

else

rtfInfo.AppendText(Info);

}

注意上面用到了 Control.InvokeRequired 属性用于判断是否跨线程访问 RichTextBox 控件。

串行程序没什么好说的,示例程序将其封装为一个 CalculateVarianceInSequence() 函数,直接调用就行了。

有趣的是如何使用线程来并行处理。常量 ThreadCount 用于定义并行执行上述第( 2 )个任务的线程数,示例中将其设置为 4 ,因此,在程序运行时,有 4 个线程同时计算“每个数据与总体平均值的差值的平方和”。这是一个典型的线程同步问题。

我们使用一个窗体的成员变量 SquareSumUsedByThread 保存计算结果,由于有 4 个线程要访问它,因此必须给其加上一把锁。这里有一个需要注意的地方,为了提升程序性能,这把“锁”锁定的对象不能是主窗体对象,更不能是主窗体类型,而是一个专用于互斥的对象。为此,在主窗体中我添加了以下变量:

private object SquareSumLockObject = new object();

而在线程函数中这样访问它:

//…

lock (SquareSumLockObject)

{

SquareSumUsedByThread += sum;

}

//…

这是一个很重要的多线程开发技巧,读者需要注意。

另外,工作线程在执行计算任务时需要知道一些信息:

l 它负责处理整个数组中“哪块”区域?这可以通过它要处理的数据的起始索引和要处理的数据个数确定。

l 总体数据的平均值,这个值在算法前一步使用串行算法计算得到的。

读者一看到这,应该马上意识到这是一个典型的“将数据从外界传送到线程中”问题,可以使用本书第 16 章介绍过的相关编程技巧来解决。在本示例中,定义了一个 ThreadArgu 辅助类用于封装这些信息。由此得到线程函数的代码框架:

private void CalculateSquareSumInParallelWithThread( object ThreadArguObject )

{

ThreadArgu argu = ThreadArguObject as ThreadArgu ;

// ……(代码略)

}

另外,由于有 4 个工作线程执行计算任务,因此,我们可以使用第 17 章介绍过的 CountdownEvent 对象来等待这 4 个线程的工作结束。

如果读者掌握了前几章的内容,那么在上面介绍的基础之上,您完全可以不看示例代码自行编出这个程序,这是一个很好的编程练习。

====================================

下一讲 《.NET4.0并行计算基础(5)》

.NET4.0并行计算技术基础(4)


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论