自动化在线 自动化在线 数据加载中... 数据加载中...
首页 | 下载系统 | 供求信息 | 新闻系统 | 企业信息 | 产品信息 | 展会信息 | 论坛
首页 > 新闻系统 > 嵌入式系统 > 嵌入式系统技术
 
多核编程的几个难题及其应对策略
作者: 发布时间:2007-12-16 04:41:37 来源: 繁体版
欢迎访问www.autooo.net

  随着多核 CPU的出世,多核编程方面的问题将摆上了程序员的日程,有许多老的程序员以为早就有多CPU的机器,业界在多CPU机器上的编程已经积累了很多经验,多核CPU上的编程应该差不多,只要借鉴以前的多任务编程、并行编程和并行算法方面的经验就足够了。

  我想说的是,多核机器和以前的多CPU机器有很大的不同,以前的多CPU机器都是用在特定领域,比如服务器,或者一些可以进行大型并行计算的领域,这些领域很容易发挥出多CPU的优势,而现在多核机器则是应用到普通用户的各个层面,特别是客户端机器要使用多核CPU,而很多客户端软件要想发挥出多核的并行优势恐怕没有服务器和可以进行大型并行计算的特定领域简单。

  串行化方面的难题

  1)加速系数

  衡量多处理器系统的性能时,通常要用到的一个指标叫做加速系数,定义如下:S(p) = 使用单处理器执行时间(最好的顺序算法)/ 使用具有p个处理器所需执行时间

  2)阿姆尔达定律

  并行处理时有一个阿姆尔达定律,用方程式表示如下:

  S(p) = p / (1 + (p-1)*f)

  其中 S(p)表示加速系数

  p表示处理器的个数

  f表示串行部分所占整个程序执行时间的比例

  当f = 5%, p = 20时, S(p) = 10.256左右

  当f = 5%, p = 100时, S(p) = 16.8左右

  也就是说只要有5%的串行部分,当处理器个数从20个增加到100个时,加速系数只能从10.256增加到16.8左右,处理器个数增加了5倍,速度只增加了60%多一点。即使处理器个数增加到无穷多个,加速系数的极限值也只有20。

  如果按照阿姆尔达定律的话,可以说多核方面几乎没有任何发展前景,即使软件中只有1%的不可并行化部分,那么最大加速系统也只能到达100,再多的CPU也无法提升速度性能。按照这个定律,可以说多核CPU的发展让摩尔定律延续不了多少年就会到达极限。

  3)Gustafson定律

  Gustafson提出了和阿姆尔达定律不同的假设来证明加速系数是可以超越阿姆尔达定律的限制的,Gustafson认为软件中的串行部分是固定的,不会随规模的增大而增大,并假设并行处理部分的执行时间是固定的(服务器软件可能就是这样)。Gustafson定律用公式描述如下:

  S(p) = p + (1-p)*fts

  其中fts表示串行执行所占的比例

  如果串行比例为5%,处理器个数为20个,那么加速系数为20+(1-20)*5%=19.05

  如果串行比例为5%,处理器个数为100个,那么加速系数为100+(1-100)*5%=95.05

  Gustafson定律中的加速系数几乎跟处理器个数成正比,如果现实情况符合Gustafson定律的假设前提的话,那么软件的性能将可以随着处理个数的增加而增加。

  4)实际情况中的串行化分析

  阿姆尔达定律和Gustafson定律的计算结果差距如此之大,那么现实情况到底是符合那一个定律呢?我个人认为现实情况中既不会象阿姆尔达定律那么悲观,但也不会象Gustafson定律那么乐观。为什么这样说呢?还是进行一下简单的分析吧。

  首先需要确定软件中到底有那么内容不能并行化,才能估计出串行部分所占的比例,20世纪60年代时,Bernstein就给出了不能进行并行计算的三个条件:

  条件1:C1写某一存储单元后,C2读该单元的数据。称为“写后读”竞争

  条件2:C1读某一存储单元数据后,C2写该单元。称为“读后写”竞争

  条件1:C1写某一存储单元后,C2写该单元。称为“写后写”竞争

  满足以上三个条件中的任何一个都不能进行并行执行。不幸的是在实际的软件中大量存在满足上述情况的现象,也就是我们常说的共享数据要加锁保护的问题。

  加锁保护导致的串行化问题如果在任务数量固定的前提下,串行化所占的比例是随软件规模的增大而减小的,但不幸的是它会随任务数量的增加而增加,也就是说处理器个数越多,锁竞争导致的串行化将越严重,从而使得串行化所占的比例随处理器个数的增加而急剧增加。(关于锁竞争导致的串行化加剧情况我会在另一篇文章中讲解)。所以串行化问题是多核编程面临的一大难题。

  5)可能的解决措施

  对于串行化方面的难题,首先想到的解决措施就是少用锁,甚至采用无锁编程,不过这对普通程序员来说几乎是难以完成的工作,因为无锁编程方面的算法太过于复杂,而且使用不当很容易出错,许多已经发表到专业期刊上的无锁算法后来又被证明是错的,可以想象得到这里面的难度有多大。

欢迎访问www.autooo.net
 1/4    1 2 3 4 ›› ›|
  
评论】【加入收藏夹】【 】【打印】【关闭
来顶一下
近回首页
返回首页
※ 相关信息
 ·六月巨献,华北工控高端全长CPU卡  (2008-07-02)
 ·北京金三航科技发展有限公司近日  (2008-05-30)
 ·热门技术PLC西门子S7-300,400,  (2008-05-19)
 ·热门技术PLC西门子S7-300,400,  (2008-05-15)
 ·供应三菱,西门子,LG,台达等PLC可  (2008-03-13)
 ·AMT成立自动化集团  (2008-02-20)
 ·交通信息化标准建设重点任务明确  (2008-02-20)
 ·可编程控制系统设计员(师)等级  (2008-02-20)
 ·国产首款自主设计可编程门阵列芯  (2008-02-20)
 ·风河为凤凰号火星探测器提供“大  (2008-02-20)

关键:策略  应对  及其  难题  编程  CPU  任务  加速  负载  系数  平衡  

※ 其他信息
热水器“DSC单晶”时代开始
防盗报警控制器设计要点及对系统的需求
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

 
 搜索新闻
 最新新闻
·2008-2009全球环保水处理及能
·2009南非国际水处理展览会
·2009中东迪拜(国际)环保、
·2009阿布扎比国际环保展
·中国中高压变频器市场将进入
·深圳麦耐士招募市级代理
·硫化氢报警器,硫化氢泄露报
·天然气浓度报警器,天然气气
·首届军民两用维修技术产品展
·首届军民两用维修技术产品展
 热点新闻 
·PLC课程设计课题——三层电梯
·先进控制技术及应用
·变频器原理
·一般变频器常见故障及处理
·CK6432(FANUC-0TD)数控车床
·集成温度传感器AD590及其应用
·3G无线接入网IP化传送承载方
·谈步进电机的PLC控制方法
·基于PLC的机械手控制设计
·浅谈单相电度表的反转
数据加载中..

网站地图
Autooo.Net 版权所有
Copyright © 2007 All rights reserved