质量人员必读-------可靠性基础知识

四季平安符 2012-10-23

展开全文

质量人员必读-------可靠性基础知识

摘要: 产品的可靠性是指：产品在规定的条件下、在规定的时间内完成规定的功能的能力。从定义本身来说，它是产品的一种能力，这是一个很抽象的概念；我们可以用个例子（100个学生即将参 ...

第一节可靠性定义

一、可靠性定义
产品的可靠性是指：产品在规定的条件下、在规定的时间内完成规定的功能的能力。从定义本身来说，它是产品的一种能力，这是一个很抽象的概念；我们可以用个例子（100个学生即将参加考试）来理解这个定义，可靠性就是指：100个学生的考分的平均是多少？对这个平均分的准确性有多大把握？分数越高、把握越大，可靠性就越高。
我国的可靠性工作起步较晚，20世纪70年代才开始在电子工业和航空工业中初步形成可靠性研究体系，并将其应用于军工产品。其他行业可靠性工作起步更晚，差距更大，与先进国家差距20～30年，虽然国家已制订可靠性标准，但尚未引起所有企业的足够重视。

对产品而言，可靠性越高就越好。可靠性高的产品，可以长时间正常工作（这正是所有消费者需要得到的）；从专业术语上来说，就是产品的可靠性越高，产品可以无故障工作的时间就越长。

二、可靠性的重要性

调查结果显示（如某公司市场部2001年调查记录）：“对可靠性的重视度，与地区的经济发达程度成正比”。例如，英国电讯（BT）关于可靠性管理/指标要求有产品寿命、MTBF报告、可靠性框图、失效树分析（FTA）、可靠性测试计划和测试报告等；泰国只有MTBF和MTTF的要求；而厄瓜多尔则未提到，只是提出环境适应性和安全性的要求。

产品的可靠性很重要，它不仅影响生产公司的前途，而且影响到使用者的安全（前苏联的“联盟11号”宇宙飞船返回时，因压力阀门提前打开而造成三名宇航员全部死亡）。可靠性好的产品，不但可以减少公司的维修费用，而且可以很快就打出品牌，大幅度提升公司形象，增加公司收入。

随着市场经济的发展，竞争日趋激烈，人们不仅要求产品物美价廉，而且十分重视产品的可靠性和安全性。日本的汽车、家用电器等产品，虽然在性能、价格方面与我国彼此相仿，却能占领美国以及国际市场。主要的原因就是日本的产品可靠性胜过我国一筹。美国的康明斯、卡勃彼特柴油机，大修期为12000小时，而我国柴油机不过1000小时，有的甚至几十小时、几百小时就出现故障。我国生产的电梯，平均使用寿命（指两次大修期的间隔时期）为3年左右，而国外的电梯平均寿命在10年以上，是我们的3倍；故障率，国外平均为0.05次，而我国为1次以上，高出20倍，这样的产品怎么有竞争力呢！因此要想在竞争中立于不败之地，就要狠抓产品质量，特别是产品可靠性，没有可靠性就没有质量，企业就无法在激烈的竞争中生存和发展。因此，可靠性问题必须引起政府和企业的高度重视，抓好可靠性工作，不仅是关系到企业生存和发展的大问题，也是关系到国家经济兴衰的大问题。（呵呵，这是唱高调的内容，可以不看的……）

三、可靠性指标

衡量产品可靠性水平有好几种标准，有定量的，也有定性的，有时要用几种标准（指标）去度量一种产品的可靠性，但最基本最常用的有以下几种标准。

1.可靠度R（t）；它是产品在规定条件和规定时间内完成规定功能的概率。一批产品的数量为N，从t = 0时开始使用，随着时间的推移，失效的产品件数逐渐增加，而正常工作的产品件数n(t)逐渐减少，用R(t)表示产品在任意时刻t的可靠度。
2.可靠寿命[CR(tr)]；它与一般理解的寿命有不同含义，概念也不同，设产品的可靠度为R(t)，使可靠度等于规定值r时的时间tr的，即被定义为可靠寿命。

3.失效率（故障率）λ（t）；它是指某产品（零部件）工作到时间t之后，在单位时间△t内发生失效的概率。
4.有效寿命与平均寿命；有效寿命一般是指产品投入使用后至达到某规定失效率水平之前的一段工作时间。而平均寿命MTTF对于不可修复产品，指从开始使用直到发生失效这一段工作时间的平均值；对于可修复的产品，是指在整个使用阶段和除维修时间之后的各段有效工作时间的平均值。

5.平均无故障工作时间MTBF；是指相邻两次故障之间的平均工作时间，也称为平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。其他如可靠度、有效度、维修度、平均维修时间等也是衡量产品可靠性水平的一种标准，但是一般以可靠寿命失效率就足以说明产品可靠性程度了。

1. 平均故障间隔时间；

可维修的产品，其可靠性主要的参数是MTBF（Mean Time Between Fail），即平均故障间隔时间，也就是两次维修间的平均时间；不可维修的产品，用MTTB（Mean Time To Fail）；两个参数的计算没有区别，下文只提到MTBF。MTBF越大，说明产品的可靠性越高。

可以用以下理想测试来精确测试一批产品的MTBF；即将该批产品投入使用，当该批产品全部出现故障以后（假如第1个产品的故障时间为t1，第2个产品的故障时间为t2，第n个产品的故障时间为tn），计算发生故障的平均时间，则

由上式可以看出，理想测试就是用全部的时间和全部的故障数来算出精确的MTBF；

2、失效密度λ

另外一个常用的参数是λ，它是指在产品在t时刻失效的可能性，是失效间隔时间的倒数，也就是：λ＝1/MTBF。对某一类产品而言，产品在不同的时刻有不同的失效率（也就是失效率是时间的函数），对电子产品而言，其失效率符合浴盆曲线分布（如下图）：

浴盆曲线，分为三部份（I、II、III三部份）：

第I部份是早期失效阶段。这段时间内，从外形上看，在失效率从一个很高的指标迅速下降；从物理意义上理解，由于少数产品在制作后，存在一些制程、运输、调试等问题，产品有比较明显的缺陷，在投入使用的最初期，这缺陷很快就显露出来，随着时间的增长，这些明显的缺陷越来越少，也就形成了“失效率迅速下降”的现象；

第II部份是中期稳定阶段。这段时间内，产品的失效率稳定在一个较低水平；从物理意义上理解，当少数产品的明显缺陷显露出来后，剩下的就是正常的产品，这部份产品可以较稳定、持久地工作，所以失效率也稳定在一个较低水平；

第III部份是后期失效阶段；这段时间内，产品的失效率迅速上升；从物理意义上理解，到了后期，产品经过长时间的工作、磨损、老化，慢慢接近寿命终点，随着时间的增加（Tmax以内），到达寿命终点的产品越来越多，失效率也就随之上升；
知道了λ，就可以找到产品连续工作了t时间后、还正常的概率为R(t)=e-?t，此时已经失效的概率为F(t)＝1-R(t)＝1－e-?t。
R(t)=e-?t是一个经验公式，一般电子产品的寿命服从这一指数分布，其它分布下文再叙；

第二节可靠性测试

可靠性测试应该在可靠性设计之后，但目前我国的可靠性工作主要还是在测试阶段，这里将测试放在前面（目前大部分公司都会忽略最初的可靠性设计，比如我们公司，设计的时候，从来都没有考虑过可靠性，开发部的兄弟们不要拿砖头仍我……这是实话，只有在测试出现失效后才开始考虑设计）。

为了测得产品的可靠度（也就是为了测出产品的MTBF），我们需要拿出一定的样品，做较长时间的运行测试，找出每个样品的失效时间，根据第一节的公式计算出MTBF，当然样品数量越多，测试结果就越准确。但是，这样的理想测试实际上是不可能的，因为对这种测试而言，要等到最后一个样品出现故障――需要的测试时间长得无法想象，要所有样品都出现故障——需要的成本高得无法想象。

为了测试可靠性，这里介绍：加速测试（也就增加应力*），使缺陷迅速显现；经过大量专家、长时间的统计，找到了一些增加应力的方法，转化成一些测试的项目。如果产品经过这些项目的测试，依然没有明显的缺陷，就说明产品的可靠性至少可以达到某一水平，经过换算可以计算出MTBF（因产品能通过这些测试，并无明显缺陷出现，说明未达到产品的极限能力，所以此时对应的MTBF是产品的最小值）。其它计算方法见下文。（*应力：就是指外界各种环境对产品的破坏力，如产品在85℃下工作受到的应力比在25℃下工作受到的应力大；在高应力下工作，产品失效的可能性就大大增加了）；

一、环境测试

产品在使用过程中，有不同的使用环境（有些安装在室外、有些随身携带、有些装有船上等等），会受到不同环境的应力（有些受到风吹雨湿、有些受到振动与跌落、有些受到盐雾蚀侵等等）；为了确认产品能在这些环境下正常工作，国标、行标都要求产品在环境方法模拟一些测试项目，这些测试项目包括：

高温测试（高温运行、高温贮存）；
2

低温测试（低温运行、低温贮存）；
3

高低温交变测试（温度循环测试、热冲击测试）；
4

高温高湿测试（湿热贮存、湿热循环）；
5

机械振动测试（随机振动测试、扫频振动测试）；
6

汽车运输测试（模拟运输测试、碰撞测试）；
7

机械冲击测试；
8

开关电测试；
9

电源拉偏测试；
10

冷启动测试；
11

盐雾测试；
12

淋雨测试；
13

尘砂测试；
上述环境试验的相关国家标准如下（部分试验可能没有相关国标，或者是我还没有找到）：

1、低温试验
按GB/T 2423.1—89 《电工电子产品环境试验第二部分：试验方法低温试验》；
GB/T 2423.22—87 《电工电子产品环境试验第二部分：试验方法温度变化试验方法》
进行低温试验及温度变化试验。
温度范围：-70℃～10℃。

2、高温试验
按GB/T 2423.2—89 《电工电子产品环境试验第二部分：试验方法高温试验》；
GB/T 2423.22—87 《电工电子产品环境试验第二部分：试验方法温度变化试验方法》
进行高温试验及温度变化试验。
温度范围：10℃～210℃

3、湿热试验
按GB/T 2423.3—93 《电工电子产品环境试验第二部分：试验方法恒定湿热试验》；
GB/T2423.4—93 《电工电子产品环境试验第二部分：试验方法交变湿热试验》
进行恒定湿热试验及交变湿热试验。
湿度范围：30%RH～100%RH

4、霉菌试验
按GB/T 2423.16—90 《电工电子产品环境试验第二部分：试验方法长霉试验》进行霉菌试验。

5、盐雾试验
按GB/T 2423.17—93 《电工电子产品环境试验第二部分：试验方法盐雾试验》进行盐雾试验。

6、低气压试验
按GB/T 2423.21—92 《电工电子产品环境试验  第二部分：试验方法  低气压试验》；
GB/T2423.25—92 《电工电子产品环境试验  第二部分：试验方法  低温/低气压试验》；
GB/T2423.26—92 《电工电子产品  环境试验第二部分：试验方法  高温/低气压试验》；
进行低气压试验，高、低温/低气压试验。试验范围：-70℃～100℃  0～760mmHg 20%～95%RH。

7、振动试验
按GB/T 2423.10—95 《电工电子产品环境试验第二部分：试验方法振动试验》进行振动试验。
频率范围（机械振动台）：5～60Hz（定频振动5～80Hz），最大位移振幅3.5mm（满载）。频率范围（电磁振动台）：5～3000Hz，最大位移25mmP-P。

8、冲击试验
按GB/T 2423.5—95 《电工电子产品环境试验第二部分：试验方法冲击试验》进行冲击试验。冲击加速度范围：（50～1500）m/s2。

9、碰撞试验
按GB/T 2423.6—95 《电工电子产品环境试验第二部分：试验方法碰撞试验》进行碰撞试验。

10、跌落试验
按GB/T 2423.7—95 《电工电子产品环境试验第二部分：试验方法倾跌与翻到试验》；
GB/T2423.8—95 《电工电子产品环境试验第二部分：试验方法自由跌落试验》进行跌落试验。

说明：上面13项比较全面地概括了产品在实现使用过程中碰到的外界环境；实际测试时，因为各产品本身属性的相差较远、使用环境相差也很大，各公司可以根据产品的特点，适当选取、增加一些项目来测试（此产品对应的国/行标中要求的必测试项目，当然是必须测试的）；也可以根据产品特定的使用环境与使用方法，自行设计一些新测试项目，以验证产品是否能长期工作。
测试条件：不同的产品测试条件不一样；就拿高温测试来说，有些产品要求做高温贮存测试，有些要求做高温运行测试，有些产品的高温用85℃做测试，有些产品的高温是用65℃做测试。但是，宗旨只有一个，那就是至少满足国/行标。要测试一种产品的可靠性，找到这种产品的国/行标是必需的，按照国/行标的要求和指引找出必须的测试项目与各项目的测试方法，从而进行环境测试；

同一种产品，在不同的阶段，测试条件也不一样；一般而言，产品会经过研发、小批量试产、批量生产三个不同的阶段。在研发阶段，测试条件最严（应力最大）、测试延续的时候最短；小批量试产阶段，测试应力适中、测试时间适中；批量生产阶段，测试应力最小、测试时间较短；三个阶段的主要差别见下表：

阶段实验目的实验特点实验要求
研发发现设计缺陷，扩大设计余量高应力、短时间无故障
中试考察产品是否达到基本的可靠性水平中应力、中长时间无明显故障
批量生产生产工艺条件的稳定性低应力、短时间有条件的允许故障发生
鉴定鉴定产品的可靠性、计算产品的MTBF 低应力、长时间无特别要求
加速环境试验技术

传统的环境试验是基于真实环境模拟的试验方法，称为环境模拟试验。这种试验方法的特点是：模拟真实环境，加上设计裕度，确保试验过关。其缺陷在于试验的效率不高，并且试验的资源耗费巨大。

加速环境试验AET(Accelerated Environmental Testing)是一项新兴的可靠性试验技术。该技术突破了传统可靠性试验的技术思路，将激发的试验机制引入到可靠性试验，可以大大缩短试验时间，提高试验效率，降低试验耗损。加速环境试验技术领域的研究与应用推广对可靠性工程的发展具有重要的现实意义。

加速环境试验
激发试验(Stimulation)通过施加激发应力、环境快速检测来清除产品的潜在缺陷。试验所施加的应力并不模拟真实环境，而以提高激发效率为目标。

加速环境试验是一种激发试验，它通过强化的应力环境来进行可靠性试验。加速环境试验的加速水平通常用加速因子来表示。加速因子定义为设备在自然服役环境下的寿命与在加速环境下的寿命之比。

施加的应力可以是温度、振动、压力和湿度(即所谓“四综合”)及其他应力，应力的组合亦是有些场合更为有效的激发方式。高温变率的温度循环和宽带随机振动是公认最有效的激发应力形式。加速环境试验有2种基本类型：加速寿命试验(Accelerated Life Testing)、可靠性强化试验(Reliability Enhancement Testing)。

可靠性强化试验(RET)用以暴露与产品设计有关的早期失效故障，但同时，也用于确定产品在有效寿命期内抗随机故障的强度。加速寿命试验的目的是找出产品是如何发生、何时发生、为何发生磨耗失效的。下面分别对2种基本类型进行简单阐述。
1、加速寿命试验(ALT)

加速寿命试验只对元器件、材料和工艺方法进行，用于确定元器件、材料及生产工艺的寿命。其目的不是暴露缺陷，而是识别及量化在使用寿命末期导致产品损耗的失效及其失效机理。有时产品的寿命很长，为了给出产品的寿命期，加速寿命试验必须进行足够长的时间。

加速寿命试验是基于如下假设：即受试品在短时间、高应力作用下表现出的特性与产品在长时间、低应力作用下表现出来的特性是一致的。为了缩短试验时间，采用加速应力，即所谓高加速寿命试验(HALT)。

加速寿命试验提供了产品预期磨损机理的有价值数据，这在当今的市场上是很关键的，因为越来越多的消费者对其购买的产品提出了使用寿命要求。估计使用寿命仅仅是加速寿命试验的用处之一。它能使设计者和生产者对产品有更全面的了解，识别出关键的元器件、材料和工艺，并根据需要进行改进及控制。另外试验得出的数据使生产厂商和消费者对产品有充分的信心。
加速寿命试验的对象是抽样产品。

2、可靠性强化试验(RET)
可靠性强化试验有许多名称和形式，如步进应力试验、应力寿命试验(STRIEF)、高加速寿命试验(HALT)等。RET的目的是通过系统地施加逐渐增大的环境应力和工作应力，来激发故障和暴露设计中的薄弱环节，从而评价产品设计的可靠性。因此，RET应该在产品设计和发展周期中最初的阶段实施，以便于修改设计。

国外可靠性的有关研究人员在80年代初就注意到由于设计潜在缺陷的残留量较大，给可靠性的提高提供了可观的空间，另外价格和研制周期问题也是当今市场竞争的焦点。研究证明，RET不失为解决这个问题的最好方法之一。它获得的可靠性比传统的方法高得多，更为重要的是，它在短时间内就可获得早期可靠性，无须像传统方法那样需要长时间的可靠性增长(TAAF)，从而降低了成本。

RET的目的是要引起失效，因此它是破坏性试验，试样数量尽可能少。进行RET的理想时间是在设计周期的末期，此时设计、材料、元器件和工艺等都准备就绪，而生产尚未开始。通常RET的做法是施加预定的环境应力和工作应力(单独加、顺序加或同时加)，从小量级开始，然后逐步增加直到出现以下3种情况：

全部试样失效；
应力值大大超出服役期望值；
出现非相关失效。（非相关失效是指服役中不可能出现的失效模式）
可靠性强化试验也是针对少量抽样产品进行的。

3、其它类型加速环境试验
可靠性试验还包括可靠性统计试验，即可靠性鉴定试验和可靠性验收试验。基于加速环境的可靠性统计试验(即加速可靠性鉴定试验和加速可靠性验收试验)是加速环境试验亟待解决的一个问题。该问题的核心是通过高量级的加速环境试验数据去评估试样在低量级的服役环境中的可靠性水平。在产品的全寿命周期管理中，它们的功能在一定条件下可以由前述2种加速环境试验来实现。

4、加速环境试验在产品全寿命周期管理中的应用
在产品的设计、研制、生产和使用直至寿命末期整个寿命周期内，其可靠性的设计、改进、评估都离不开环境试验手段，而加速环境试验在产品的设计、研制和生产中是实现产品的可靠性增长和确定、评估产品可靠性水平的重要手段。
根据市场需求和用户的要求确定产品之后，就可初步设计好产品雏形。此时一般需要对元器件和原材料进行选择，选择代表试样进行加速寿命试验，从而确定所选择的元器件和原材料。产品设计完成并制造试样后就可以进行可靠性强化试验(RET)，以实现可靠性增长。这将是一个逐步清除设计上的薄弱环节的过程，同时，可以对材料和工艺方法进行加速寿命试验，为产品的正式生产奠定基础。这是一个反复的过程，即是一个试验——分析改进——试验的循环过程。为了确定产品的有效寿命，需要对产品的抽样进行加速寿命试验(ALT或HALT)，同时加速寿命试验还将为ESS提供必要的有关产品的数据。在清除了设计上的缺陷及薄弱环节之后，产品可以正式批量生产。环境应力筛选方案可以根据ALT(或HALT)确定的极限来确定。以最为有效的温度循环和宽带随机振动为例，两端的温度应该比工作极限约低20%，用在生产中的ESS振动量级应该约为振动破坏极限的50%。在确定了试验剖面后，便应该对几个(一般至少3个)试样进行筛选方案的验证(POS)，以证实筛选既不造成缺陷，又不消耗掉很多有效寿命。
通过筛选的产品可以出厂，没有通过筛选的产品在经过纠正后同样可以出厂，因为筛选并没有过多地降低产品的有效寿命，只是检测到了在制造过程中引入的缺陷。

应该指出的是，何时进行何种试验并没有严格的界线，如环境应力筛选可能会在可靠性强化试验中进行，不过此时所进行的环境应力筛选目的是对试样进行筛选、老炼、排除产品试样的早期故障，使其故障率趋于稳定，而不让早期故障在可靠性强化试验中暴露，造成不必要的浪费。另外，并不是所有的加速环境试验都是必需的，如可靠性强化试验所提供的信息，在承制方及订购方的共同认可下，是可以完成加速可靠性鉴定试验的功能的，而环境应力筛选(或高加速应力筛选)亦能实现加速可靠性验收试验的要求。

产品在使用过程中所获得的数据对于产品的可靠性增长也是相当有用的。同样的产品在不同的环境条件下使用，可能会表现为不同的可靠性量值，故产品的可靠性必须在真实的使用环境中或者在模拟的真实环境条件下验证，才能获得准确的可靠性数据。因此，应该重视在使用中反馈的信息，与以前的试验进行分析比较，对于改进试验方法、进一步提高产品的可靠性都有重要的意义。

总之，可靠性管理是贯穿于产品全寿命周期的一项工程，也是增强产品的市场竞争力的保证。
加速环境试验已应用于通讯、电子、电脑、能源、汽车等工业部门，并且在航空、航天、军工方面的应用也得到了迅速的发展。据报道，惠普、福特、波音等国际知名企业已相继采用可靠性强化试验技术进行新产品研制的可靠性增长试验，并由此获得高可靠性，缩短产品研制周期，取得了明显的经济效益。我国有关研究机构也对此进行了研究，加速环境试验将成为可靠性试验的补充和发展。

环境测试一般偏重于产品对外部条件适应能力的测试，如温度，湿度，电磁环境等。而其本身的工作状况不会变化，如电流、电压、机械负载等。
狭义的可靠性测试一般偏重于产品本身的性能，如在大电流或机械过载的条件下的性能稳定性，而其工作环境则保持在正常使用条件下。

广义的可靠性测试也可包括环境测试。

二、EMC测试
随着电子产品越来越多地采用低功耗、高速度、高集成度的LSI电路，使得这些系统比以往任何时候更容易受到电磁干扰的威胁。而与此同时，大功率设备及移动通讯和无线寻呼的广泛应用等，又大大增加了电磁骚扰的发生源，因此我们应提高产品本身抗干扰能力，即要求产品必须具备在一定的电磁环境下能正常工作的能力。某些产品在EMC方面的测试是国家强制要求进行的。通常状况下，EMC需要测试如下项目：
传导发射；
辐射发射；
静电抗扰性测试；
电快速脉冲串抗扰性测试；
浪涌抗扰性测试；
射频辐射抗扰性；
传导抗扰性：
电源跌落抗扰性；
工频磁场抗扰性；
电力线接触；
电力线感应；
三、其它测试
环境测试和EMC测试基本上包括了通常状况下所有的测试；这里再列举一些测试项目，可以根据情况适当选用：
1、外观测试；
附着力测试；
耐磨性测试；
耐醇性测试；
硬度测试；
耐手汗测试；
耐化妆品测试；
2、寿命测试；
某一器件中活动部件的活动次数；
某一配件（如电视的摇控器）的使用寿命；
两个器件拨插联结的拨插次数；
3、软件测试；
基本性能测试；
兼容性；
边界测试；
竞争测试；
压迫测试；
异常条件测试；
上述测试中，对于可以找到国/行标的产品，按国/行标的要求执行，对于找不到国/行标的产品，就只能做对比测试*了；*对比测试就是用至少两种产品在同一状况下做测试，然后测量各产品的性能，找出一系列数据，判定被测产品的那一种更好；
四、测试条件
说明：对某一具体产品做测试时，所有的测试条件必须以对应的国标、行标为准。没有国/行标时，应该根据实现的使用情况选定测试条件，下面的测试条件是由中兴公司的大虾提供（非常感谢这位不知道姓名的老兄），主要是用于测试CDMA手机，在此仅作其他产品的参考使用。
1. 高温贮存
高温测试的温度TH必须高于Tmax（Tmax指产品技术条件规定的高温工作温度）。研制测试时温度最高(一般取Tmax+20℃)、小批量试产测试时温度次之(一般取Tmax+15℃)、例行测试最低(一般取Tmax+10℃)。
2. 低温贮存
低温测试的温度TL必须低于产品技术条件规定的低温工作温度。研制测试最低，转产测试次之，例行测试最高；通常状况下三个阶段的TL都取－40℃。
3. 温度循环应力
高温保持温度同高温测试温度；低温保持温度同低温测试温度。
温变率大于1℃/min,但应小于5℃/min。
循环次数大于2次（研制测试）或8次（转产测试）。
温度保持时间大于0.5小时（对无外壳单板）或2小时（对整机）。
4. 高温高湿应力
测试温度为产品的高温工作温度加5℃。湿度为90%±3%；测试时间为24小时。
5. 随机振动应力
最高频率大于500Hz. 最大功率谱密度为0.02(对单机)∽0.04（对单板）g2/Hz.
测试方向为X，Y，Z，每方向30min.但如果抗振动性能较差的方向能通过振动测试，则其它方向可以免作。移动产品带电振动。
6. 扫频振动的应力
频率范围10-55Hz；恒定振幅0.35mm.
扫频速率每分钟1个倍频程。
测试方向X、Y、Z，每方向25分钟。但如果抗振动性能较差的方向能通过振动测试，则其它方向可以免作。移动产品带电振动。
7. 冲击振动的应力
冲击波型半正弦，脉冲宽度11ms.
冲击强度30g；冲击方向X、Y、Z，每方向正负3次。
如果抗冲击能力较差的方向能够通过冲击测试，则其它方向的冲击测试可以免做。
8. 开关电应力
在高温，低温和湿热条件下各开关电3次以上，在整个测试过程中开关电10次以上。
9. 电源拉偏应力
在常规条件下做电源拉偏测试。
一次电源（如交流220V和直流-48V）要求拉偏20%，至少10%。
二次电源（如直流5V）拉偏10%，至少5%。
将市电转换成产品使用的高压直流电的AC/DC设备为一次电源，将一次电源转换成单板使用的低压直流电的DC/DC设备为二次电源。
10.冷启动应力
将产品关电，在产品低温测试温度下“冷浸”0.5（对单板）∽2小时（对机柜式产品），然后开电，产品应能正常工作。
将以上过程重复100次以上。
11.盐雾应力
盐溶液为浓度5%的NaCl溶液。连续盐雾测试的时间为24小时。
交变盐雾测试的时间为：盐雾2小时，40℃90%湿热22小时，重复3个周期。
盐雾测试温度为35±2℃。
12.模拟汽车运输的应力
按实际发货的要求包装和装载。用载重汽车在三级公路上以20-40公里时速跑200公里，或在J300模拟汽车运输台上振动90min.
13.淋雨测试的应力
将产品按实际使用的状态放置，上电工作，功能正常。
用花洒喷头对产品喷水，流量约为10L/min。喷头距产品表面约半米，对产品表面各处均匀喷水（底面除外）。
喷头中心的出水方向与水平方向的夹角大于30度。
喷水时间根据产品体积大小，分别选取5分钟、10分钟、20分钟。
喷水后产品功能正常。
14.附着力测试
用锋利刀片（刀锋角度为15°～30°）在测试样本表面划10×10个1mm×1mm小网格，每一条划线应深及油漆的底层；用毛刷将测试区域的碎片刷干净；用粘附力350～400g/cm2的胶带（3M600号胶纸或等同）牢牢粘住被测试小网格，并用橡皮擦用力擦拭胶带，以加大胶带与被测区域的接触面积及力度；用手抓住胶带一端，在垂直方向（90°）迅速扯下胶纸，同一位置进行2次相同测试；
结果判定：要求附着力≥4B时为合格。
5B－划线边缘光滑，在划线的边缘及交叉点处均无油漆脱落；
4B－在划线的交叉点处有小片的油漆脱落，且脱落总面积小于5％；
3B－在划线的边缘及交叉点处有小片的油漆脱落，且脱落总面积在5％～15％之间；
2B－在划线的边缘及交叉点处有成片的油漆脱落，且脱落总面积在15％～35％之间；
1B－在划线的边缘及交叉点处有成片的油漆脱落，且脱落总面积在35％～65％之间；
0B－在划线的边缘及交叉点处有成片的油漆脱落，且脱落总面积大于65％。
15.耐磨性测试
用专用的日本砂质橡皮(橡皮型号：LER902K)，施加500g的载荷，以40～60次/分钟的速度，以20mm左右的行程，在样本表面来回磨擦300个循环。
结果判定：测试完成后以油漆不透底时为合格。
注:如果采用的是UV漆，用方法一测试要求达300个循环，用方法二测试要求达500个循环。
16.耐醇性测试
用纯棉布蘸满无水酒精（浓度≥99.5％），包在专用的500g砝码头上（包上棉布后测试头的面积约为1cm2），以40～60次/分钟的速度 ,20 mm左右的行程, 在样本表面来回擦拭200个循环。
结果判定: 测试完成后以油漆不透底时为合格。
17.硬度测试
用2H铅笔（三菱牌），将笔芯削成圆柱形并在400目砂纸上磨平后，装在专用的铅笔硬度测试仪上( 施加在笔尖上的载荷为1Kg，铅笔与水平面的夹角为45°)，推动铅笔向前滑动约5mm长，共划5条，再用橡皮擦将铅笔痕擦拭干净。
结果判定：检查产品表面有无划痕，当有1条以下时为合格。
注：如果采用的是UV漆，硬度要求达3H以上。
18.耐化妆品测试
先用棉布将产品表面擦拭干净，将凡士林护手霜（或SPF8的防晒霜）涂在产品表面上后，将产品放在恒温箱内（温度设定在60℃±2℃,湿度设定在为90%±2%）, 保持48h 后将产品取出，用棉布将化妆品擦拭干净。检查产品外观，并测试油漆的附着力、耐磨性。
结果判定：产品表面无异常, 附着力和耐磨性测试合格。
19.耐手汗测试
将汗液浸泡后的无纺布贴在产品表面上并用塑料袋密封好，在常温环境下放置48h后，将产品表面的汗液擦拭干净，检查油漆的外观，并测试油漆的附着力、耐磨性。
结果判定：产品表面无异常，附着力和耐磨性测试合格。
注：汗液的成份为氨水 1.07% ，氯化钠0.48%，水98.45%。
20.温度冲击测试
将样品放入温度冲击测试箱中；先在-40℃±2℃的低温环境下保持1h ，在1min内将温度切换到+85℃±2℃的高温环境下并保持1h ，共做24个循环（48 h）。测试完成后，检查产品的外观，并测试油漆的附着力、耐磨性。
结果判定：产品表面无异常，附着力和耐磨性测试合格。
补：三类测试的差别
可靠性试验则是提高产品可靠性的重要工作项目和手段，典型的可靠性试验有三类：A.可靠性增长试验； B.可靠性鉴定试验； C.例行试验。三类主要差别如下：

可靠性增长试验可靠性鉴定试验例行试验
试验目的在研制过程中模拟实际的或加速的使用条件进行试验，使产品存在的设计（包括电路设计、结构设计和工艺设计）缺陷变为硬故障而充分暴露，对故障进行分析、采取纠正措施，根除故障产生的原因或降低故障率到可以接受的值，使产品的固有可靠性得到增长验证产品的设计能否在规定的环境条件下满足规定的性能及可靠性要求。试验结果作为判断设备能否定型的依据。适用于设计定型的鉴定对产品各项指标进行全面检验，以评定产品质量和可靠性是否全部符合标准和达到设计要求。对于批量生产的产品检验其质量稳定性和一致性。适用于生产定型、批量生产后的一定周期和在产品设计、工艺、材料有较大变动后的检验。
试验条件①电应力根据输入交流电源电压和输入直流电源电压的允许变化范围，部分时间在设计的标称输入电压下工作，部分时间在最高输入电压下工作，部分时间在最低输入电压下工作。例如：程控用户交换机应在AC220V，DC-48V、DC-40V～-57V范围内正常完成接续同可靠性增长试验除电源电压拉偏试验外，在标称输入电压下工作。电源拉偏试验根据不同的产品参考有关标准在最高、最低电压下工作
试验条件②热应力所施加的应力强度可略高于使用时的应力强度，以不引起新的故障机理为限。如温度循环一般可以将略高于产品高温温度、略低于产品低温温度作为温度循环的上、下限温度，温度变化率可取5℃/min或10℃/min。循环周期时间根据温度变化率而定将产品工作高温温度作为试验温度按产品标准的工作高、低温温度进行各种功能和指标的检验。
按产品标准的储运高、低温温度进行储运试验。

③工作模式试验条件模拟在规定条件下的各种工作模式。工作模式指的是：连续工作，断续工作，高温启动，低温启动，全负荷工作，轻负荷工作等模拟在规定条件下满足全面检测受试产品的功能、性能参数和指标的工作模式同可靠性鉴定试验
④检测参数试验条件在试验前、后及过程中某些规定控制点应检测受试产品的性能参数。可以检测产品标准中规定的所有参数，也可以只检测某些主要参数在试验过程中全面检测受试产品的功能、性能参数和指标在试验过程中或试验后检测受试产品的规定功能、性能参数和指标
⑤试验时间一般为试验产品的 MTBF（θ1最低可接受值）的几倍。
试验时间=每个产品实际试验时间×试验产品数加速系数τ 根据统计试验方案确定按各种试验项目的相应标准规定进行。例如：高温、高温储存、低温、低温储存保持时间2小时，恒定湿热保持48小时等；
⑥试验产品数试验条件至少2个产品（如果可能）为了缩短产品实际试验时间，只要试验装置允许，应尽可能增加试验产品数量，一般至少要2个根据GB2829周期检查计数抽样程序及抽样表（适用于生产过程稳定性的检查）和试验装置的具体情况决定试验产品数量
试验方案或试验项目可靠性增长方案：可靠性增长应有增长目标值（θ0可接受质量水平），必须要有可靠性增长模型。典型的可靠性增长模型有Duane模型和Amsaa模型。在试验达到终点应该达到或超过规定的可靠性指标见下（一）例行试验包括如下试验项目：
① 高温试验
② 低温试验
③ 恒定湿热试验
④ 运输（振动）；
试验合格性在规范化的试验设备中，当试验结果达到规定的可靠性指标，认为合格。若增长试验结束时未达到规定的可靠性指标，则作为不合格处理按选择的统计试验方案规定的接收或拒收判据作为产品是否合格的依据抽样方案在GB 2829 选择。产品质量以不合格数表示。产品质量等级的最终判定按检测项目所达到的最低质量等级确定。（即B类不合格数达到的质量等级和C类不合格数达到的质量等级两者中取较低者）
失效判据见下（二）同可靠性增长试验
对受试产品进行试验和检查，根据每一项试验的结果和检查结果确定是否有B类不合格或C类不合格，分别累计所有试验和检查的B类不合格和C类不合格即为受试产品的B类不合格数和C类不合格数
（一）：可靠性鉴定试验
① 试验方案的种类有两种：
a 定时截尾试验方案
根据已知的0（可接受质量水平），1（最低可接受值），（生产方风险），（使用方风险）（或鉴别比d），查表可得具体的试验方案，包括：需要的试验时间（以1为单位）、接收判决数和拒收判决数。试验时间=受试产品累计试验时间之和×加速系数τ。采用这种试验方案时，试验到需要的试验时间，按规定的试验方案做出接收或拒收判决。或者若试验虽未达到规定的试验时间，但失效数已大于或等于标准中规定的拒收判决数时，亦可停止试验。
b 截尾序贯试验方案
根据已知的0，1，鉴别比d，查表可得具体的试验方案，再根据已进行的累计试验时间和累计失效数确定是接收、拒收还是继续试验。
② 试验方案的选择
a 当需要预先知道准确的总试验时间和试验费用时，选用定时截尾试验方案。
b 对于质量较好或质量较差的产品时，选用截尾序贯试验方案。
c 如果需要短时间内做出判断，并且可承担较高的风险时，选用高风险试验方案（==30%）。
③ 用试验观察数据估计平均故障间隔时间MTBF
a 区间估计的置信度：选取1-2β作为双边置信区间的置信度，选取1-β作为单边置信区间的置信度。
b 采用定时截尾方案接收时对MTBF的估计：MTBF的观测值θ=试验时间/失效数
根据总失效数及规定的置信度，查表读出下限因子和上限因子，用下限因子和上限因子分别乘观测值θ，得MTBF的下限值θL和上限值θU。非定时截尾接收方案，MTBF的观测值同上式，上、下限因子查有关国/军标。
（二）：可靠性增长试验
① 在产品标准中应该对每个被测参数规定可接收的性能范围。若任一参数超出这种范围时，应称作一次失效。如果不只是一个参数偏离了规定范围，而且能证明不是同一原因使这些参数超出规定范围时，每一种参数的偏离都应算作产品的一次失效。如果参数偏离规定范围是同一原因造成的，只记作产品的一次失效。
② 出现两种或多种独立失效的情况下，每一种失效情况都应认作受试产品的一次失效。
③ 由于元器件时好时坏，或因虚焊、漏焊、短路、开路、接触不良等造成的产品故障，均记入失效数内。
④ 产品在一个有限时间内停止工作，接着又在没有任何外界激励的情况下恢复工作，这叫间歇失效，应记作受试产品的一次失效。
⑤ 已经证实是未按规定的条件使用所引起的故障、仅属某项将不采用的设计所引起的故障、以及外加应力超过规定值所引起的故障叫“非关联故障”，否则叫“关联故障”， “非关联故障”不记入受试产品失效数内。但应记录并采取措施以防止再度发生。
⑥ 由于另一个组成部分失效而引起的失效，称作从属失效，不记入产品失效数内。
经过各种测试，若发现产品失效，就应该采取相应的措施，有些时候只需要更换一个器件即可，有些时候只需要调整一个器件的输出即可，但有些时候却要更改设计才能避免一个缺陷。当增加一个器件受到成本和产品大小的限制时，也会考虑到更改设计（如当某一器件发热导致产品时，可以增加一个风扇，当产品内部空间不允许这样做时，就要考虑更改设计了）；
下一节将介绍，在设计时常用的方法，以增强产品性能、增长产品可靠性。

第三节可靠性增长
假设对某一产品/系统要求的可靠性为：MTBF大于2000H，那么在对此系统立项时，MTBF应该设立怎么样的目标值？如何达到这一目标值，这就关系到可靠性预计和分配。
开展可靠性预计和分配工作，是确保设计、生产“好”产品的指导性和基础性工作。首先将产品可靠性指标自上而下逐级地分配到产品的各个层次，借此落实相应层次的可靠性要求，并使整个与各部分之间的可靠性相互协调。尽量做到既避免出现薄弱环节又避免局部“质量过剩”而带来浪费。可靠性预计则是自下到上地预计产品各层次的可靠性参数，判断各层次设计是否满足分配的可靠性指标。只有各层次的可靠性分别达到分配的要求，才能保证产品可靠性指标得以实现。对未达到分配指标要求的设计，则能发现其可靠性薄弱环节、设计上的隐患及提供选择纠正措施的指南，并依此改进设计直到满足指标要求为止。在产品设计阶段就应该“设计进”规定的可靠性指标，也就是必须通过开展可靠性预计和分配工作尽早来落实产品的可靠性指标，而不是靠产品既成之后的抽样统计试验结果。
一、MTBF的设计目标值
为了使产品满足使用要求，也就是为了使产品的MTBF达到一定的最基本的要求，我们应该在从设计阶段就开始考虑这个要求；很显然，如果要求产品在使用时MTBF为200H，那产品在设计的MTBF就应该比200H大，才有把握保证产品的MTBF满足这一要求。使用时MTBF与设计时MTBF一般情况下满足如下关系：

可靠性定量指标MTBF（θ）有诸多参数，它们之间关系上图所示。
θT（MFHBF）——门限值。根据用户需求或使用要求而定；
θMAV——最低可接收值，一般θMAV/θT=1.25，它是考核指标；
θ1——MTBF检验下限值，在统计测试方案中，当产品MTBF真值接近或等于θ1时，以高概率拒收该产品，一般θ1/θMAV =1.25。
θ0——MTBF检验上限值，在统计测试方案中，当产品MTBF真值接近或等于θ1时，以高概率接收该产品，一般θ0/θ1 =D0；
按GJB 899测试方案Ⅲ，α=β=0.1，D0=D=2；
θp——MTBF设计值，又称规模值，是《研制任务书》中规定和期望达到的指标；按GJB299预计θp/θo=1.25。
所以θp/θT＝3.9；也就是说，设计目标值最小应该在实现使用要求值的4倍；一般情况下设计值为实现使用要求值的5~10倍。
二、可靠性模型
为了定量分配、估计和评价产品的可靠性，建立产品的可靠性模型是一种直观的、有效的方法。可靠性模型包括可靠性方框图和可靠性数学模型。产品典型的可靠性模型有串联模型和并联模型，还有些复杂的模型等等。例如（本例中各参数的意义、各参数与其它可靠性参数之间的关系，随后有详述）：
（1）m个单一系统串联（只要有一个单元失效，整个系统就失效）

（2）m个单一系统并联（只要有一个单元能工作，整个系统就能工作）：

（3）三个混合联结：

（4）复杂可靠性模型的建立
对于复杂结构模型,如果是简单的串并或并串的混联结构,其建模和数学模型的计算较简单。对很难转换为简单的串并结构模型的分析需采用其他方法,常用的有布尔真值法、概率展开分析法、贝叶斯法等；这里不作叙述。
注：产品的可靠性框图表示产品中各单元之间的功能逻辑关系，产品原理图表示产品各单元的物理关系，两者不能混淆如，某振荡器由电感和电容器组成，从原理图（图A）上看两者是并联关系，但从可靠性关系上看，两者只要其中一个发生故障，振荡器都不能工作，因此是串联模型（图B）。

三、可靠性分配
在产品的设计阶段，就要把要求的MTBF“设计进”产品里。当产品的结构复杂时，将可靠性指标自上而下逐级地分配到各个简单的结构。它是一个由整体到局部，由上到下的分解过程，这个过程就叫做可靠性分配。可靠性分配有许多方法，如等分配法、评分分配法、比例组合法、动态规划法等。
1、等分配法
顾名思义，等分就是将失效率分配到各个部件时，是均分的。如一个有两个模块的系统要求MTBF为500H，则分配到每个模块的MTBF都为1000H。
2、评分分配法
在产品的可靠性数据缺乏的情况下，可以请熟悉产品、有工程实际经验的专家，按照影响产品可靠性的几种主要因素（如：复杂度、技术成熟度、重要度及环境条件）进行评分（每一种因素的分值在1~10之间，难度越高评分越高），然后根据评分的结果给各分系统或部件分配可靠性指标。例如某个系统（要求的MTBF为500h）由A/B/C/D四个部件组成，各部件评分如下表：

部件复杂度技术成熟度重要度环境条件各部件评分各部件评分系数Ci 分配给各部件的故障率分配给各部件的MTBF
A 8 9 6 8 3456 0.462279 0.00092456 1081.597
B 5 7 6 8 1680 0.224719 0.00044944 2225
C 5 6 6 5 900 0.120385 0.00024077 4153.333
D 6 6 8 5 1440 0.192616 0.00038523 2595.833
合计 7476 1 0.002 500
说明:（1）对四个部件（A/B/C/D）按四种因素评分后，填入上表；
（2）对A部份而言，最后评分为8*9*6*8＝3456；B的评分为5*7*6*8＝1680；同理C的评分为900、D的评分为1440；最后四部分总分为：7476；
（3）对A部份而言，评分系数为3456/7476＝0.46；B的评分系数为1680/7476＝0.22；C的评分系数为0.12；D的评分系数为0.19；
（4）对整个系统而言，失效率为1/500＝0.002；
所以分配给A的失效率为：0.46*0.002＝0.0009，对应的MTBF为1081.6H；
同理得B/C/D的失效率和MTBF。
3、比例组合法
只是在一些资料上看到说有这项内容，但是我也没有听说过，也没有查到，所以………………55555555……
四、可靠性预计
为了达到分配的目标值，首先要知道的是将要设计的系统的可靠度可以达到什么水平。如果系统可以达到的MTBF远大于设计目标，就可以进行研发；如果小于设计目标值，就必须重新设计。那么如何确定将要设计的系统的MTBF值？在产品研发早期阶段各种信息还不足，无法计算，仅能用概略预计法进行可靠性指标预计；
现推荐一种简便、准确、实用方法，即《简单枚举不完全归纳快速预计法》，简称CW可靠性指标预计法。CW法预计公式：

λS——系统失效率
λ0——电子元器件平均基本失效率，对于国产器件λ0=10-5-10-6（1/h）、对于进口器件λ0=10-7-10-8（1/h）；
K1——降额设计*效果因子，根据降额设计水平不一样，一般取K1=（10--1）×10-2；考虑到产品的体积、重量与成本，一般取K1=10-1；
K2——环境应力筛选效果因子、产品经过环境应力筛选测试，可靠性将有一定幅度提高，一般K1=0.5--0.1。
K3——环境影响因子。产品使用于不同环境其取值也不同，K3取值见下表：
使用环境 K3 推荐值
测试室内 0.5--1 1
普通室内 1.1--10 5
陆用（固定） 5--10 8
车载 13--30 20
舰船载 10--22 15
机载 40--80 50
K4——机械结构影响因子。在使用中，机械结构件也会产生故障。一般取值K4=1.5--3.5；
K5——制造工艺影响因子。产品在制造过程中，制造工艺不良也会影响产品可靠性；一般取值K5=1.5--3.5；
N——系统所含电子元器件数量；
MTBFS——系统平均故障间隔时间；
用CW法预计可靠性指标，只需要知道设计中所以用到的电子元器件的个数、电子元器件的产地、系统将要使用的环境（就可以估计出系统的λS，从而得到MTBF）；
*降额设计是一种为了提升产品可靠性而常用的设计方法，此部分内容随后给出说明。这里先给出一个CW法预计实例（例一）：
某陆用移动产品，该产品含有进口电子元器件约为2000个，其固有可靠性指标为：
λS=λ0?K 1?K 2?K3?K4?K 5?N
=10-7×10-1×0.5×5×1.5×2×2000
=15×10-5/h

在使用过程中，要求MTBF为200H，则设计目标值为800H，6667>800，也就不需要改动了。但用户要求MTBF为2000H（则设计目标值为8000H），对于一个MTBF为6667H的系统（此时的可靠性称为系统的基本可靠性），为了达到MTBF为8000H的要求，就必须提升系统完成任务的能力（也就是提升系统的任务可靠性）。这种使产品的可靠性获得提高的过程称为可靠性增长。
五、可靠性设计方法
1、降额设计；
降额设计，为了提升电子设备的可靠性而常用，主要是指构成电子设备的元器件使用中所承受的应力（电应力和温度应力）低于元器件本身的额定值，以达到延缓其参数退化，增加工作寿命，提高使用可靠性的目的。
施加在电子元器件上的电应力、热应力大小直接影响电子元器件的失效率高低。如锗NPN晶体管基本失效率与电应力及热应力关系，如果温度不变（0℃），而从满负荷使用降至额定负荷的0.1使用，则基本失效率降低了6倍；如果电应力不变（额定负荷的0.1）而温度从90℃降至0℃，则基本失效率降低了16倍；如果负荷及温度都降低，电应力从额定值0.6降至0.1，而温度从55℃降至0℃，则基本失效率降低到原来的1/20。
在降额设计中，“降”得越多，要选用的元器件在性能就应该越好，成本也就越高，所以在降额设计过程中，要综合考虑。电子产品发展到今天，人们已经总结出“降额”的通用准则。但并不所有的电子产品都可以“降额”，在实现设计过程时，应该注意：
A、不应将标准所推荐的降额量值绝对化，应该根据产品的特殊性适当调整；
B、应注意到，有些元器件参数不能降额；
C、一般说来，对于电子元器件，其应用应力越降低越能提高其使用可靠性，但却不尽然。如聚苯乙烯电容器，降额太大易产生低电平失效；
D、为了降低元器件的失效率，提高设备可靠性而大幅值降低其应用应力，按其功能往往需要增加元器件数量和接点，反而降低了设备可靠性；
E、对器件进行降额应用时，不能将所承受的各种应力孤立看待，应进行综合权衡；
F、不能用降额补偿的方法解决低质量元器件的使用问题，低质量产品要慎重使用；
2、冗余设计
一个系统的可靠度为MTBF＝6667H，达不到设计目标值MTBF＝8000H；如果把两个这样的系统“并联”起来，结果将会怎么样呢？

分析：
一个系统的可靠度MTBF＝6667H，对应的失效密度为λ1，可靠度为R1，失效率为F1；并联后的系统对应的失效密度为λs，可靠度为Rs，失效率为Fs；则：
Fs＝F1×F1，
F1＝1－e-?1t
Fs＝1－e-?st
λ1 ＝1/MTBF
MTBFs＝1/λs
近似计算后得：MTBFs＝1.5×MTBF＝10000（h），也就满足了设计目标值；
这就是一个简单的冗余设计例子；
冗余设计过程中，必定会增加整个系统的体积、成本等；在整个设计过程中也要综合考虑。在进行冗余设计时，一般情况下应注意：
A. 在设计时应在可靠性、体积、重量及成本四者之间进行权衡优化设计；
B. 在设计时，不是构成系统所有的单元都需要进行冗余设计，应选取那些可靠性薄弱环节和对执行任务及安全性影响至关重要单元进行冗余设计。
C. 为了提高系统的任务可靠性，如果提高单元的元器件可靠性可以与进行冗余设计有相同可靠性水平；同时，提高单元的元器件水平较易且成本不高，那就采取提高单元的元器件可靠性水平，即选用高可靠元器件，尤其对长期工作的通讯产品尤为重要，往往在较长工作时间更显现出选用高可靠元器件的优越性；
从上面的冗余设计中，可以看出两个单元结构是并联的。除并联处还有很多其它的结构/模型，这里不作多述。
3、热设计
对电子产品而言，一方面当温度升高时失效率成指数形式增加、一方面是有些电子只能在某一温度下使用，为了提升产品的可靠性，工作过程中，让系统稳定在一个合适的温度是非常必要的；这样，在设计的最初就应该考虑到热量的产生与发散的问题，这部份工作就是热设计的主要内容；
3.1 热量的产生
电子设备内部热源主要是一些发热的电子元器件，如电真空器件、半导体器件、集成块以及电阻器、电容器、变压器、流圈等，它们的热能均由电能转换而成；集成电路的热耗一般用Vcc×Icc计算；
高速飞行的导弹以及其它的飞行器，由于空气阻力的作用，在设备的外壳上将产生大量的热量，这些热量将传到装在飞行器内的电子设备中；
为了克服机械运动过程中的摩擦力将损失部分能量，这又是一种热能的转换形式；
新电子设备所使用地点不同和载体用途不同及其在载体上所处位置其环境温度也大不相同。如月球表面在太阳照射情况下可大274℃，而石油厕井仪探头在进入300m井下可达300℃多；
3.2 热传导公式
传热类型数学公式参数说明
传导散热 Q=KA△t/L Q=传导散热量（W）    K=导热系数（W/m ℃）
A－导体横截面积(m2) △t-传热路径两端温差（℃）
L-传热路径长度（m）
自然对流散热 Q=h△t Q=对流散热量（W）    R=换热系数（W/m2℃）
A-有效散热面积(m2) △t-换热表面与流体温差（℃）
辐射换热 Q=εσT4 Q=辐射散热量（W） ε=散热表面辐射率（W/m2℃）
T-绝对温度（K）    σ-斯蒂芬-玻尔兹曼常数(W/m2℃)
半导体器件自然冷却（tj-ta）/ф=Rj+Rb +Rf tj——器件结温       ta——环境温度
Rj——内热阻       Rb——界面热阻
Rf——散热器热阻    ф——器件功能
3.3 热设计常用的技术措施
为了使元件不在过高温度下工作、以避免参数漂移、保持电气性能稳定，为了提升电子设备的可靠性、延长使用寿命，在产品最初设计时，我们就应该考虑到产品的热性能，使整个系统工作在合理的温度范围内。电子设备的冷却方法有多种，可以单独地或由几种冷却方法联合作用（如自然冷却、强迫冷却、蒸发冷却、半导体制冷等方法），将热量从设备中（或元件上）带走，或传到设备外的周围介质中去；
在热设计时，常用的技术措施有：
1. 应最大限度地利用传导、自然对流和辐射等简单、可靠的冷却技术。
2. 应尽可能地缩短传热路径，增大换热（或导热）面积。
3. 元器件安装时，要充分考虑周围元器件辐射换热的影响，热敏器件应远离热源或采取热屏蔽措施。
4. 增加表面黑度，提高辐射换热能力。
5. 对太阳辐射应有相应的防护措施。
6. 对嵌埋状态的热源，须用金属传热器通至冷却装置。
7. 对需散热1K以上的元器件应安装在金属地底盘或传热通道上，并通至散热器。
8. 在需要高传热性能时，可靠考虑采用导热管，导热管散热量可比实心铜导体高数百倍。
9. 如果环氧玻璃树脂印制线路板不足散发所产生的热量，应考虑加设散热网络和金属条散热。
10. 应控制印制板组装件之间的间距，一般可控制在19-21mm之间。
11. 采用强制风冷系统时应保证在箱内有足够的正压强。
12. 进气口和排气口之间应有足够距离，要避免热风回流。
13. 进入的空气与排出的空气之间的温差应小于14℃。
14. 设计时，应注意强迫通风与自然通风的方向尽量一致。
3.4热设计常用流程

4、EMC设计
电磁兼容是研究在有限的空间、时间和频谱资源下，各种设备或系统可以共存而不致引起降级的一门科学。电磁兼容（EMC）包括电磁干扰（EMI）和电磁敏感度（EMS）两个方面。电磁兼容是指设备或系统在其电磁环境中能正常工作且不对该环境中任何事物构成不能承受的电磁骚扰的能力。
要提升这种能力，有许多应用课题要解决，如：电磁波的散射、透射、传输、孔缝耦合，各种干扰源的机理和特性，各种干扰参数的计算和测试，各种结构的屏蔽效果，各种防护方法、测试方法、标准等等。对应设计的方法也有多种，如：防静电设计、防雷设计、防地电位升设计等等；一般从以下方面考虑，以保证产品的EMC特性：
1、静电放电的防护。首先要阻止电流直接进入电子线路，最普通的办法就是建立完善的屏蔽结构（必要时在外壳与电路之间增加第二层屏蔽层），屏蔽层接到电路的公共接地点上。对内部的电路来说，如果需要与金属外壳相连时，必须采用单点接地的方式，防止放电电流流过这个电路，造成伤害。
2、屏蔽。采用屏蔽的目的有两个：一是限制内部的辐射电磁能越过某一区域；二是防止外来的辐射进入某一区域。主要对电场、电磁场、磁场进行屏蔽（现实对磁场的屏蔽更难）。
3、接地。接地的目的一是防电击，一是去除干扰。接地可分为两大类，即安全接地与信号接地。接地时应该注意：接地线愈短愈好、接地面应具有高传导性、切忌双股电缆分开安装、低频宜采用单点接地系统、高频应采用多点接地系统、去除接地环路；
4、滤波。实际工作中，无法完全做好接地与屏蔽的工作。因此，会采用滤波（将不需要的信号去除）的方式来弥补不足，主要通过滤波电路来实现。在实际使用中，由于设备所产生的杂讯中共模和差模的成分不一样，所采用的滤波电路也有变化，可适当增加或减少滤波元件。具体电路的调整一般要经过EMI测试后才能有满意的结果。
5、三次设计
三次设计也称田口方法，是田口玄一（日本）创立的优化设计的方法。他认为，设计可以分三个阶段进行：系统设计（提出初始设计方案）、参数设计（寻求参数的最佳搭配，提高产品性能的稳定性）、容差设计（对关键件以合适的公差范围）。三次设计的目的是用廉价元器件做成质量上乘、性能稳定可靠的产品。
在三次设计中，参数设计是最重要的，是三次设计的核心。通过参数设计，即使采用参数波动大的元器件，产品的整机性能仍十分稳定。如何达到此目的？首先使系统达到最大的信噪比（即保证系统在各种干扰的影响下是最稳定的），而不是保证目标输出值；接着再把系统的输出特性值调整到目标值（这样可以大大地提高产品的稳定性）。这个过程其实质在于非线性效应的利用。
在一个非线性系统/器件中：
1、器件的输入X与输出Y的一般波形如下图；
2、我们期望的目标输出值在A点；
3、在A点附近，如果输入的变化量?x，对应的输出变化量?y将很大；
4、所以在参数设计时，找到此器件最稳定的输出点：B点；
5、在B点附近，如果输入的变化量?x，对应的输出变化量?Y将很小；
6、针对Ｂ点的输出，我们采用一个线性器件把输出值调整到对应Ａ点的值即可。

本节对可靠性设计中常用的方法，作了简短的描述。希望起到抛砖引玉的作用，在设计阶段将产品的可靠性定位、实现在较高的水平。

第四节可靠性保证
研发阶段，产品可以达到较高的可靠性要求，这只是第一步，只说明产品内在可靠性能达到要求（下文简称“设计可靠性”）；但在生产制造过程中，若无适当的质量控制或可靠性措施，就会引起可靠性退化现象；批量生产的产品的可靠性，下文简称“生产可靠性”。实际上，在绝大部分企业内，生产可靠性都会比研发可靠性差。另外，大家都知道，虽然产品在工厂进行了各种测试，但由于测试设备和运行操作都比较正确，在这种情况下往往处于较好的磨合状态，问题尚不能及时暴露；而实际使用中运行条件（如野外的风沙，海上的风浪等）和使用人员的文化素质以及操作水平往往不够规范，在使用中失效的发生频率要高得多。因此，从整个系统上来保证可靠性得以“延续”是必要的。
一、文件的控制
文件控制的基本要求：保证所有使用的文件都是有效文件。
文件是知识的表现形式（如培训资料等）、是指导作业的基础（如操作指导文件等）、是衡量产品质量的标准（如检验规范等）、是处理异常事情的依据（如合同等），是一个公司必不可少的东西，而公司也应该确保文件的正确性和充分性。对文件的控制，包括对客户资料的控制、各种标准的控制、公司内部四级文件（质量手册、程序文件、操作指导、作业记录）的控制，一般由文控中心（或资料室）来完成文件的控制。
为方便控制，所有要求控制的文件都应该有编号、版本号；文控中心通过对每一次发放做记录来完成新文件的发放、新旧文件的更换，保证使用者手上只有一个最新版本。为方便查找，文控中心可以通过一些Excel表格、Access数据库来管理文件；
怎么与ISO9000如此相似？其实也就我从ISO9000上摘录下来的。
二、原材料和供应商的控制
原材料和供应商控制的基本要求：保证每个原材料满足技术图纸要求。
对原材料，通过检验来控制质量。对原材料分为两类检验：一是性能方面的常规检验，针对每批进货检验，采用两方都同意的AQL依GB2828抽样、检验；二是可靠性方面的例行测试，在一段时间（一个月、或一个季度）内进行一次测试，采用两方都同意的RQL依GB2829抽样、检验。对检验结果的记录、统计和分析，也直接影响到采购量的多少，以及是否有必要更换供应商等等。一般要求，每种原材料至少有两家供应商。
对供应商，主要能过产品质量、交货期、服务等方面考查，并给予适当的评价，必要时到供应商生产地点做现场审查；以确认供应商能及时地提供性能稳定的产品。　　
三、生产过程和异常改善的控制
生产过程控制的基本要求：制作流程中的每个工艺都满足相应的规范要求；
对生产过程而言，要求每次投入生产的物料都是合格物料并有明确的标识，每个工艺中用到的设备在有效校验期内、设备的参数设定正确，每个工位的操作过程与操作指导完全一致，每个工艺的输出满足标准要求，每个操作指导是最新有效版本等等。对生产过程中可靠性出现的异常，应该有记载，找出原因、分析改善、防止再发，并按改善后的内容，写入标准，指导今后作业。生产制作的控制主要考虑以下几个方面。
3.1 生产工艺过程的可靠性控制
一般说来，生产工艺由生产制造加工方法、设备、工序、作业标准（规程）、检测方法等要素构成。同一种产品往往可采用各种不同的工艺制造；相同的工艺，如果构成要素的参数表述不同，对产品可靠性影响的作用也会有所不同。生产工艺对可靠性指标的作用与影响如下图所示：

显然，优良的工艺方法是生产过程中可靠性增长的保证。众所周知，产品在生产过程中又常会有许多随机事件发生，同时产品在使用过程中也存在很多随机事件直接影响产品的可靠性，这就使定量表示生产工艺对可靠性指标的影响有相当困难，但我们可以把工艺引起的故障原因分析归类（见下图）。

由工艺引起的故障原因除了1.1产品参数标准与1.3检验测试标准外，其余的都会导致生产过程中可靠性的退化。因此，在生产工艺方面实行可靠性控制，有两大任务。
①通过完善工艺结构，改进工艺方法，制定与实施作业标准等措施，保障生产过程中减少乃至消除可靠性退化。
②通过工艺方面的可靠性分析、评审，找出影响可靠性的各种隐患，反馈给设计部门更正，改进设计质量，以提高产品的内在可靠性。
3.2 设备的工艺可靠性控制
设备的工艺可靠性是指在规定范围和时间内，设备保持满足工艺过程中与其有关的质量指标数值的性质。它是引起产品可靠性退化的重要因素。
依据设备在生产工艺过程中接受的任务不同，一般分为生产设备、检测设备和运输设备等，可靠性控制内容与要求主要有：
1．生产设备的工艺可靠性控制
生产设备的工艺可靠性与其本身的完善程度、自动化水平、工作原理与控制方式等情况有密切联系。
用来减轻工人劳动强度或弥补人类工作能力的生产设备，因其使用效果取决于工人的技术熟练程度（如手工操作的电焊机），则其工艺可靠性控制要由操作工人素质（如技术水平、工作责任心等）来保证。为此，要重视和强化生产操作工人的质量意识教育和业务技能培训，制订与坚决实施先进合理的作业标准，通过人的控制，完成工艺任务的设备装置工艺可靠性。因加工结果与设备装置的调整及工艺参数密切相关，故应明确规定需控制的工艺参数值，严密监控工艺流程或工序，以保证工艺参数值稳定，从而保证这些设备装置的工艺可靠性。
用于自动控制的生产设备，则应重视和保证传感器、计算机程序等硬、软件的可靠性，以保证设备的工艺可靠性。
2．检测设备的工艺可靠性控制
检测设备用于测量生产过程中工艺参数（此部份测试直接影响工艺过程的可靠性）或检验成品/半成品的质量状况（此部份虽本身不直接影响工艺过程的可靠性，但检测不正确既会影响对上道工序工艺可靠性做出正确评估，又影响下道工序的工艺可靠性）。因此，必须按ISO10012《计测设备的质量保证要求》配备齐全，检定合格，严格管理。如检测设备精度一定要满足工艺参数测量要求，并与其相匹配，量值传递和溯源要保证计量准确、量值可靠；没有通过ISO标准，也应该有足够的证据说明设备能满足生产需要。
3．运站设备的工艺可靠性检测
生产过程中，免不了产品、半成品或零部件的搬运、包装、保管和运输等工序，也就必然要使用一些传递、运输方面设备。这就要注意和防止振动、冲击、压力及环境等因素对产品可靠性的影响，并加以严格控制，以防止可靠性退化。
4. 设备使用过程的可靠性控制
绝大多数产品在使用期内的失效率与其使用状况密切相关。产品的可靠性随使用条件、使用时间而变化，如超额使用时，失效率提高，有效使用期缩短。因此，使用过程中的可靠性控制就成为可靠性管理十分重要的环节了。
一般说来，随着使用时间的延长，产品系统在内外各种原因及使用中所产生的各种能量（如：机械能、热能、化学能、电磁能等）的影响下可靠性会降低。不同结构、不同用途的产品系统，其使用周期（从使用至报废为止的整个产品生命周期，包括：工作期、停工期和维修期）也不相同。
我们按产品工作期内特征进行分类，并根据这些特征采取可靠性控制措施，以延长产品保持正常工作能力的时间（详见表6）。          表6：
工作期特征示例产品无故障时间要求可靠性控制措施
修理维护保养
连续不断工作发电站组监控仪表 √ 全部使用工作时间载荷频谱分析技术辅助分析和检测可靠度
周期性工作机床 √ 两次修理之间工作期不知道，我也没有查到
季节性工作农业机械渔业机械 √ 季节工作持续时间不知道，我也没有查到
断续工作汽车视情况而定工作所需时间不知道，我也没有查到
短期性工作火箭弹药 × 储存时间+工作不知道，我也没有查到
3.3 可靠性改进
可靠性改进是生产过程中，提升可靠性的最有利手段，也是唯一可以使生产可靠性高出设计可靠性的方法。通过对工艺、设备的有效控制，可以使生产可靠性无限接近设计可靠性；只有在生产过程中对可靠性的改善，才可以让生产可靠性超过设计可靠性。
依靠产品在可靠性测试时的不良、使用期的实际信息，进一步优化产品系统结构，采用新材料、新技术和新工艺，提高产品所用的各种元器件、零部件质量等级，必要时调整其安全系统和降额系数，以提高产品的可靠性水平，这些活动统称为可靠性改进。它是质量改进的重要组成部分，可以用PDCA循环来处理，也可以用SPC中的二十字真经来指导作业“找出异因、查明真象、改善措施、防止再犯、形成标准”。
四、产品贮存和运输的控制；
产品贮存/运输控制的基本要求：不让产品受到额外的应力；对贮存而言，需要控制温、湿度，防止挤压、倒塌等，必要时防静电；运输过程中要防止受到超标准的振动、碰撞等，必要时控制温度、温度和静电；
五、人员的培训
无论是从那个方面来说，人员的培训都应该做好。按照ISO9000的要求和规定，我们应该把各个岗位的人员培训到最合适的程度。在所有的培训当中，操作工人的培训最容易被忽视，在自动化程度不高的情况下，操作工人的培训恰恰是最重要的。
这一节，概括性较强，主要是其指导思想与ISO9000一致。一个满足ISO9000要求的公司，在这方面也就做得很好。较难的是：每次发现异常后的改善。它需要良好的沟通和浑厚的技术基础，它要求工作人员在工作中不断地积累经验。
第五节可靠性实施
通常状况下，在一个公司里，先进行生产，当生产进行到一定阶段后，才开始考虑质量控制，最后随着时间的推移，产品隐含的问题慢慢暴露出来，才体会到要进行可靠性控制，才考虑到需要一名可靠性工程师。作为一名可靠性工程师，在这种情况下，如何推行可靠性工作？一般情况下，实施可靠性分为：编写计划、可靠性测试、可靠性提升、可靠性保持等四大步；
其实可靠性工作中最主要、最有效、最根本的是上面四大步之外的第五步：可靠性设计；但目前99%以上的公司（除军工企业外）其可靠性设计都只停留在前四步，没有充分的可靠性设计。我们也就不在这里讨论如何实施可靠性设计的问题（各位大虾在今后的工作中，应该把这为主要目标）。
现在，你有幸成为一个公司的可靠性工程师，那么你要做的就是前面四步。
一、制定可靠性工作计划
对大部份公司来说，可靠性工作还只是在起步阶段；相当一部份公司在可靠性方面的工作也很被动，有些在客户要求提供有关可靠性的资料、数据时才开始做可靠性工作，有些甚至是在产品遭到退货后才起步做可靠性工作，或者比如小霸王，即使退货了也不愿意改变自己的僵化的错误思想；很多公司在可靠性方面的工作还是空白。虽然公司领导人开始着手考虑可靠性的问题（不然，他不会招你做可靠性工程师），但是在公司而言，绝大部分人员对可靠性还是陌生的，所以最初的计划阶段就显得尤为重要。
首先，你被公司招聘为可靠性工程师，负责有关的可靠性的工作。
接着，你需要宣传可靠性工作的重要性；可靠性工作不是靠一个人的力量能完成的，要让公司上下每个人员都明白可靠性的重要性、必要性，特别是高层领导的重视。可靠性不够好的产品，依然能用，所以很容易被大部份人忽视。另外可靠性的工作，其效果在半年内很难看出来，没有领导的重视，很难顺利进行下去。你可以在适当的时候用对比性较强的数据（如以前的产品遭客户投诉/返修率，与做过可靠性的产品的客户投诉/返修率）说明可靠性的重要性。
之后，编写可靠性测试计划；在对可靠性的重要性作普及性的介绍后，就可以针对本公司的产品做一些可靠性测试的计划。建议可靠性计划分两部分，第一部分是可靠性测试方案，包括测试流程、取样方法、测试方法、结果判定等具体内容；第二部分是可靠性工作目标，这部分当然是写你希望在工作期间把可靠性工作做在研发阶段，通过可靠性设计来控制公司产品质量、降低产品成本。这一个可以见的成果，计划一定要写，而且还要领导签字。第一部份是让领导知道你能做很多实际的事，第二部份是让领导知道你有大志向。
最后，推广可靠性测试计划；这是较关键的一步，其主要目的做到是让公司员工知道可靠性要测试什么，以便有针对性地提升可靠性；通过推广、讨论，还能使公司员工在更多方面达到一致，减少走弯路的可能性。可以跟生产技术部、研发部讨论可靠性测试工作，可以给市场部、生产、售后等部门开展一些培训的工作，必要时还可以请其它公司“高手”来本公司做一些讲座等等。总之，要让全公司都知道你是可靠性工程师，这样做的好处你很快就能亲身体验到。记住：不要担心你讲的内容太简单（隔业如隔山，即使有个别人对某一点理解比你深，但他知道的也不会比你全面）、不要担心培训时间太短（越短越好，只要长于10分钟即可），不要怕（没有人是完美的，不然你年薪早超过百万美元了），你是被公司领导确认后专门做可靠性的专家。
二、执行可靠性测试
一切准备工作做好后，就开始第二步：测试产品的可靠性。
在开真正测试前，还有一些准备工作，如是否有用于测试的设备等。一般来说，可靠性测试主要分为环境测试和机械测试；做环境测试你至少需要一台“温湿度交变箱”，最好还有一台低温冰箱；做机械测试在执行测试时，你至少应该有“机械振动台”，最好还有一个“机械冲击台”。一般小公司，在实验设备上不会很完善，需要你一手把它建起来（从温湿度箱到振动台、到EMC实验室….）。如果公司里什么设备都没有，那么购买一台温湿度箱是必要的（价格不高，利用率不低），机械振动台可以不买（价格较高，利用率不高；可以出资金去第三方测试）。如果在你来公司之前，公司零零散散地做过有关可靠性的测试，可能有一些人员和设备，那么你在进行可靠性测试时，就应该申请把这部份纳入你的“门”下，命名为“可靠性实验室”或“可靠性测试部”，其实可能只有一台温温度箱、一个作业人员，但没关系，只有“自立门户”才有发展。等有了温湿度箱后，你就可以开始测试了。
基本性能的测试；可靠性测试前，必须对产品的基本性能做出判断。经过性能的测试，可以将产品分为三个档次：一是良品、二是不良品、三是次品（介于良品和不良品之间，在标准左右20%的部分）。良品可以用来做可靠性测试、不良品不可以用来做可靠性测试、次品需要分析（有些是因为制作过程中的缺陷导致－这部分不可用来做可靠性测试、有些只是一些随机现象参数略有偏差－这部分可以用来做可靠性测试）。除了判断是否可以用来测试外，最主要的是还可以用来与可靠性测试后的性能做对比。
可靠性测试；按测试计划，对相应的产品进行振动、高温等测试。每次测试后，需要对产品的基本性能进行测量（有些测试要求在测试过程中进行基本性能的测量）；再进行对比、分析可靠性测试前后基本性能的变化，确定可靠性测试结果。测试时注意：测试过程中，让设备自动记录（最好能打印）测试环境；测试后对样品的测量最好能与样品所属阶段责任人一起。
测试的变动；很多原因，导致你在实际工作过种中需要对某些测试进行相应的变动。如：①去较远的地方进行振动测试，你可以将多种产品的振动测试“集中”到一起；②有人认为测试时间太长（可靠性测试可能会在1000Hrs左右），你应该考虑加速测试（按近似做法：温度很升高10℃，产品的寿命减半；详细做法见下一节）；③如设备同时控制温湿度时在最初的上升阶段可能会超出范围，你可以改成先设定温度再设定湿度；④温度冲击测试可能由一个高温箱、一个低温箱和人工来实现（不用花30万购买温度冲击箱）；⑤当需要在100℃以上时带湿度，你可以用高压锅来实现（要考虑测试的精度）；等等。不管有怎样的变动，你都应该有详细变动记录、测试记录。
三、可靠性增长
你不能只停留在可靠性测试阶段，可靠性工作的精髓在于可靠性设计，只有做好可靠性设计/增长才能节约成本、提升产品质量。可靠性的提升主要集中在研发阶段、定型之前。一旦设计已经定型、或进入量产阶段，再想从设计上改善可靠性，已经是不太可能（浪费太多、成本太高）。而大部分公司都是因产品可靠性差、受到整个市场的要求后（返修成本增加、退货增多）才开始考虑到可靠性的，但此时产品已经投入市场！此时想把这些产品的可靠性提升到一个新的高度已经不可能，你能做的只是看着居高不下的返修率，但你必须做好下一次产品的可靠性。建议最初你把精力放在一个产品上，做好一个产品的可靠性。如何进行可靠性增长？
首先，要掌握的是生产流程、制作工艺，每个流程的操作方法也是应该完全了解的。这一点，无需解释，必须做到。
其实，要学习一定的技术，至少你要掌握该公司产品的工作原理。你虽然不是研发部门，但你要责任研发产品的可靠性，完全不懂相应的技术，工作很难开展。如果是元器件产品，对用到的每种原材料及原材料的特性应该了解；如果是系统类产品，对硬件、软件、结构都