质量、可靠性与耐久性的关系

2019-02-20 09:57:01·  来源:汽车可靠性技术平台  作者:嵇建波  
 
质量(Quality)广义来说,质量是包含可靠性的内容,我们这里指的是狭义的定义。(注:以下定义参考的是美国某权威机构对质量与可靠性的定义)。Quality is conf
质量(Quality)
广义来说,质量是包含可靠性的内容,我们这里指的是狭义的定义。(注:以下定义参考的是美国某权威机构对质量与可靠性的定义)。
Quality is conformance to customer expectations,翻译过来就是:质量是满足客户期望的能力。
 
这个从字面上可能不太好理解,下面我详细解释一下。大家知道,对于任何一个产品的开发,复杂如一辆汽车,简单如一个小杯子,我们都需要去了解客户的需求或者期望。而客户的需求很多时候是非常主观的,比如客户往往会提出“我需要一个很酷的汽车”,或“我需要一个耐热的杯子”等等。但是这些主观的需求,在产品开发过程中很难衡量或测量,这就导致在产品开发过程中我们很难对其进行验证,最终也无法判断我们的产品是否能够满足客户的期望。比较常见的方法是通过QFD(Quality Function Deployment)的方法与流程将客户的主观需求或期望转换到产品可以衡量的指标(一般叫做产品的关键特性),然后在产品开发过程中,我们去设计产品,满足这些可以衡量的指标,从而间接地去满足客户的需求(注:QFD不是本文的重点,所以此处不展开,网上有大量文献读者可自行查阅)。
 
如何判断最终的产品满足了客户的期望呢?一般我们会按照APQP或者ISO的标准来控制产品开发与制造过程,最终实现对客户期望的控制。这个就是传统质量做的事情,即我们常说的质量管理与过程控制,属于质量的范畴。理论上来说,最终出厂的产品质量都是合格的,否则产品是不能上市的。所以质量是关注产品出厂之前与出厂那一刻所有过程控制的活动(t≤0, t指的是产品开发时间节点,t=0指的是产品上市的那一刻)。
 
可靠性(Reliability)
 
Reliability is quality over time这个定义很恰当,意思是可靠性是质量随着时间的变化,或者说可靠性是质量加了一个时间轴。
 
通过质量过程控制(TS16949或ISO9001),满足了客户的期望,制造过程也稳定了,产品可以上市了。但是这个不代表你产品在存储与使用过程中没有问题,从产品投入市场之后(t>0),甚至在交付到客户手里之前,可能就会有失效(比如汽车在运输以及4S店存储时间长了,可能有一些零部件会出现问题)。在产品使用过程中,产品的功能或质量有一个逐步退化的过程,从而会带来产品的失效。
 
如何降低与控制在使用过程中产品失效问题,就是可靠性关注的内容。所以,可靠性是关注产品上市后(t>0)的失效问题。
下表从几个不同方面描述了质量 (Quality)与可靠性 (Reliability)的区别。
耐久性(Durability)
 
耐久性实际上很多企业都在做这方面的工作,如整车耐久性测试,或者疲劳寿命分析等。国内企业很多人提起可靠性,以为就是疲劳分析,这个是很片面的理解或者说概念上就是错误的,因为疲劳分析只能分析理想状态下(某种设计状态下)理论的寿命预测,但是实际上每个零件的制造误差与变化以及使用过程中环境条件的不同,会导致同一批产品每个零部件的使用寿命的不同,如何评价一定置信度下的零部件寿命,才是真正耐久性需要关注的问题。当然疲劳分析也是提高耐久性的一个不可或缺的手段。
 
广义上来说,耐久性是含在可靠性的范畴的,但是从定义与指标以及工作方法上都是不同的。
 
在讲耐久性之前,我们先来看一下如下图所示的典型浴盆曲线。浴盆曲线是了解可靠性工程最基本的曲线,本文简单介绍。
典型大批量产品浴盆曲线
 
上图横轴是产品上市后的运行时间(广义时间,也可以是里程,如整车运行里程),竖轴是产品故障率或叫失效率。对于大批量产品如汽车等,在投放市场后,到产品报废的整个寿命期内,失效率随着运行里程的变化基本上符合如上图所示的那条实线曲线,因为形状像浴盆,在可靠性工程领域一般称之为浴盆曲线(Bathtub curve)。
拿这个曲线来讲可靠性与耐久性就比较好理解。上面讲的可靠性,从指标上来说,实际上是关注的是竖轴,即失效率。耐久性关注的是横轴,即运行时间或里程,对于产品来说,实际上就是能够运行的时间或里程,即我们常说的寿命或耐久性的定义。
 
对于可靠性工程而言,一般我们既需要关注产品的失效率(即可靠性问题),也要关注产品的寿命问题(耐久性问题)。
 
这里还有一个概念要说明一下,就是可维修系统与不可维修系统。对于复杂的系统或者产品,如汽车、飞机或发动机等,在报废之前或者大修之前认为是可以维修的。到了上图所示的最右边的那个虚线点,即一般我们说的寿命点,就认为不可维修了,因为再使用下去,失效率激增,维修成本很高,不存在维修的价值了,到了这个点,产品基本上就报废了或者要大修。而对于单个零件或者某些小的系统单元,如果在使用过程中出现问题不维修,都是替换,我们就认为是不可修系统。不可修系统只讲寿命问题,这个概念需要清楚。
 
衡量指标与控制方法/流程
 
质量(Quality)的衡量指标与控制方法
 
按照上面的传统质量的定义,不是一个单一指标能够用来衡量产品质量的。按照APQP的流程来说,质量的控制与产品开发是同步的,从早期的客户需求管理、到产品目标的定义、设计过程质量控制、制造过程质量控制、再到生产过程问题闭环、售后问题的问题闭环等等,在各个阶段都有相应的要求与过程控制的方法。
下图是质量控制的典型流程与活动。
如果非要量化的话,我个人理解更多是对产品缺陷(Defect)的控制,如常见的PPM(PartsPerMillion)(如10PPM代表不合格率为100/100万(万分之一),我们常说的6Sigma水平指的是3.4个PPM)。对于制造过程,一般会用一些过程控制的稳定性与一致性指标,如CPk(Complex Process Capability index)来控制制成品不良率水平)或GR&R(Gauge Repeatability&Reproducibility)来控制量具的稳定性。
 
质量过程控制方法一般通过APQP的流程来控制。关于APQP与质量体系的控制流程,这个比较成熟,在此不再赘述。
 
同时,很多企业通过6Sigma流程来控制,如DFSS(DesignForSixSigma)与DMAIC(Define-Measure-Analysis-Improve-Control),最终实现的都是对缺陷的控制,确保最终出厂的产品满足一定的质量要求或水平,最终满足产品规格与客户的需求。
 
可靠性(Reliability)的衡量指标与控制方法
 
刚才讲到,质量关注缺陷,那么可靠性则是关注可维修系统的失效(或者故障)。一般在汽车行业用失效率(为了便于统计,汽车行业很多用失效数如F/U(单机失效数)、IPTV(Incidents Per Thousand Vehicles即千台失效),3MIS (Month inService)或12MIS等)来衡量。
 
对一个产品来说,我们需要一个好的可靠性设计,保持失效率在比较低的水平,即上述的浴盆曲线相对竖轴的指标比较低(但也不是越低越好,因为失效率到了一定程度,再要降低,可能带来成本的激增。所以可靠性的目标需要在开发周期与成本之间进行平衡)。但是很多企业如整车企业,可能无法获得过保之后的数据,所以我们一般关注三包期内的失效率情况,或者用三包期内的数据通过统计分析来评价失效率水平,即产品的可靠性水平。
 
当然,这里面还有一个概念叫使用率,下面我们用汽车为例来解释一下。简单来说,就是一个批次的汽车在特定使用情况下(如家用或出租)年平均使用里程。很多企业只用失效率来衡量汽车的可靠性,这在同样的使用率情况下是可以的,但是如果汽车年均使用里程不同,就不能只通过失效率来衡量,因为理论上来说,使用越多,失效数也会越高。这个也比较好理解,下面我们举个例子来说明一下。如我们比较两个车的可靠性水平,A车用于家用,一年平均使用里程2万公里,失效数(实际应用中我们一般用失效数而不是失效率,以便于统计,以下同)均值为1.5个/台。B车用于出租车,一年平均里程10万公里,失效数均值为3个/台,如果只比较失效,B的可靠性不如A,因为一年下来,B的失效为3个/台,比A的失效高。但是如果我们考虑了使用里程,就会发现A车运行了2两万公里就有1.5个失效,而B车运行了10万公里有2个失效,显而易见,B的可靠性比A要好。这里就需要引入另外一个概念,MTBF(Mean Time Between Failure)或MKBF (Mean KilometerBetween Failure),即平均失效间隔时间/里程,这个理论上的定义是使用率/失效率,可以衡量产品的绝对可靠性。一般来说,同类产品,MKBF越高,说明可靠性水平越好。这个也是可靠性常用的指标。
 
那么产品的可靠性如何来控制呢?经过国外多年的发展,已经形成了一套比较完善的控制流程,这个可能每个企业叫法不太一样,如可靠性增长流程(RGP-Reliability Growth Process,或可靠性设计流程(DFR-Design For Reliability)。
 
简单来说,传统的汽车开发对于产品的失效控制是比较被动的,往往都是在产品试验出了故障,或者在使用过程中出了故障再去改进。如果等产品出现了故障再去解决,需要花费大量的人力、物力与时间。可靠性增长实际上是一种预防性的手段,即如何通过合理地设定产品可靠性目标,在产品开发的规划阶段制定合理的预防性措施,并在产品设计阶段就能够识别可能存在的失效风险,并通过有效的预防性措施来尽可能控制失效,减少产品在试验与试用过程中的失效。另外既然我们定义了可靠性的衡量指标,就需要在产品的可靠性设计与验证过程中来量化追踪指标,否则指标的确定就是一个噱头而已!大家都知道,产品的性能是比较容易追踪的,传统的仿真手段与试验手段可以分析与测量各种不同的整车性能,如动力性、经济性、安全性、各种力学性能如刚度、模态、动力学、NVH等等,但是失效率一般来说很难通过仿真手段模拟出来,一般通过统计或者寿命预计等方法来进行计算在一定置信度下的概率水平。所以完善的可靠性增长的流程除了提供了一套完整的控制流程之外,一般还提供了对于可靠性指标在设计与试验过程中量化追踪的方法,使得在产品开发的各个阶段能够实时地知道产品的可靠性达到什么水平!
下图展示了一个典型的可靠性设计流程实例以及相关技术。
在国内尤其是汽车行业,目前大多数企业还没有形成自己完整的可靠性流程。很多企业其实也在产品开发的一些环节局部开展了一些工作,如FMEA (Failure Mode and Effect Analysis)、可靠性试验验证等,但是没有通过一套有效地可靠性流程将相关的工作串起来,不清楚各个工作之间的关联,另外也缺乏有效的手段在产品开发过程中追踪可靠性水平,逐步提高产品可靠性。同时有一点需要说明,可靠性体系的建立不是一朝一夕之功,需要企业不断积累与完善,毕竟可靠性不是某一两个部门的职责,而是需要各个相关职能一起参与,融入产品开发流程,才能够真正地发挥其作用。
 
耐久性 (Durability)的衡量指标与控制方法
 
对耐久性而言,在此提一下两个方面。一个是零部件的耐久性问题,其实就是单个零部件的寿命问题。另外一个是系统(如整车、发动机等)的耐久性问题。
 
对于单个不可修零部件而言,不存在维修问题,所以也不存在平均维修间隔里程等,所以不能用失效数或者MKBF等可靠性指标来衡量,而应该通过零部件的寿命来衡量,B10寿命(即10%的零件失效后对应的寿命或里程)或者可靠度是比较常见的指标。反过来,零部件到了一定里程对应的失效百分比就是不可靠度(可靠度=1-不可靠度)。这里要说明一下,B10寿命只是一个特征寿命,不代表零部件的设计寿命,比如某个零部件的B10寿命是5万公里,不代表零部件设计寿命是5万公里。
 
对于系统的耐久性问题,上面我们也说了,其实关注的也是寿命问题,如我设计一个产品如整车也好、发动机也好,它的使用寿命究竟应该是多少?上面我们讨论了可靠性问题,我们通过可靠性设计流程或增长流程,提高了汽车的可靠性,不代表汽车的寿命就达到了要求。所以我们除了降低汽车的失效率水平外,还得考虑设计合理的汽车寿命。当然寿命不是越长越好,这个结合汽车的市场定位与使用的要求来考虑。比如乘用车的设计寿命,与商用车的设计寿命,肯定是不一样的。
 
对于单个零部件或者不可修系统而言,寿命比较好理解。那么接下来的问题是,系统级别的寿命如何来评价呢?我们还是以汽车为例来说明这个问题。一般来说,在汽车保修期内出现的零部件失效(零部件寿命或性能退化问题),带来了产品(如整车)的维修问题,但是不影响整车的使用(如整车换了一些易损件还可以继续开),这些易损件实际上影响的就是产品的可靠性。而一些关键零部件,如汽车发动机5C件(曲轴、连杆与凸轮轴等),底盘关键零部件等,发生损坏后,整车就要大修,整车寿命基本上就到了(参见上面浴盆曲线的最右边那个拐点)。这些零部件的失效影响的是整个产品的耐久性或者产品使用寿命。
 
那么如何通过这些关键零部件的寿命来评估产品的寿命呢?不同的产品可能不一样,对于汽车而言,一般来说不会是所有关键零部件都损坏了,整车寿命才到。一般来说,可能是一个关键零部件到寿命了,整车寿命也就到了,或者某几个零部件到了寿命,认为整车的寿命就到了。如果是前一种情况,那么这些关键零部件中寿命最短的那个零部件寿命,就是整车的寿命。如果后一种情况,就需要通过分析是否有串并联关系来通过可靠性建模预测整车寿命。
下图展示了寿命设计的典型流程。
要评估整车寿命,需要先评估关键零部件的寿命。关键零部件的寿命一般很难通过三包数据或者售后数据获得,因为很少有企业会追踪产品整个生命周期的失效数据,尤其对于汽车等长寿命的产品。当然,我们也了解到某些企业试图通过抽样的方法,追踪部分产品全生命周期的失效,目前都没有获得好的结果,因为这个成本是非常高的,而且不太容易追踪。但是对于这些关键零部件,我们通常可以获得零部件在试验台架上的寿命数据(一般来说,由于这些关键零部件寿命都比较长,正常的载荷下寿命测试不太适用,比如一个零件设计寿命为10年,你不可能花10年时间去测试这个产品。所以一般通过加速寿命试验的方法来获得零部件寿命的数据,然后再等效到实际使用载荷下的零部件寿命,再通过寿命数据分析(如Weibull的方法)评估零部件的寿命。有了这些关键零部件寿命,我们可以评估整车的寿命。当然,有的时候我们可能会发现零部件寿命设计不足,或者寿命太长,这样就会给我们指明一个方向,是继续提升零部件寿命,还是通过寿命设计优化,解决过设计的问题,以降低零部件的成本。
 
总结
本文从定义、相关衡量指标以及控制流程与方法上对质量、可靠性与耐久性做了一个总体的阐述。下面通过下表做个总结。
缩略语(按文章内出现顺序)
 
QFD: QualityFunctionDeployment,质量功能展开,一种将主观客户需求转换成产品特性的方法与流程
 
APQP: Advanced Product Quality Planning,产品质量前期策划。是质量管理体系的一部分。一种用来确定和制定确保某产品使顾客满意所需步骤的结构化方法。目标是促进与所涉及每一个人的联系,以确保所要求的步骤按时完成。有效的产品质量策划依赖于高层管理者对努力达到使顾客满意这一宗旨的承诺。
ISO: International Organization forStandardization,是一个全球性的非政府组织,是国际标准化领域中一个十分重要的组织。
 
DFSS: Design For Six Sigma,即六西格玛设计,公认的一种实现高质量和营运优越的高效工具。
 
DMAIC: Design, Measure, Analysis, Improveand Control, 六西格玛管理中流程改善的重要工具,一般用于对现有流程的改进,包括制造过程、服务过程以及工作过程等等
 
FMEA: Failure Mode and Effects Analysis,即潜在失效模式及后果分析。FMEA是在产品设计阶段和过程设计阶段,对构成产品的子系统、零件,对构成过程的各个工序逐一进行分析,找出所有潜在的失效模式,并分析其可能的后果,从而预先采取必要的措施,以提高产品的质量和可靠性的一种系统化的活动。
D-FMEA:Design FMEA,即设计FMEA。在产品设计阶段开展的FMEA工作。
 
P-FMEA:ProcessFMEA,即工艺FMEA。在过程设计阶段开展的FMEA工作。
 
PPAP:Production PartApproval Process,即生产件批准程序。PPAP规定了包括生产件和散装材料在内的生产件批准的一般要求。PPAP的目的是用来确定供应商是否已经正确理解了顾客工程设计记录和规范的所有要求,以及其生产过程是否具有潜在能力,在实际生产过程中按规定的生产节拍满足顾客要求的产品。
PPM:Parts Per Million,即百万分率的缺陷率。
 
CPk:Complex ProcessCapability index 的缩写,是现代企业用于表示制程能力的指标。指工序在一定时间里,处于控制状态(稳定状态)下的实际加工能力。它是工序固有的能力,或者说它是工序保证质量的能力。CPK值越大表示品质越佳。
 
GR&R:Gauge repeatability&Reproducibility,评价量具的重复性和再现性。目的是借助量具量测数据,验证量具是否可靠,是否好用,还可以计算出量具的量测误差。
F/U:Failure per Unit, 单机失效数。用来衡量产品在一定时间内的平均到单台产品的失效数量,是衡量产品可靠性的一个重要指标。
IPTV:Incidents PerThousand Vehicle,每千辆车故障率。在汽车行业用的比较多,也是衡量整车可靠性的一个重要指标。
MTBF/MKBF:Mean Time BetweenFailure/Mean Kilometer Between Failure,即平均故障间隔时间/平均故障间隔里程。是考虑了使用率情况下产品可靠性的指标,一般来说,MTBF/MKBF越大,表示可靠性越好。
 
RGP:ReliabilityGrowthProcess,即可靠性增长流程。一种系统的可靠性流程,实现产品在整个设计周期中可靠性提升。
 
DFR:Design forReliability,即可靠性设计流程。一种系统的可靠性设计流程,实现产品在整个设计周期中可靠性提升。
 
NVH:Noise, Vibration andHarshness,即噪声、振动与声振粗糙度的英文缩写。车辆的NVH问题是国际汽车业各大整车制造企业和零部件企业关注的问题之一。有统计资料显示,整车约有1/3的故障问题是和车辆的NVH问题有关系,而各大公司有近20%的研发费用消耗在解决车辆的NVH问题上。
 
FTA:Fault Tree Analysis,即故障树分析。又称事故树分析,是可靠性、安全性系统工程中重要的分析方法之一。事故树分析从一个可能的事故开始,自上而下、一层层的寻找顶事件的直接原因和间接原因事件,直到基本原因事件,并用逻辑图把这些事件之间的逻辑关系表达出来。
 
BxLife,即Bx寿命。其称谓的来源无从考究,普遍认为B代表Bearing(轴承),另一说是B代表德文的"Brucheinleizeit"(进入失效的初始时间)。当x等于10时称为B10寿命,表示10%的零部件发生失效对应的寿命,是衡量零部件特征寿命的一个重要指标。
 
SPoF:SinglePointofFailure,即单点失效模式。一般指一旦失效会导致于整个系统无法使用的元件。在寿命设计中,我们需要分析某个元件可能存在的各种单点失效模式,然后分析其可能导致的原因以及使用工况,为寿命设计模型的选择,以及后续的寿命评估提供依据。
 
ALT:AcceleratedLiftTest,即加速寿命试验。加速寿命试验是指采用加大应力的方法促使样品在短期内失效,以预测在正常工作条件或储存条件下的可靠性,但不改变受试样品的失效分布。对于寿命比较长的零部件,一般通过ALT方法来进行寿命测试。
 
AF:AccelerationFactor,加速因子。加速因子是加速寿命试验的一个重要参数。它是加速应力下产品某种寿命特征值与正常应力下寿命特征值的比值,也可称为加速系数,是一个无量纲数。加速因子反映加速寿命试验中某加速应力水平的加速效果,即是加速应力的函数。
分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026917号-25