英飞凌曲树笋:如何基于运行工况计算驱动器功率模块的寿命?
本文为励展博览集团及NE时代于4月25-26日联合主办的 "第三届AWC2019新能源汽车三电系统开发与测试技术大会" 演讲嘉宾的现场实录。
演讲人:英飞凌 科技有限公司资深主任工程师曲树笋
演讲主题:如何基于运行工况计算驱动器功率模块的寿命?
曲树笋:谢谢主持人,大家下午好!我是英飞凌汽车电子事业部工程师,我们负责的大功率IGBT模块,以及碳化硅模块,应用是在三电里面的电驱部分。
今天议题主要是4个部分,第一个大家探讨一下提到寿命一定会提到为什么会死掉?寿命会结束。还有一个会跟大家总体讲一下寿命评估的组成部分有哪些?步骤和内容是什么?还有是在方法里面的一些细节做一些讨论,最后一个是怎么把需求以及功率半导体器件厂家做出试验的结果跟寿命评估的结果联系起来,方式方法是什么?
先看寿命,故障的机理是什么?这是一个V字型,大家做开发都知道,从需求到最终的结果要满足这个需求是这样对下来的,这个图没有什么特殊的,后面会有细节讲。主要是想强调拐点的地方是故障的机理作为支撑的,也就是说把整车的需求一步一步的分解,这边是功率模块厂家提供给大家寿命的数据,它们之间的连接点主要是在基于某一种故障的机理或者是故障的形式,是联系起来的。
这一页给大家介绍故障机理,因为我们知道IGBT损坏是有很多原因,有一些是意外,有一些是正常的老化,寿终正寝只有这么长的寿命,活不了那么长时间。两个主要的影响IGBT模块寿命的都是跟热和机械的互动疲劳老化引起的。一个是离IGBT晶圆很近的地方上面的绑定线,但是这个是基于大部分的,绑定线是一个点。还有一个是焊接层,这个芯片的底部是跟DCB焊起来是连接,大部分的硅是焊上去的,当然这个DCB跟散热器的底板,大功率的IGBT的模块也是有底板的,主要是焊锡,我们主要是考虑这两层的故障失效。
因为有热和冲击造成反应,自己会被加热,然后热会膨胀,因为这部分是通过不同,也可能是高温,或者是高压,或者是超声波的技术压上去,绑定上去的。然后它的故障现象基本上是两种,一种是离开了,还有一种是自身会断裂。焊锡层也是CTE的温度系数不匹配造成的,这张图是给大家一个示意是比较完好的状况,这个就已经开始分层,焊锡连接的部分会变的越来越小。
这个是整个寿命分析方法的过程,也就是说一开始OEM要给Tier1提一个运行工况的要求,进行任务目标分解后,这里面包含了直流母线电压,输出电流,以及运行环境的工况。一般来说是平均温度是按月份来计算的,然后还有类似完整的一个循环,一共有多少个,还要告诉你要求多少多少年,10年,15年,30年的寿命,一般来说Tir1根据这样的输入计算你的损耗,IGDP,会得出一个这样的Profile。但是这个结温跟半导体给你的是很难对起来的,因为是连续的模拟的结温所以要做简化处理,就是从这些结温里面提取特征的部分,现在用的多的是预留法,要简化,就像我们处理的FFT,或者是DFT,信息是包含了ΔT是什么,Tjmax占有的时间,当然这一步有不同的做法,特征从这个表查出来,当然我们也会给公式直接算,还有别的算法是把这些东西全部是用压力等效的方式折成一个,就通过这张表求出来,这张表的横坐标是ΔT或者是K,这边的纵坐标是这样的温度循环这个器械的寿命能支持多少次,所以这个是Power cycling的图表,然后一个一个叠进来你会算一个总的,产生的实际要求的循环数占我在寿命允许的循环数的百分比,把所有的百分比加起来,总的百分比小于100%,就说明寿命是满足要求的。
这个跟刚刚的有点像,只是具体的把计算过程写出来,一般来说这个部分是由OEM提供的,OEM要给你要求,工况是怎样,环境是怎样。这个部分看情况,一般来说也是Tier1自己去计算的,有一些case也是需要英飞凌一起计算,英飞凌会提供电器的特性是什么,然后Tier1也会自己算了会有仿真验证,还是会用英飞凌的数据做参考,这个部分的Tier1不知道,一定是模块厂家提供的寿命到底是多少,所以这些部分应该是Tier1计算得出来的。
我们看一下这些细节,第一个是损耗的模型,因为举办单位跟我说要深入一点,所以我就放了很多的公式在上面,其实大家不用管这些公式,我只是跟大家说一点,你实测的数据在实际计算的时候都是要用线性化的模型代替,否则的话你不太可能一个一个点去查这个表。而且基本上这个数据,比如说我们就以压降为例,其实正常来说就是按照温度,某一个温度给你一条曲线,所以还是要把在不同温度,不同的电流情况下导通压降是多少,所以这个里面是有公式,因为是IGDP,在很小的时候有压降,这个会随着温度的下降会降低,随着电流的升高也是呈现类似线性增加的过程,就像一个电阻一样,基本上大家看线性化是AX+B,但是你的实际结温不可能刚刚好是125度,或者是150度,所以在中间温度点做线性化的差值计算去处理,这个公式到处都可以看得到,这个是导通损耗的输入,这个是开关损耗的输入。
基本上也是线性化,电流是线性化的,电压是线性化的,但是系数跟温度的关系并不是一个线性化的,这个公式是通过业界认可的模型模拟的,这个是经验吧,我相信行业里头都是用这个公式的,二极管稍微有一点特殊,电流是平方根的线性关系。
我们在算的也是这样,把这些公式输进去,把这些基础条件代进去得到这些基本的参数,用来计算的。
这个是比一下,实际的损耗和刚刚上面公式简化以后的差别,大致比较接近,所以这个里面电流小的时候简化模型会过高的估计了损耗,当然在进入这个电流比较大的区域就非常接近了,那这个会在比较大电流的时候偏小一点,当然二极管损耗也是类似会偏大一点。开关损耗是每一次开通,在每个电流的情况下单次损耗是多少,但是给的是长时间的正弦波电流,计算一个长周期的损耗是什么样的。
开关损耗,导通损耗,IGBT二极管,如果大家用空间矢量调试在导通损耗里面多一个变量,这个变量的原因是空间矢量调制是叠加了连续分量,主要是三次谐波,主要是以三次谐波的形式出现的。
还有一个严酷的工况汽车在坡起的时候电机是不转的,电机不转就不是正弦波的输出,大部分是发直流的形式,所以这种情况下损耗是怎么算的?这边也有公式,这个都是比较常规的平均化模型计算损耗的公式。
我们把损耗算完了,施加到热的模型里面态度得出结温,简单讲一下整个热的模型怎么来的?以及半导体厂商会给大家提供什么样的东西?第一个是因为我们有晶圆有材料,会做有限元的仿真,大约知道热的组织和模型是什么样的。通过这种热的模型我们有两种,一种是Cauer模型,这个跟材料的属性是有关的,这种模型是比较利于计算的,但是不能把这里的参数跟材料的属性联系起来,这个是曲线拟合出来的。我们计算的时候都是用的这种模型,这里给大家提一下可能不太一样的地方,大部分我们都只是知道这个模型,IGBT发热,自己的热阻形成一个温度,旁边的二极管发热,会被动的让IGBT也升温,所以是有耦合效应的,这个部分是耦合的,对于IGBT是二极管的耦合,对于二极管来说是IGBT的耦合,所以这部分也会有一些影响,大家在算用热阻模型算结温的时候也要考虑耦合的因素进来。
这个是英飞凌在主驱里面用的比较多的一款模块,热阻模型参数,这个是跟你的流速也有相关,所以我们会给的这三个参数是不受影响的,跟IGBT本身有关。最后一个系数是跟流速有关。
热阻稍微多说一句,热阻对于很窄的脉冲是有一个时间的特性的,有点像ICE电路,所以脉冲的长短是有影响的。做一个比较,跟简化的做了比较,但是这个上面有条件了,黑框是实测的温度,蓝色的是刚刚的情况,这里面有几个原因,一个是你的Simulation不准有误差,还有实测的模块性能有点关系的,因为Simulation的值是典型的,所以这个模块好一点坏一点跟典型值之间本身有差距。
英飞凌会做快速的选型,比如说这里有一个系列,多少个模块,每个模块跑多少电流,结温是多少。我们会用更多的损耗,把损耗和结温往上提的方式给大家选型,这个地方是想cover你的应用,而不会反过来。
这个是讲我计算出结温,这个是连续变量,怎么把这个结温简化成可以计算、可以handle的查表,基本上我们定义一个温度的循环实际上是一个等腰三角形,ABC,是一个三角形,然后我们要知道的是多少个?幅度有多高?最高的温度多少?以及温度停留的时间,从A到C的时间需要得出来作为最终计算的输入。
大概有4种方法,但是前三种都是去看最高点在哪里,只不过是怎么用这最高点?看见一半就当成一个,然后还有找最高的峰值,当然还有看上升沿,不管下降沿,当然后面会有一页讲怎么说明预留法是比较好的方法。
这个是英飞凌做的仿真,这个结果是完全来自于仿真,没有一个是实测,全部仿真,因为我们有有线源模型,会叠加结温,按照某一些特征的形状去变化,然后去看累计的机械的电型量对比仿真,一种是把实际的放上去,还有一种是根据上面4种提取方法把这些做简化,这些都是很简单的最基本的形状了,做简化做比较,比较以后看它们相互之间跟标准实际的仿真的结果差是多少。
对于芯片的焊接以及绑定线的部分,预留法的差别都是最小的,英飞凌认为主要的原因是预留法提取了长周期的变量在里面,剩下的其他的方法都是只看眼前,都是短期的变量,不是长期的变量,所以这个也是为什么所有寿命损耗的时候都借用了预留法提取特征的变化的Cycling。
最后一部分讲一下英飞凌怎么去验证模块的寿命是多少,一个是绑定线,一个是焊接层,基本上绑定线对它有影响的都是很短的脉冲,我们叫PC Cycle,这个是对绑定线的影响最大的,另外一个是分钟级的power的cycle这个对焊接的影响比较大,试验都是这样的,我们要想办法让它的结温形成这样的变化,大电流让温度形成这样的变化,有意的向这部分施加电的压力,会测几个点,用这些点这个曲线是业界定义好的曲线,曲线的形式是定义好的,根据这些点的值求出这些点的系数然后延伸,延伸过去。
所以整个行业都是这样做的,并不会每个点测,横坐标是ΔT,还有一点是高于它,一个是低于它,一般是测100K,60K,但是英飞凌在PC cycle的时候也会测120K的变化。
这个是长周期的60秒的冲击,这个数素量是明显小于这个素量,这个是根据这两个得出来从很短时间到很长时间寿命的曲线,或者热阻高于粗始值25%也结束了,比如说DC电容也不是完全没有功能了才任命寿命终止。公式是和刚刚曲线拟合的公式了,这个是用来让你软件计算的时候写出公式查出来。
这种公式只是适合这些模块,特点是什么呢?都有绑定线,都是有统计板。这个是讲LV324,这个是德国的一个车企联合供应商的要求,现在变成了AQG324,是对车用的功率模块(英文)的要求是一个标准。而这里要解释的是我要定义结温的变化是多少,是以开始稳定值定义的,这个过程当中不调整,就是这样一直进行下去,然后结温必然会升高,一方面可能是因为VCE在增加,不停的老化,热阻也会增加,所以一直到要么5%,要么是20%的点,我认为寿命结束。
但是这里说的是所有的模块厂家做这个寿命计算的时候,如果说宣称模仿LV324的时候必须用这种做法做,中间不能做调整,否则的话这个结果就没有可比性了,因为大家条件不一样。
所以这里有定义,用多大的电流做试验,可能对试验结果有影响,从LV324开始定义了必须要超过85%的ICN的值做试验,你用这个做试验和用其他的做试验,可能会对结果有很大的影响,我是60K的cycle,他是100k的Cycle,这个意义没有多大不一样,但是一定要实践才能做比较。
英飞凌做试验是拿三个lots是能代表整个参数分布,因为不同的参数分布对结果有影响,我用三个不同的lots做试验,得出大家都能够满足的结果现在是这样的做法,这个是试验的什么样的电流条件,参数是不能调整的。
这里是讲的我们用这个韦伯分布,一个是在5%的可能性的情况下能做到多少,但是英飞凌考虑我这只是一次试验,因为这种试验要每年重复,所以我要保证所有经年累月的样本全部都能满足这个要求,实际上是把这个寿命又放了更低的程度。比如说英飞凌是60k,其实5%的是在90%左右,但是真正样本的在105K。
我就随便挑三个来做,分布是有限的,还有别的方法是这张图告诉大家,这个方法比较合适,但是如果用你就挑那些最差的,专门挑一些最差的模块做试验,或者是你挑了一些很好的模块做试验,其实最终对你的结果都是有影响,所以给出的值都会不一样。
这个是跟刚刚有点类似,还是挑平均分布的样本,你有weibull来做,如果你专门挑一些那之前的都不成立。
这个最后讲一下,我们会给一条线,因为我样本数量的原因,我知道只有95%,这个是样本数量决定的,这条线告诉你是不是100%保证,是不是95%的自信程度?当然了这个点越往上置信度就会越低,所以说整个寿命的计算,包括英飞凌给出的寿命,实际上是一个具有统计意义的数值。
这是我的全部分享!
关于公众号转载:本文系NE时代
-
汽车测试网V课堂
-
微信公众号
-
汽车测试网手机站
编辑推荐
最新资讯
-
Plus为自动驾驶卡车功能添加了H.E.L.P.警报
2024-12-23 17:18
-
美国能源部发布最新版氢计划
2024-12-23 17:16
-
系统级封装(SiP)在新能源汽车领域的应用
2024-12-23 08:51
-
车载通信框架 --- 智能汽车车载通信架构浅
2024-12-23 08:40
-
全国首例!武汉车网智联公司完成智能网联测
2024-12-23 08:39