我对元器件可靠性与失效分析的看法
扫描二维码
随时随地手机看文章
(本文是根据我与前公司人力资源部总监交流的邮件整理出来的,当时我在做采购工程师。想做回技术。想和人力资源部总监商量设个可靠性工程师。)
一、我对可靠性的基本认识
可靠性,是质量控制的一个分支。但是把可靠性提升到一个专门技术来看待,是产品不断追求完美的一个必要阶段。我国可靠性研究起步较晚,伴随而来的可靠性分 析技术,可靠性设备相对落后。在质量管理体系的跟进方面,比如ISO9001,中国似乎很快就赶上先进国家了,但是ISO,形式主义严重,不管是大大小小 的公司,几乎都通过了ISO认证,现在我国企业ISO运作的现实是,基本上对质量水平的提升没有突破性的进展。未来企业之间产品实力的竞争,将会是可靠性 水平的竞争。所以,可靠性研究的地位,将会越来越重要。
二、关于可靠性研究的架构形式与运作模式
可靠性工程师,表面上是一种形式的设置,事实上体现了企业对可靠性的重视程度。
传统的产品质量控制,也有一些可靠性控制方面的工作。比如开发部门的DQE(开发测试工程师)、品质部的QA、QE,都有一部分的可靠性工作。但是,这种 模式,以对产品的功能,性能,安全测试为主,失效分析也停留在比较表面的部分。所以,有时即使看起来在控制质量,也有一些措施,但是不良仍然不断在发生, 原因就在于没有分析到本质问题。
可靠性研究的两大内容就是失效分析和可靠性测试(包括破坏性实验)。两者之间是相互影响和相互制约的。
不过为了使事前简化,可以把这两大内容分割开来看。把失效分析和可靠性测试当成是可靠性研究的两个境界(严格讲来,这种分法不是非常恰当,此处只是为了简化)。企业可以根据自身的实际作出不同的策略。
以失效分析为主要内容的模式,相对来说是比较被动的模式, 是等问题发生后才去分析问题的。当然,失效分析结果出来之后,可以反过来影响测试、开发、 工艺、流程、筛选标准等。这种模式又可以根据自身情况,把失效分析做到不同的境界。这种模式,即使是简单的境界,也能实现低投入高回报。规模较小时,比如 我们公司开始时可以采取这种模式。
以可靠性测试(包括破坏性实验)为主要内容的模式,是从源头上保证可靠性的一种方法。这种模式是一个系统工程,要求的实验设备非常丰富,投入的人力和时间 也多,还有对信息的收集和统计(“只有在统计受控的条件下生产的元器件才会具有高可靠性”)投资非常大。目前我们公司还不能完全满足这个条件。
下面谈的是我对以失效分析为主要内容的模式时,可靠性研究架构的看法。
这种模式,由于规模小,所以不足以成立一个专门部门。但是可 靠性工程师(或失效分析工程师)是一个必要岗位。当然可靠性工程师分在品质部还是开发部 直接影响到失效分析的效率。就像品质部必须脱离生产系统一样,可靠性工程师必须安排在开发部,才能发挥更大的效力。常规的品质问题,还是由品质工程师处 理。而可靠性工程师,主要分析的是返修率高的元器件失效,或对生产影响比较严重的元器件失效。否则就不会有这么多的精力解决重点问题。当然,可靠性工程师 并不是单打独干就能解决问题。所以,在处理某种重要失效时,可靠性工程师必须牵头组织,成立失效分析专案小组,明确专案小组成员的责任,共同分析问题,查 出原因,定位责任,提出改善措施,跟踪实施效果。这方法与品质PDCA循环类似,但必须把失效原因定位更加专业准确,提出的解决方案也必须更加有效果。失 效分析专案小组可以由固定的人员组成,也可以针对实际情况具体指定人员。专案小组成员,除了可靠性工程师,一般都会有开发、工程技术、品质、生产等人员组 成。
所谓的“某种重要的失效”,提出方可以是市场客服人员,也可以是生产部,或品质部,甚至开发部自身。
三、可靠性工程师的素质要求之我见
可靠性问题,基本上都可以归结到元器件失效,(少部分是系统兼容及环境干扰引起)。换句话说,产品出去客户那里使用时不良,基本上都可以归结到元器件(还 有软件)失效引起。所以,失效分析的精华就是元器件失效分析。但是元器件失效,除了元器件件本身可靠性差,还有设计、工艺、人为、环境应力等引起,或者是 由综合因素引起。至于元器件本身问题,按照供应链管理的思路,追溯到供应商那里,同样可以归结为其原材料可靠性差,设计、工艺、人为、环境应力等引起。所 以,可靠性工程师,必定要求对元器件的设计选用、测试、生产工艺熟悉。从我个人角度来看,我认为,可以多与供应商沟通,对于不了解的元器件甚至可以到现场考察交流。
其次,必须对电子技术本身非常熟悉,否则,系统的工作原理不了解,就没办法深入地分析失效原因,特别是设计层面的问题。
必须熟悉物理化学等知识,因为失效机理的最深层次原因基本上都是物理化学作用引起的。我本人为此还决定重新复习高中和大学的数理化知识。
必须懂得开发设计原理,否则就找不出设计原因引起的失效。而设计原因引起的失效,又占元器件失效很大的一部分。
熟悉生产工艺。
逻辑严密,具有推理能力。同样的失效现象,有可能有不同的原因引起。在失效分析技术中,提出假说(有点像科学研究)是很常用的一种方法,然后拿良品按假说实验,重现失效现象,印证假说。
考虑问题全面,小心谨慎。失效分析其实 不仅仅只“挑刺”。处理问题还必须以企业的实际情况相适应,考虑全局利益。比如不可能拿军用标准来要 求工业用和民用的元器件。不可能不考虑成本因素而无限要求质量。所以发现问题时,可靠性研究必须提出筛选方案,保证能把有隐患的不良品提前暴露出来,又不 会由于不恰当的测试应力增加隐患。而对于某些情况是否可以放行,必须提供数据或理论,以免误放不良品,或者过于谨慎而造成浪费。
实事求是,数据必须真实可靠。否则会给决策带来失误。
其他。