查看原文
其他

流年丨梁昌年:我在英特尔做工程师

梁昌年 新三届 2019-06-06

     

作者简介

本文作者


      梁昌年,1979年15岁考入北大,本科和硕士毕业后1986年留美读研成为物理学博士、博士后,1996年进入工业界。 从超导体研究到半导体制造,从英特尔芯片制程研发到小学生学习兴趣的培养,从关注自己子女的成长到忧心万千孩子的学习。 2009年创业至今,一直沉浸在教学一线,接触了大量的学生和家长。长期坚持以学生为中心,父母共同参与,取得了显著的成效。,现为上海学点教育科技有限公司总经理。

原题

我在英特尔做工程师


作者:梁昌年 

原载微信公号“学米大讲坛” 



一、缘起


我的“我在中芯国际的往事”(下称“前文”)(4月26日)发表后,我的大学同学李袁给我留言,期待下一篇 “离开中芯国际后,我干了什么”。我的另一位大学同学严平宜,则希望我再写一篇关于英特尔的工作经历。我原本来是打算写我在新育洲智能科技和学点教育科技的创业经历的,看到平宜的留言,我即刻产生了马上就写的冲动。为什么?因为我读大学二年级的儿子暑假就要实习了,我把我参加工作的经历写下来,希望对他和他的同学有帮助。


连续写了3天,终于在5月2日完成了初稿。写完以后,责任编辑梁世凯老师回馈说有太多的专业术语,所以稿件被我搁置到一边。随后我把时间投入到“高考之前,唠唠考试这回事儿”的写作上,5月19日发表后,得到了小玉老师的简短留言:很精彩!“考试”无处不在。


我的第一个工作,从1996年9月到2000年7月,是在英特尔制程研发部门做化学研磨工程师,在那里,我经历了一系列终身难忘的考验。下面要讲的,就是那些一次次毫无准备的考验。


二、我的工作环境


1996年9月16日,我加入了英特尔波特兰的研发部门(PTD),职位是资深制程工程师(Sr Process Engineer)。一般人很难想到,在考试方面一直一帆风顺的我,在求职时一败涂地,最后是靠太太给我“开后门”得到的这个位置。


我的部门Portland TD(PTD)后来改名为Logic TD(LTD),是在CTD(California TD,也称为D2)2001年转行之后致力于实现摩尔定律的唯一研发部门。这里新招的工程师都是清一色的博士或博士后,而且必须是刚从学校毕业直接招进来的,少有的例外也要求毕业年限不能超过一年,因为TD这个部门,在文化方面比英特尔的其他部门要强大得多,在其它公司工作过的员工很少能够适应这个部门的文化。即使英特尔其他部门的员工谈起PTD,往往也是一副谈星外来客的表情。


当时,PTD在波特兰的Aloha D1A site刚刚完成了0.35微米制程的研发,搬到了位于Hillsboro Ronla Acre的D1B site,准备开始0.18微米制程的研发(注:0.25微米是CTD开发的最后一代)。每一代之间的线度比是0.7左右,这样面积比就大约是0.5。摩尔定律及其发展路线,遵循的是一个小学四年级学生就能理解的蓝图。但是,实现摩尔定律,靠得则是一帮初生牛犊不怕虎的刚从校园毕业的年轻工程师的艰苦奋战。



我所在的CMP小组(ChemicalMechanicalPlanarization,化学机械平整化,也可称为Chemical Mechanical Polish 化学机械研磨),负责的是半导体生产工艺中最不待见的一道工序。说得好听一些,CMP工段的主要任务是帮助后续的光刻机减轻或消除景深不够导致的次品问题。说得通俗一点,就是刻蚀工段造成的坑坑洼洼,要靠CMP工序去磨磨平。说得再白一点,这是整个半导体芯片制造过程中最脏最累的工段,它给前面的工段擦屁股,让后面的工段感觉好一些。如果后面工序有问题,很容易就抱怨CMP工序没做好。


从1970年3月1日在江西省临江镇上小学开始,此时的我,如果把做博士后的时间算上,已经满打满算接受了25年的教育!用国内习惯使用的标准看,接受了25年的教育,还要干和专业一点也不对口的活,真的很难理解。我大学和硕士研究生做的是非晶硅太阳能电池的制备,博士做的是高温超导材料的微波损耗,博士后做的是超导电子加速器电子束位置和电流的测量。我的知识储备和工业界,和半导体生产,和CMP并没有什么交集。我在得到这个工作前,CMP这个词连听也没有听说过(光刻,Litho和Etch我至少还听说过)。这怎么能够干好活呢?所以,我第一次在PTD面试没有通过,是很正常的。



集成电路生产工艺在微米的尺度时,CMP是不需要的。到了亚微米阶段,CMP的重要性才开始越来越突出。我参加PTD D1B时,CMP的重要性还没有今天这么突出,也没有从0.13微米才开始的铜的研磨制程,有的只是STI(Shallow Trench Isolation),Poly,和ILD0到ILD5的7个工序。工序其实并不复杂,也不精细,但CMP机器的Throughput(产能)和Reliability(可靠性)是当时的主要挑战。因为生产机器的设备商太小,满足不了英特尔大规模生产的需要。当时,CMP的机器是由一家叫WestTech的小公司生产的,应用材料的第一台MirraTrak(后来叫MirraMesa)尚在实验室里研发。


 所以,我工作的第一个任务就是Qual(验收)应用材料公司的第一台CMP机器,MirraTrak 01。说得更准确一些,是帮助资深工程师们打下手,完成MirraTrak的首次验收。当时负责前端的工程师是Joe Steigerwald,他已经在TD工作了一年多,是纽约著名的伦斯勒理工学院毕业的博士,而且,他的博士论文就是CMP方面的,后来成了Wiley VCH出版社发表的一本CMP专著。负责后端的工程师是Mike Favaro,他马上要转到在亚利桑那州的Fab12,接替他的是Tom Bramblett,伊利诺伊州香槟分校毕业的化工博士,他的化学知识比我这个零基础入职的物理学博士要丰富得多。我现在还记得,Hydrophilic(亲水的)和Hydrophobic(厌水的)这两个拗口的单词,就是从他那里学到的。他们两个工作都不到两年,就已经成了0.18微米项目的CMP主力干将。


经常有北大校友或朋友问我,“国内半导体制造水平及制约原因是什么?” 我已离开这个行业多年,也没有去关注半导体行业有关的变化,没有什么具体的东西好说。不过,梁宁文章中有一句话,“还是原来的体制,还是原来的套路。面对更大的一仗,完全没有赢的机会。” 虽然不中听,但的确是需要重视的问题。不妨客观地比比看,我们刚毕业的博士,能有这样的机会吗?


在两位工程师的后面,还有一位Individual Contributor(自由贡献者),就是我前文提到的Seiichi Morimoto。他负责机器的验收,Joe和Tom负责机器上制程的验收。机器的验收相对简单,就是用没有线路的平板晶圆(Blank Test Wafer)和有着专门测试CMP参数的电路的晶圆在不同的压力和转速下研磨,再和原来的机器磨出来的参数相比,能够更好或差不多就行了。我的前半年,主要跟着Seiichi干,帮他(偶尔也帮Joe)打下手。


每天下午6点,Seiichi会跑来找我,吩咐今晚的这一班要做什么实验。我们法定的工作时间是早上7点到下午4点,每天6点来找我,讨论半个小时,我再写一个实验要求给他过目,7点钟他回去了,呵呵,我则还要等到技工们交接完以后,再专门和他们交接实验的内容与步骤。一般最少要8点以后才能动身回家,到10点或11点也不奇怪。我一般是早上6点半就到单位,这意味着我每天的工作时间是14个小时以上。时间工作长一点倒没什么,关键是我不知道他们在干什么,为什么要这么干,才是最憋屈的。


终于有一天,我对Seiichi一个又一个指令接受不了了,忍不住对他发起飚来。没有料到的是,他不愠不恼,把我拉到一个会议室,让我把手头的事情一件件告诉他,他写在黑板上,一条条分析,帮我把不那么紧急的一条条删去。干了三四个月,他这是第一次手把手地教我如何工作。我对这一次的场景印象极为深刻,因为这是我做事方法的第一课:要事优先。原来在国家实验室做博士论文,做博士后,都是自己规划,和导师配合好了就够了,合作要求不高,也没有太大的时间压力。在企业,时间、进度和成本,以及各种各样的要求和考虑,与研究机构比起来,真的大了太多倍啊!


我把对Seiichi发火的事和英特尔的一位中国同事说了。那位同事是一位精明能干的物理学博士,他不无得意地对我说,“这就是英特尔的玩法。每个新工程师就好比一辆新汽车,司机不知道车子的马力和速度是多少,就拼命开。直到速度加不上去了,再开始规划你的未来。” 果真,以后跟Seiichi工作,他都会简要地跟我讲实验的目的和意义,我也可以向他提出自己的问题和建议,工作得非常融洽。回想起来,真正的问题更在于自己的“零基础入职”,没有目标,不知道如何工作……


说到不知道如何工作,就要提一提我的第一任老板,CMP的Group Leader (工段段长)Chi-hwa Tsang。他在TD工作应该有10年了,是一位非常负责任而且要求极高的领导。 他说话不多,但做什么事都目标明确。我们每周,最多两周,会有一次单独的会议(这是英特尔的制度,在PTD执行得非常不错)。入职大约三个月的时候,我对有些工程师挑肥拣瘦、耍小聪明的现象不够理解,就问他,“怎么我听别的工程师都在谈什么什么重要,专挑重要的事情去做,追求visibility(可见度)。这样的话,不重要的事没人去做,拖了后腿,不还是不行吗?” 他当即给了我一生职场中最受用的忠告,“你不要管别人说什么做什么。在这里,你要记住两点:一是把正确的事做正确 Do right things right。另一个是做一个好的公司公民 Be a good corporate citizen.” 从那以后,我能够静下心来该做什么是什么,做好份内的的事。


关于Chi-hwa,还有一件小事令我记忆尤深。有一天上午,我和Joe一起从车间里出来,Joe就把我邀请到一个他要参加的会,想让我体会一下解决问题的会议。刚坐下,椅子还没有坐热,Chi-hwa进来了,他直接把我叫出去,对我说,“这个会你不会有什么贡献,你来干什么?” 照常理说,这是很不近人情的,也有瞧不起人的味道。但我从这件事又学到了一课,在每一个活动中,你必须对别人有用!否则不要埋怨别人看不起你。在又一次一对一会议上,他直言不讳地告诉我,你的第一年,公司在你身上的投入比你的贡献要多,你的价值是负的。说实话,这些话很不中听,但多年后读到德鲁克关于知识工作者的论述,从内心里感激Chi-hwa能够坚持做正确的事,平等地对待我,跟我讲实话。想想也很正常,没有说实话干实事的文化,18个月晶体管数目一定翻倍的摩尔定律怎么可能由TD实现?


三、英特尔文化


写到这里,有必要介绍一下对我影响至深的英特尔文化Intel Culture了。英特尔文化有六条:


Customer Orientation 顾客导向


Result Orientation 结果导向


Quality 质量


Discipline 纪律


Risk Taking 冒险精神


Great Place to Work 难得的工作场所


每一条下面又有4到6条行为准则。以结果导向为例,它的五条细则是:


树立有挑战性和竞争性的目标 (直白地说:不要耍滑头!)


聚焦于成果/产出 (不要弯弯绕!别强调什么没有功劳有苦劳,没有苦劳有疲劳)


时刻承担责任 (万丈高楼平地起,没有努力就不可能有结果)


建设性冲突和解决问题(冲突的目的是为了高质量地解决问题)


无瑕疵地执行(没有行动,再好的目标也没用;鲁莽地行动,不如不行动)


这些内容我有近20年没碰了,现在翻译和解释起来,依然易如反掌,可见当初英特尔文化对我的影响是多么地巨大。同时,这也反映了我对国内多数企业做事文化的忧虑与不满。 



当然,并不是每个人都喜欢或适应英特尔文化的。在我的英特尔同事里,清华的同学似乎比北大的同学更容易适应。我的一个北大校友,比我早几个月进的英特尔,就直言“提倡文化是洗脑”。我就笑着对他说,这不就是英特尔的三大纪律八项注意吗?要打胜仗,尤其是团队一起打仗,一定是少不了的。这一点,在半导体生产的生产线,显得尤为重要。


英特尔文化的推广也是不遗余力的。除了上图中的名牌(Badge)上每年会更新一次,每一个新员工都一定要参加一定数目的基本培训。第一门课就是“在英特尔工作 Work at Intel”,入职第一个月一定要上。讲员一定是英特尔的副总裁,而且是级别比较高的副总裁。他们不是照本宣科讲什么文化,而是用自己在英特尔工作的实际例子来和大家分享,使人过耳不忘(就像我写中芯往事一样,讲的是实实在在的故事)。更让人能够体会文化作用的是,每个季度公司季报出来,营收一次比一次好,结果股价节节攀升。这一切都能让大家体会到,文化不是虚的,而是让每个员工齐心协力地朝着共同的目标奋斗并取得可以看见的成果。


除了Work at Intel外,还有两门必修课。一门是Effective Meeting(如何开会),另一门是Constructive Confrontation(建设性冲突)。前一门课讲的是守时、主题、会议记录,以及会议的类型;后一门课因为不够政治正确,很早以前就停掉了。另外,还有如何做报告,时间管理,要事优先等多门有关软技能的课程,对我而言都是终身受益的。若干年后读到德鲁克的《卓有成效的管理者》(1967年著),发现英特尔这些课程的内容,在30年前德鲁克就系统地论述了,真是感叹不已:我读了26年的书,32岁参加工作时却从未听说过德鲁克这个名字,真的让人匪夷所思!


顺便再谈谈我本人对“建设性冲突”课程的看法。建设性冲突的确为英特尔的发展做出过很大贡献,这一点,英特尔资深副总裁Albert Yu(虞有澄)在他的《我看英特尔》中有过专门的介绍。但是,反方的论点和现今流行认知与脑科学的理论是一致的。有一本叫做“笛卡尔的错误”的书,作者是安东尼奥达玛西奥,南加州大学神经科学与心理学教授,脑和创造力研究中心主任。他的核心观点是,身体和情绪是不可分割的,情绪对理性的影响是至关重要的。我们都不是纯粹的人,情绪不好,一定会影响到我们的工作状态。所以,Confrontation(冲突)这个词和行为,都是应该避免的。对我们这些在斗争哲学里洗过脑的人来说,不斗则垮。说真的,并没有太多不适应。以Chi-hwa把我从会议室中叫出来为例,就是一种直接的“冲突”。


在进入主题之前,我还要分享一个终身难忘的小事,它也与文化有关。1997年一月中旬,英特尔的季报发完以后,我在饭厅刚开完1对1会议,就听到了广播喇叭里传来了一个公告(就像中国农村里村委会的通知找人,平时从来不用,除非安全演练),是TMG的老大Sunlin Chou的通知:由于1996年的利润又创了新的纪录,每一个员工都有$1000美金的奖金。


由于我是9月16日参加,奖金是按季度算的,所以我这个还没有做什么贡献的员工,也莫名奇妙地得到了$250奖金。没有想到,这件不值得一提的小事,微不足道的$250,在两年之后,竟成了我咬紧牙关坚持前行,回报英特尔的一个精神动力。 团队,合作,目标,结果,……不是铺天盖地的政治思想教育,而是每时每刻的行为。这是我对企业文化的本真理解。


本文作者


四、出师不利


我的第一个任务是协助Seiichi验收MirraTrak。当时,这台机器还在应用材料的测试车间里。96年11月,我和Seiichi出差去圣克拉拉Santa Clara应用材料公司的CMP实验室检查进展如何,同行的还有一个技工。


在实验车间,整个机器拼装在了一起,四个研磨头和三个磨盘都能转起来,明眼人一看,比WestTech的单头(single head)双磨盘(double platens)的串行研磨明显要强许多。Mirra有四个研磨头,三个研磨盘,产能的确可以做到翻倍!只是,他们磨出来的晶圆的均匀度,当时真的还不怎么样。新机器嘛,不可能一步登天,能跑起来就很不错了。


第二天上午,我正在Platen 3旁边察看机器构造,同去的技工毫不经意地点击了Platen 1的一个控制,想看看控制是不是工作。谁也想不到的是,设计上本来每一个Platen都有自己的控制,但应用材料的工程师为了给我们看他们的进展,竟然草草地把一个软件控制了所有的Platens。这下好了,三个转盘同时转了起来,我在毫无防备的情况下,右手的无名指被另一个移动的部位给夹住了!


幸好,那个压我手的部件运动的速度不快,压力也不大,我只是受了一点皮外伤,骨头没有任何问题,一点也不疼。如果是在国内,擦一点红药水就过去了,呵呵,在美国则不行。虽然工期紧急,整个实验室因此而关闭,等安全部门来调查。Seiichi则马上带我去医院就诊,花了两个小时。回来以后,我也成了“名人”,大家都不关心实验的进展,关心的是到底发生了什么。


我对安全问题从来不敢掉以轻心,得益于这次难忘的经历。感谢神!一个微小的事故(accident)而已。要知道,在亚利桑那的工厂,一位技工在维修作业时,研磨头的驱动装置突然动了起来,把技工的头给撞了,撞击力巨大,使得那位技工因工殉职。


短短几年后,Mirra的市场占有率就达到了60%。在看到他们CMP市场份额节节攀升的时候,这一段有趣的经历却不时地在我脑海中浮现。


这是我初入职场的难忘一课。虽然我当时对安全部门的做法并不理解,大多数工程师都觉得是小题大做,现在回想起来,它的教育意义是终身的。有什么事比安全和生命更重要呢?


今天,有许多学生家长对我的印象是,说话太直,像一个“愤青”,不像一个老师。更多的人甚至认为,中国教育改不了,“别人都不说,就你在那里说,你以为你比他们强吗?太骄傲了吧。”


如果这些家长或朋友经历了我上面的故事,而且从中吸取教训,或许,他们对事物的看法与做法,特别是对子女教育的看法会完全不同。我沉下心来回忆并记下我当年刚刚开始工作的经历,并反思这些经历对我在职场上的影响,是因为我了解我现在正在做的事情。做正确的事,把事情做正确,很多人不信,不少人说了不做,但在一件件安全事故面前,只有善于吸取教训的学习者才可能避免重蹈覆辙。


五、首战告捷


我的第一个挑战就是在Mirra上协助Joe找到适合STI和ILD0的Low Pressure Process(低压力制程)。在上一篇文章提到过,我被分配的任务是做2psi的实验,在收集和分析了数据之后,我决定尝试3psi来做实验,虽然Joe不认同,但我还是在6月14日的那个周六,拿出了站得住脚的几个数据(DOE要求的中心点和边缘点,Center and Corner points)。从有这个想法到得出这个结果,只花了四天时间。我是在两个周一的周会之间强行突破的。


现在回想起来,这就是英特尔文化中的冒险精神。结合当今流行的一万小时理论,这不是一个偶然事件,而是长时间和Seiichi工作积累之后形成的一种直觉。我采取的方式,先斩后奏,在如何做正确的方面并不值得提倡。不过,我也是不得已,因为在Joe的眼里,我只是在那里瞎试,撞运气而已,一个工作不到9个月的工程师懂什么。一年以后,Joe代替了Chi-hwa,做了我的领导。又过了两年,我离开了PTD,这是后话。


有了低压力制程,就可以做产品实验,验收不同的工序了。这时候,Joe负责的ILD0制程移交到了我的手上,我也负责ILD0在Mirra上的验收。回想起来,由于每周的例行会议和老板的1对1,TD一般不会让任何一个工程师idle(闲着),这对一个正在成长的新工程师而言,当然是一件好事。TD有没有闲着的工程师?应该有吧。但那是某一个具体老板的问题,在Chi-hwa这样的老板手下,肯定不会。另外,Joe从来没有手把手教我怎么做好ILD0工程师,但每周一次的一对一会议,我会请教他我工作中遇到的问题,他会毫无保留地讲出他的看法和经验。这就是制度和文化的好处,不瞒你说,现在给小学生上数学课,我用的也是这一招,学生自己要带着问题来。


写到这里,我有必要比较一下英特尔TD和我在中芯TD的区别。在中芯,虽然和中国的其他企业相比,效率相当不错,但还是闲人太多。我老板就说过,如果缩减一半的人,让留下的一半人拿双倍工资,生产率会明显提高。这里,我们还不考虑闲人说闲话所产生的负面作用。


勇往直前,敢做敢当,是每一个年轻人要有的活力。我在9个月的试用期之前,做出了3psi的低压力制程,是因为有一个非常好的创新环境。国内企业在这些方面,一定要虚心学习国外企业的先进管理经验,让年轻人的创造力能够充分发挥出来!


六、幸遇严师


在ILD0的验收上,我遇到了我的滑铁卢。问题出在验收的最后一关,在项目会议(Program Meeting)上做报告,用数据说明我们预先设定的指标都达到了,或者更好。


没有料到的是,我的运气很不好。有一个良率的数据,实验组中有一片晶圆死掉了,良率是0。它跟ILD0的研磨可能根本挂不上边,我的制程集成(Process Integration)工程师也不认为这是我的问题,所以大家都没有上心。我们也顺利通过了前面一关,Simon负责的前端集成会议(Front End)。没想到,项目总负责人,Simon的老板Bob Gasser却不放过。随口一问,我答不上来,我的Integration搭档也没准备好,啪,一句话就给毙了。一个星期后再来!


初战失利。我就根据大家的建议又去找数据,良率的数据没有,但有e-test的数据。为此我找到负责eTest的Jason Xu,他后来也跟随Simon回到过中芯国际。看下来,两个组的数据完全没有区别。我让他提供了一个“证明”,作为附件放在我的报告里,说明不是ILD0的问题。于是,第二个周三下午,我信心满满地又去了项目会议,希望能够顺利通过。毕竟,所有的数据,都还不错,但是新机器的产能大大增加了。


一上去,我开门见山,说这个计划上次已经讨论了,但是良率的数据有些疑问,现在我们提取了那一片晶圆eTest的数据,结果两边没有任何差别,良率是0的原因不是来自ILD0的研磨制程。没有想到的是,Bob又随意问了我一个问题,“Changnian,你说说看,Mirra有4个研磨头,WestTech只有一个研磨头。你的数据说他们差不多。是真的差不多吗?我怎么觉得应该差一些啊。”我的天,我们事先准备的时候,根本没有考虑这个。虽然数据没有问题,但那毕竟是有限的样品啊。作为一个新工程师,我又一次哑了……


于是我又急匆匆地去寻找帮助,这一回要找的是统计学家(注:我在中芯随意找人的习惯应该就是这时候练就的)。Statistician的名字好像是Georgia Morgan,她可是个大忙人,时间一般都是排得很满的,被很多人预约(呵呵,中芯国际的Statistician Frank Yang好像就从来没有这么忙过,不知道是不是Foundry和TD的区别)。她不仅一条条地教我如何应对,而且细心地帮我补了统计学在生产中应用等基本常识。Die to Die,Wafer to Wafer, Lot to Lot, Batch to Btach Variation就是这一次受挫时她教给我的统计学常识。


作为一个物理学博士,而且做过两年多的博士后,我应该预料到Bob问的问题,但我完全没有。为什么?回想起来,应该是集体思维模式。我们当时的聚焦点,不是认真考察机器是否更好,而是花在了如何顺利通过。这次的教训,终身难忘,而且受益终身!我现在的每日一题,让学生们屡屡碰壁,就是要帮助他们形成好的学习习惯。


我反对应试教育,提倡学习兴趣和习惯的养成,和这件事情,虽然没有直接的关系,但二者本质其实是一样的。


紧接着的第三个星期三,天助我也。Bob不在,会议主席是Simon,他是前端的集成小组组长。十五秒钟就通过了,让我如释重负。但也有些遗憾,没有机会领教Bob的刁钻问题了。


事后,我直接了当地问Joe,为什么大家都没有提醒我?结果多耽误了一个星期。Joe告诉我,第一,Bob为整个项目负责,不会在意CMP的产能。多一事不如少一事,反正WestTech的机台还跑得好好的。第二,你是一个新面孔。对新工程师严格,是TD的一个惯用做法。他要看看你到底有什么水平。


原来是这样,没有人事先告诉我!


这并不是事情的结尾。回到办公室,我就给Bob写了一封电子邮件,感谢他对我如此严格。“如果没有你的问题,我不可能有这么好的机会学习统计学,并系统理解各种微扰因素在生产中的重要性。”


这件事后来又有续篇。一年以后,Joe当了小组长,他负责的STI没有交给我,而是交给了一位以色列厂临时来受训的工程师。有一台机器的STI制程验收,这位以色列工程师在Bob面前的报告非常不好,被打回了。接着他就去度假了,把任务转交给了我。在这位工程师去度假前,我向他了解基本的情况。我又花了两周把数据弄齐,就去Bob组织的一个特别会议做报告。那一次去了3个人做报告,都是被打回去补数据的,审核就Bob一个人。没想到,Bob又来了一招,“你们有谁敢把badge(工作)和paper(报告)绑在一起?”我想都没想,就把名牌往桌上一扔。这有啥了不起?没想到,这位老兄笑着对我说,“你过了,走吧!”根本就不需要做什么报告。


一个那么严肃的事情,在Bob这里,居然这么简单?是的。呵呵,我终于在他那里彻底过关。


为什么我这么自信?因为我们这次只不过是把Mirra上正在使用的制程搬到一个新机器上,风险很低。没想到,那位工程师把有问题的数据一块儿附上,自己找抽。而Joe作为他的师傅,可能因为太忙没有仔细看他的报告,才有了这一件多余的工作。不过,得到Bob肯定和认可,是我的真正收获。


在本文提到的所有人物中,我和Bob工作的时间最少,所有对话加起来不超过15分钟。但是他对我的影响,主要是在做事原则上的影响,是他人难以替代的。前文中提到的复旦毕业的那位工程师小黄,看到的就是在我身上展现的Bob。可惜的是,中国教育系统培养的学生,绝大部分是无法适应这样真切而且刁钻的问题的。


知道Bob的人不多,但他手下的两员大将,负责前端的杨士宁,和负责后端的白鹏,如今可以说是中美半导体制造业无人不晓的人物了。Simon作为全球第一个实现铜制程量产化项目经理,受张汝京博士之邀2001年从英特尔来到中芯国际,把中国和美国的研发能力缩小到了一代之差(不含量产能力),白鹏则留在英特尔,做到了Bob过去的老板的位置。从我个人而言,能够和这些人共事,不管多苦多累,实在是一件值得感恩的幸事!


七、防不胜防的各种事故


Mirra机器验收,STI和ILD的制程验收,生产线上每一道工序过关,我都驾轻就熟了。下一个挑战是什么呢?Excursion!


查了一下百度,这个词的意思字典里居然没有。Excursion指的是事故,它不是人为造成的问题,而是生产过程中发生的来历不明的各种问题。在我刚刚把制程的头绪理得差不多的时候,一个简单的问题出现了:Mirra研磨头的可靠性出了问题,晶圆弄不好就会掉下来,导致破碎。破了一片晶圆已经是大事儿了。破片之后换Pad(研磨垫),预备研磨垫能够用于生产的时间至少要3到4个小时!这在平时,至少是几万美金的浪费。而到了机台不够用的紧要关头,那给全厂带来的可能是上百万美元的损失。


这个问题本来是设备工程师的事儿,并不在我的职责范围之内。但是我们的设备工程师,是一个绝佳的问题二传手。只要一出问题,就打电话给应用材料的工程师,让他们来解决。这一来,机器不就要等8个小时吗?生产线的晶圆要通过啊!折腾了一个星期,还是没有结果。纵使是从他们湾区总部飞来救援的工程师,也是一筹莫展。毕竟,这些事情过去从来没有发生过!


我们制程工程师,真的是有苦说不出。因为只要一出事,他们就来做例行“抢救”,测气压、换零件、还有测试研磨头上不同的橡皮膜。这些补丁,不仅没有改善,反而因为生产线上的停顿而显得越来越严重。该换的都换了,没有什么改善,这究竟是怎么回事?


终于,我实在看不下去了。我把所有发生问题的数据都一一核对(手动的记录),没有看出任何规律。但是既然能换的都换了,能查的都查了,还是那样随机,那问题一定是出在研磨头上。因为数据告诉我,不出问题的研磨头,一直都不出问题。


我把我的想法和Chi-hwa说,他说,那你就负责吧。那个设备工程师还好说,不再会觉得我抢了他的工作,因为这些天来他一直处在煎熬之中,我愿意帮忙,他正好求之不得。我没有信心的是和生产线上的技工沟通,我和他们不熟,不擅长与他们沟通,刚开始对设备和零件的名称我也说不上来。


这下好,我不仅白天看他们完成每一个步骤,晚上吃完饭以后还要从家里来工厂,看他们如何组装研磨头。几次下来,我们实施的第一个措施是,只允许资深技工组装研磨头,每组10个技工里,挑选3个人专门就干这个活。


果然,晶圆掉片率急剧下降。我们找到原因了!设备工程师和应用材料马上跟进,不再用传统的螺丝扳手拧螺丝,而是规定了每一种螺丝拧紧的力矩。结果,一个困扰我们的问题就这样轻而易举地解决了。我和技工的关系因为这一次的合作也得到了质的飞跃。


类似的问题在生产线上是家常便饭。只要尝试几次后搞不定的问题,最后都落到了我的头上,那一年,我基本上是变成了Excursion Engineer,而不是Process Engineer。


我的这个能力是从何而来的呢?除了喜欢研究数据,爱动脑筋的自身因素外,不能不提到我的父亲。他在造纸行业就有这种只要眼到,问题就无处隐身的能力。而且他提出的解决方案大都是远离经院学派,弄几副“草药”就能解决问题。没有想到的是,如今在学米屋,我对待厌学的小学生,也有了这种本领。当朋友问我是不是做教育时,我一概回答不是。我做的是学习习惯的培养,学习能力的诊断与提高。


再举一个小问题的例子。任何批次处理的晶圆,都有第一片晶圆的问题(first wafer effect)。只要在标准范围内,没有人会去搭理。有一次我比较有空,注意到了这个问题。这究竟是什么原因呢?我就带着这个问题去看第一片问题究竟是如何被处理的。不看不知道,一看原因就一目了然了。原来,第一片晶圆开始时,Slurry(研磨液)管子里流出的有点稀。而后续的晶圆没有这种情况。所以我们的工艺就增加了一段空留Slurry的时间。果然,虽然还有差异,但问题大大减小。


这样的小问题处理了许多,我一般最多只在周报里提一下。99年写年终总结时,Chi-hwa已经是我老板的老板了。我请他帮我改改我的总结。他第二天就过来对我说,你要把这些问题的贡献量化。在别人嘴里,都是说,要敢于吹嘘自己,在Chi-hwa那里,只是“量化”,没有一个多余的字。


呵呵,对只懂得看分数的中国家长,我如何量化从厌学到有学习兴趣?分数越来越高,但厌学程度也随之增加,这样的学习有意义吗?这仍是一个世界级难题啊。


回过头看,我当时不会量化自己的贡献,根本原因,是没有整体观和大局观。别人聊天时经常说的是,要去Litho、Integration等重要岗位,我基本上是把它当成耳旁风,觉得这样已经很好了。而且,我后来跟技工的关系非常铁,他们知道我会为他们考虑,跟我做革新或验收,能够又快又好,而不是累而无功。说实话,在这种工作环境下我还是挺满足的,不会去想什么弯道超车之类的事儿。


八、背水一战


就这样忙前忙后地干到了1999年4月。在每年提薪后的例行沟通时,我问我的老板Joe,我什么时候可能升一级。他直言不讳地回答说,你管的是一个相对轻松的工段,没有什么可见度,明年也希望不大。我觉得也挺在理,就没有再往心里去了。Excursion解决了不少,但都是没有办法量化的。随它去吧。


5月31日,生产线上出了一点小问题。STI Polish的晶圆发现了几道划痕,影响不知道有多大,整个生产线因此停了(Line Down)。负责STI的那个以色列工程师刚好又在夏威夷度假,Joe让我代管一下,这之前是他自己兼管的,因为Joe是那个人的师傅。没想到,问题比发现时要严重得多,每一个Lot都有几片晶圆出现划痕,划痕的程度长短各异,完全不知道是什么原因。


我几乎天天守在生产线上,拿出浑身解数,就是找不到原因。8日,那位以色列工程师回来了,我准备交还给他。没想到Joe对我说,既然你已经开始了,就继续管吧。呵呵,STI平时不给我管,问题出来了,我就成ICU医生了。


类似的问题过去从来没有发生过,STI划痕的数据过去也没有收集过,影响还这么严重,到底是什么原因造成的?最有可能的原因当然是Slurry(研磨剂),以往我们每半年做Slurry管道维护时,经常是因为划痕而无法恢复生产。我们做了许多实验,没有结果。也检查了脑力激荡能够想到的各种原因,做了无数个测试,都没有能够找到原因。


到了6月24号,有划痕的产品到了终点,完成了测试,良率和eTest数据与没有划痕的晶圆没有什么区别,我才终于松了一口气。在这过去的三个多星期里,我没有睡一个好觉,安心地吃一顿好饭,7天24小时,随时会被叫到厂里,给出停机还是继续开机的判断。更为奇怪的是,这时候划痕问题也不知不觉地消失了。


就在我们把划痕的标准适度放松但仍然继续监控的时候,从D2(CTD)传来了一个令人兴奋的消息,他们的Poly Polish也出现了类似的问题,而且,他们找到了划痕的原因,研磨垫出了问题。我们马上和生产研磨垫的厂商联系,他们似乎早已经准备好了,建议我们某个批次到某个批次的研磨垫暂时不要使用。


把应急措施都做完以后,我们进入了问题的解决阶段。我至今仍然记得Joe在电话会议上对那家公司的副总和数位总监所说的话:你们的问题导致了我们的工厂四个星期无法正常生产和研发。而我们下游,有两个厂等着我们做技术交接和生产。保守的估计,你们的问题给我们造成了四千万美元的损失。


Joe的态度和语气,是我认识他将近三年以来第一次这么严肃。作为TD的一个小组长,仅仅管着5到6个工程师,对研磨垫公司副总和总监说话的口气和气势,让我觉得自己目光短浅,只知道忙着解决问题,没有理解我自己工作的价值和意义。呵呵,明年的总结应该好写了!(注:这段话是事发19年后的调侃而已,不要当真)


会议决定,由我11日飞去他们在特拉华州的工厂,听取他们的汇报,检查他们存在的问题,并拿出解决和根除问题的方案。


说实话,我当时被Joe说话的口气震晕了,更被这个决定弄懵了。我一个负责ILD0的小小制程工程师,要负责这么多的事?说实在的,Pad是不是“罪魁祸首”,当时我们手头没有任何数据,能够证明一定是他们的问题。


于是,我的工作内容突然变了,我要代表英特尔TD去一家公司,帮助他们解决问题。我仍然清晰地记得,7月10日下午四点多,我在公司准备完材料后,迎着美丽的夕阳开车回家,打电话给Joe,“我能不能给他们看我们的划痕图啊”。“要的,要的,要让他们知道问题的严重!”这个电话说明,我当时心里没有任何章法,因为我从来没有和外面的公司打过交道,更没有单独处理过这样大的一件事。


7月11日星期天一大早,我就从西海岸的俄勒冈飞到了东海岸的特拉华。周一一大早就去了那家公司。他们来参加会议的是一个副总,三个总监,规模相当高。后来才知道,出席会议的人中没有厂长,因为一周前已经被解职了。


我简明扼要地讲述了我们发现的问题和所处的困境,因为我讲了太多次,早就能够倒背如流,不到20分钟就讲完了。他们就开始把他们的流程一一介绍,然后含蓄地讲到了他们的问题。我们使用的所有问题研磨垫,是在三月份生产的,而那时候,他们的工厂正在扩大装修。装修施工的时候,他们依然正常生产,施工的地方,离生产的地方只有50米左右。他们采取的防范措施,就是在中间隔了一个布帘。呵呵,装修的尘埃,飘落到了研磨垫里,就像在柏油马路的柏油里嵌入铁钉,能不出问题吗?


原来如此!


0.18微米的半导体工艺,其研磨垫,就是在这样的环境中生产的?这个公司搞研发的博士们,以及平时口若悬河的总监和副总,甚至英特尔自身管材料部门的资深经理们,怎么可能让这么低级的错误发生?打一个不恰当的比喻,这就像把地沟油食品端上了国宴的餐桌!


这就是事实,也是我参加工作后最痛苦的一段亲身经历。解释CMP是半导体生产工艺中最不成熟的工艺,没有比这个例子更贴切的了。


原因找到了:我们生产晶圆是在超净车间,他们生产研磨垫就在普通的空间。这还不够,他们施工的时候,没有采取有效地防范措施,把大剂量的粉尘灌进了研磨垫,造成了我们的巨大损失。从那以后,我不再相信逻辑了。什么事情,都需要实证!


吃中饭时,他们做研发的总监一个劲儿地对我解释说,他们的母公司原来是生产衣服染料的,对半导体行业没有经验。以前他们说的话,母公司领导不重视,这一次事故,应该让领导们开始认识到研磨垫是电子行业的精密原件了。


下午,我们一起审核为了避免类似问题应该采取什么措施。他们为了表明他们的决心与诚意,真的是下了大血本。以前一百片研磨垫留一到三片研磨垫备份,现在每十块就留一块。原来是肉眼在灯光下检查,现在要增加几种方法同时检查。最让他们心疼的是,他们有一台简陋的CMP机器,以前只用于研发。现在对每一个批次的研磨垫,都要用晶圆测试。研发总监对我说,对英特尔,做这件事算不了什么,对我们来说,是在磨金子啊。是啊,他们要买晶圆,要买研磨剂,把这作为大规模生产的检测手段,这样做真的是无法想象。但为了表示自己的重视程度和决心,他们不得不这么做。而我呢,为了帮助他们吸取教训,煞有介事地肯定了他们这样做的积极意义。


其实,他们生产的研磨垫,在相当一段时间内,在生产线上我们都会在换研磨垫时严加防范的。他们这样做,象征意义大于实际的作用。但为了让他们吸取教训,这个学费是必须有他们来付的。


回到TD后,我在质量会议上给了一个简单明了的报告,这是我第一次,也是唯一的一次在TD质量会议上做报告(因为一般去的人都是因为自己闯了祸才去汇报的,我在TD三年半,没有闯过一次祸)。汇报简单而顺利:


1) 找到了问题的原因:三月份施工


2) 问题的原因已经不存在了;而且工厂及员工的新制造标准已经建立并实施,可以防范任何类似问题导致的不良后果


3) 在未来的三个月里,生产厂家仍然处于一级戒备状态,确保不会因为施工以外的其他原因给我们带来任何麻烦


4) 我们生产线上也增加了新的监控手段,有了关于划痕的通过标准;英特尔的材料部门则会定期检查他们


5) 一个月以后他们的高层还会来英特尔做一次汇报

 

一个月以后,他们的两个副总,两个总监要来TD汇报。我马上找到我们部门的领导Jerry Marcyk,当初雇我到TD是他拍的板。说需要他的半个小时和要来的高管握握手。他非常高兴地对我说,“Of course. I will be there. Changnian, you did a great job.”


五月底事故发生后的一个多月里天天上班,天天睡觉不到五个小时的疲乏感,以及两个多月和方方面面打交道的操心费神,都因为领导这一句简单的话和切实的行动支持,转化成了一种个人的满足感与自豪感。这种自豪感和Chi-hwa最初说的那句“新工程师的价值是负的”有关。我第一次觉得,从今以后,我和英特尔的关系,应该不再是负的价值了。而且,我终于对得起当初给我发的三个月的$250奖金了。


在国内的传统文化里,很可能就像现在家长对孩子一样,质问手下你为什么没有做得更好?对一线的工作人员缺乏尊重,是我们管理上的根本缺陷。什么时候这一切改变了,我们的半导体工业才可能赶超。否则,一个个事故袭击过来,没有哪个企业能够生存下去!大规模生产,需要的是各部门的精诚合作,包括上下游不同公司的合作。


九、结语


虽然只有不到3个月,这一次事故的经历,就像自己行过了一次死荫的幽谷,是我人生中经历的一次重大考验。因着自己的感恩与敬畏之心,我没有退却,而是通过和同事与同行们一起努力合作,使问题得到了圆满的解决。我自己的个人能力,也因为这次事故而大大提升。


有人说,半导体行业,就是一年之后有一半的人坚持不下去而倒下去的行业。我自己做了13年半导体后转行创业,现在记下自己当年起步的经历,或许能够给现在步入职场的年轻人有一些帮助,也作为燕园学子给我的母校北京大学120年校庆一个交代。


2018.5.2 初稿 - 2018.7.1 第5稿


梁昌年读本

梁昌年:高考之前,唠唠考试这回事儿

"老师没教过, 老子没做过! " 这类员工太多了


本号获作者许可转载



喜欢小号,

就摁下识别二维码吧


相关阅读

吴敬琏:不惜一切代价发展芯片产业是危险的

一个海归工程师眼中的中国制造"七宗罪"

施一公:中国人的创新能力去哪儿了?

鼓励创新就要包容那些离经叛道的人

张维迎:创新说到底就是自由

朱学勤:美国强大是因为有真正的大学




记录直白的历史

讲述真实的故事

  长摁二维码  

加盟新三届

我们不想与你失联

备份新三届2

   余轩编辑、工圣审读

征 稿


新三届公号向新三届朋友征集稿件

主题一:新三届人的高考之路

主题二:新三届人的大学时光

主题三:新三届人的文革经历

主题四:新三届人的上山下乡

主题五:新三届人的当兵岁月

主题六:新三届人的爱情故事

主题七:新三届中的菁英人物

主题八 新三届人的职业生涯

主题九:新三届人关注的话题

来稿请附作者简历并数幅老照片。

投稿邮箱:1976365155@qq.com

联系人微信号:james_gz7

联系人电话:13570472704




详情点击“阅读原文”

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存