日前,我院工业工程与管理系教授史建军老师在工学院应邀接受了旨在推广与应用统计学知识的网站“统计之都”的专访,分别从学术科研、研究方法、学生培养等方面谈及了自己的一些看法。
原文如下:
人物介绍:
史建军教授是工业工程领域的知名教授和学术带头人,现任佐治亚理工学院(Georgia Institute of Technology,后文简称Georgia Tech)工业工程系(后文简称IE,该系在美国连续28年专业排名第一)冠名教授,同时兼任机械工程系教授。目前也是北京大学工学院工业工程与管理系“千人计划”特聘专家。史老师开创了系统信息学和控制(system informatics and control)这一新的博士研究培养方向,是美国工业工程学会(IIE)会士,美国机械工程学会(ASME)会士,运筹学和管理科学学会(INFORMS)会士,国际统计学会(ISI)会士,国际质量研究院(IAQ)院士,也是美国INFORMS的质量统计与可靠性分会的founding Chair,曾获得 the IIE Albert G. Holzman Distinguished Educator Award 等重要奖项。他是多个国际期刊的编委,包括主编管理工程国际顶尖期刊“IIE Transactions”的 Quality and Reliability Engineering 子刊等。史建军教授是使用系统控制和多元统计相结合研究多工位误差建模与分析理论的创始人。他培养的博士生已经有二十几位在国际一流大学任教,其中有7名获得美国自然科学基金委NSF Career奖,1名获得美国总统奖,多名学生在工业公司担任副总或资深管理人员。史老师一直与工业界紧密合作,他的研究小组中开发出的技术已经应用到各种生产系统并带来重大的经济效益,被广泛用在了汽车组装、飞机制造、钢铁冶炼等诸多领域。史老师也是国内多处高校的客座教授,是中科院质量研究中心的创始人之一和海外主任,也是北京大学工业工程系的访问首席教授。
关于学术
“这个事真是个事,是正儿八经的事,你可以说我没本事把这件事情搞定,但你不能说这不是个事。”
——什么是好的研究课题
统计之都:史老师,您能跟我们首先讲讲,什么是一个好的应用学科?
史老师:我觉得要有三点,第一,要有研究的课题。这课题必须是实打实的问题、是真实的问题。这问题还没有很好的答案,但是一旦解决就有很大的影响。这是第一点。其次,要能获得资助,比如美国的自然科学基金,这说明这个课题有基础研究需求; 或政府的资助,这说明这个课题符合国家的战略需求;或工业界给资助,这说明有工业界迫切的应用。第三,这个学科培养的学生在学界、业界的就业都不是问题,而且工资还很高。满足这三条,我们就能说这是个好的应用学科。
统计之都:那怎么样才能找到一个好的课题呢?
史老师:在咱们工学院,搞出来的东西得有用。搞IE需要我们对现实问题有足够的敏感,需要了解工程背景和社会背景。我给你举一个简单的例子。刚才象宇说到了3D打印这个事情,我觉就跟咱们IE特别相关。为什么呢?比如我最近参与的一个课题是用3D打印机打发动机上的叶片。这叶片形状多种多样,所以3D打印机就特别合适。以前这叶片的材料性质都是有理论保障的。现在问题就来了,3D打印机用激光融聚特殊材质的粉末(powder)将叶片一层一层地打印出来,打印过程中激光也许会不稳定,我们怎么做在线质量监控,怎样在复杂的监测数据中(比如在线的视频数据)中发现事先没有定义的异常,怎么确保这个每一层的偏差能够得到足够的控制,就是一些质量控制的新问题,需要新的统计建模,质量控制,以及优化方法。另外,过去做发动机叶片的保养,需要各种零部件以及机器设备的吊装。这就需要建立一个供应链去最优化仓库的选择,哪些地方存哪些零部件,存多少。现在用的3D打印机,只需要粉末,也不再需要那些机器设备吊装,所以供应链的问题就很不一样了,比如3D打印机的位置分配,哪些地方放什么样的粉末或半成品,各种3D打印机的生产效率也不一样,这就给供应链管理研究的方向提供了一个新的思路,新的问题。
统计之都:您能谈谈您对最近国内很火的工业4.0以及大数据战略的看法吗?
史老师:首先说工业4.0这个概念,这是德国最先倡导的。中国版本是制造2025,美国不用这个词。美国说先进制造(advanced manufacturing)。两者内容很像。美国政府现在希望制造业回流,邀请了一些专家研究这个问题。我在其中的传感器监测和控制专委会。以前我们说,制造就是单纯造东西,也就是说的生产制造。对于生产制造,你们肯定听说过毛主席五六十年代说过的:多、快、好、省。今天的生产制造还是可以用这四个字来要求。多,就是生产能力(capacity);快,就是生产效率(productivity);好,就是产品质量(quality);省,说的是制造成本(cost)。
在现在的环境中,大数据是方法,不是目的。有了大数据,我们可以对生产制造的每一个环节建模,从材料到设计到生产加工到使用再到回收,我们可以研究怎么把信息都收集起来,管理起来,然后更好的做服务。这给制造业提供了新的机遇。另一方面,大数据的机遇,也导致了制造业的理念跟过去不太一样。过去就是造东西,要多快好省。现在成本越来越小,所以重点转成是怎么“管理东西、使用东西”。
我举几个例子。比如现在飞机的引擎,造出来之后,制造商是租给航空公司,而不是卖给航空公司。通过各种传感器,制造商可以在线监测他们管辖下的所有引擎,通过数据分析和工程背景知识,实时评估引擎的健康状况并作出诊断,并根据这种知识,决定最优维修计划。也就是说,现在的飞机引擎卖的不是产品,是服务,是全生命周期的服务。另一个例子,比如GE的大型发电机,造价也很高,现在GE也是卖服务。它把发电机租给大大小小的发电站,使用各种传感器实时检测这些发电机的各种性能和指标,通过远程通讯,将数据都传回来,就可以综合信息,整合利用,去支持他们监测、评估、诊断和维护。可以说,现在卖的产品不仅仅是产品本身,而是“产品 + 服务 + 维护”。要做好这样的模式,就需要大数据支持。
对IE的人来说,我们研究问题的角度也变了。以前关注的是产品的生产过程、加工精度、产品监测,现在就变成了全生命周期的使用过程。过去这不是我的事,不是你的事,也不是他的事,现在就都成事了。这个事真是个事,是正儿八经的事,你可以说我没本事把这事搞定,但你不能说这不是个事。你这样一想,你就会发现,现在的制造业思维方式不一样,产业结构不一样,商业模式也不一样,教授做研究不敢说能引领这样的转变,但是必须敏感,做什么样的研究去支持这样的社会转变,到哪儿找资助,成果到底由谁来使用,谁关心这个结果,我们都必须足够的敏感和认识。
“几乎所有世界上好的钢厂,比如中国、日本、美国、西班牙的钢厂,都在用着我们的算法。”
——史老师介绍其基于图像的过程监控的研究
统计之都:您能谈谈您最近在做的研究题目吗?
史老师:最近我主要在忙几个事。一个是跟飞机制造公司的一个项目,具体是一种复合材料组装的质量建模与控制。怎么对复合材料组装尺寸的误差方差(variation)建模,对误差在装配过程的层层传递建模,是我们主要研究的方向。另一个就是跟三星的一个项目,做的是硅片的镀膜。硅片生产要经过很多室(chamber),每个室里面有两百多个传感器。那么你看,每一个硅片生产过程大约有150多个室,每个传感器传回来的数据都是一个非线性时间函数(profile),怎么分析这些海量数据,怎么研究各种变量之间的相互影响的变化,怎么把这种变化跟制造过程中的参数对应起来,是一个很难的事情。这就是一个非常有挑战性的高维数据流问题。
另外一个事情就是纳米纸(Bucky Paper)的连续制造。在制造过程中,我们把很多纳米管放在液体里,打均匀了之后,放在“纱布”上,再用电磁场,把纳米管调整排序(align)好,确保它们调整好了就能获得很多良好的机械性能、导电性能、传热性能。在这个制造过程中,怎么做过程监测,怎么研究各个步骤之间的误差的相互影响以及“流动”,然后根据这样的模型,怎么用优化或者控制理论来减少误差方差(variation reduction),是质量控制研究的问题。还有一个事情就是基于图像的实时过程监控。现在的很多生产制造过程中,大量使用了图像或者视频去实时检测这个过程。那么,怎么用这种图像数据做实时检查和诊断,就是一个很好的研究问题。现在很多钢厂都有在线基于图像的过程监控。世界各地很多钢厂,比如在中国、日本、美国、西班牙的钢厂,都在用着我们的算法。
关于工业工程中的应用统计(Applied Statistics in IE)
“如果说应用是一个点,统计是一个点,那么两点中间就是我们工业工程中的应用统计。IE要搞系统,要解决这个接口。从实际应用出发,建立新的统计方法从而解决这个问题。如果理论功底足够好,还要能够研究这个新的统计方法的各类性质,为统计领域也作出贡献。“——IE视角下的应用统计学研究
“IE必须了解工程背景,社会背景。”
——IE研究工作的独特性
统计之都:您能具体举个例子说明IE里面搞统计研究的特殊性吗?
史老师:IE对传统统计的贡献比如质量控制,实验设计,可靠性分析,都是很好的例子。但IE搞统计跟统计搞统计不一样,统计的研究还是数据分析为主,IE的研究必须了解工程背景,社会背景。传统的SPC(statistical process control,统计过程控制)以及实验设计在八九十年代就已经成熟了。IE培养的本科生和硕士生主要是要会使用这些方法。对于要做研究的博士,就要更前瞻地去解决新的工程问题,这就需要能够发现并且研究新的问题。比如现在很多人做工程表面(engineered surface)的建模与分析,他们往往都是假设工程表面服从高斯过程分布,但是事实上,这些统计分布的假设都并不真实反映背后的工程实际,这就导致最后得到的统计结论也许并不能很好的在相应的工程背景下产生实效。事实上,这些工程表面往往不是高斯也不是平稳过程。那怎么解决这个问题呢?并且,在工程里面很多问题的噪声是依赖于工程问题本身的,有很多独特的噪声性质,怎么解决好这个问题不是学纯统计的就一定可以,也不是传统的IE可以搞定的。需要将工程知识和统计建模的能力结合起来。
史老师:说到这儿,我再王婆卖瓜自卖自夸一句。我08年1月去的Georgia Tech。去的当时主要是两方面感受。一是Georgia Tech的IE系非常的IE,有好几个传统的方向,连续28年NO.1。另一方面,系里的几个传统的方向都很强,比如运筹、统计、供应链都很强。所以我去了以后,就提出了一个新的方向,叫“系统信息与控制 (System Informatics and Control)”。因为在很多实际问题中,任何一个给定的系统,我们都有两方面知识,一方面是物理的知识,是工程相关的背景;另一方面就是有很多系统的运行数据,因为我们现在有很多传感器去实时监控整个生产制造的流程。在过去,对这些系统的建模通常有两种办法:一个是基于物理的模型。这种模型对我们了解这个系统,很有用,但是并不完整。它可以描述局部或者小的装置,但是难以扩展到整个系统层面。另一种方法就是数据驱动建模,在给定条件下可以拟合得非常好,但问题是,一旦运行的条件或者环境变了就不行了。所以,我们就要去研究怎么结合物理知识和数据驱动的模型去对系统进行建模、监控、预测、诊断和控制。这要求我们培养的博士有三个方面的专业知识:一个是数据分析,不仅仅包括统计,也包括计算机科学、信号处理;另一个是优化;还有一个是工程领域知识,比如你要做纳米或者做3D打印,就需要去其他系学习相关知识。
关于学生培养
“能不能走得远,德比才更重要。”
——史老师谈对学生的期待和要求
统计之都:统计之都的关注者中有很多学生,学统计的、非统计的都有。他们很想了解您是怎么选学生和培养学生的。
史老师:说一个人好,就是德才兼备。德是最重要,才是必要的。能不能走得远,德比才更重要。我希望我的学生去做一件事,即使未必能做的最好,但他必须自己希望做成最好,努力做最好,得有这个志气。人有了这股气,其他事情都没问题。做事情要是应付,那就不行。比如说,学生问“我这样是不是可以了”,导师说“行,可以了”,那学生就“哎呀,谢天谢地,终于可以了”,如果这样就不行。反过来,如果一个学生自己希望做到最好,那么讨论事情就是真正讨论事情,而不是花多大精力去激励他。培养每个学生都不一样,平常讲的“因才施教,因人施教”还是很必要的。总的来说,我觉得我看人比较准,我很高兴我的学生取得的成绩。在我毕业的28位博士中,差不多现在已经有21个当教授,美国工业工程的前10名学校任教的有八九个,还有几个已经当了冠名教授,我学生的学生也有二十大几个当教授了。我去工业界的学生也相当不错,有3人做了副总或资深管理人员。学生做的好,比我做的好更令我高兴!