陈 曦
走进胡清华的办公室,立刻被他满屋子的书所吸引。这些书的种类既有专业类书,也有哲学类、文学类书,甚至还“藏”着几本金庸小说。放松的时候,这位天津大学智能与计算学部教授兼人工智能学院院长,就爱读读武侠小说。
“我觉得知识是相通的,不要给自己设定边界,要对新事物保持好奇。”这是胡清华常对学生说的一句话,这也是他的科研准则。
从动力机械到人工智能(AI),10年前,不给自己设限的胡清华,以跨界者身份走进了这一如今炙手可热的领域。
近年来,胡清华一直在不确定性建模领域深耕,他希望从“不确定性”中寻找“确定性”,从看似无规律的数据中发现规律。“我的工作主要是研究算法,从一些低质量的、杂乱的数据中找寻规律。”他说。
前不久,2019年度国家杰出青年科学基金项目评审结果正式公布,胡清华申报的研究项目“不确定性人工智能”名列其中。
从动力机械走向人工智能
胡清华出生在湖南省娄底市双峰县,小时候,书是他最喜欢的“玩具”。“我每次去亲戚家串门,第一件事就是找书看。找到一本书就躲进角落读,完全忘了外面的热闹。”他说。
上世纪80年代,胡清华家乡的图书、报刊很少,多亏在外地上大学的叔叔每次放假回家带一大摞书回来。从那时起,胡清华就向往上大学,“因为能有看不完的书”。
1995年,胡清华考入哈尔滨工业大学,学习动力机械专业。“作为一个地道的南方人,我跑到东北去上学,只是因为语文课本上一篇课文,把北大荒描述得太美了,让我对那里充满无限的想象。”他笑着回忆道。
上大学时,胡清华的专业学习主要围绕火力发电厂的锅炉和汽轮机。当时,随着发电机组向大型化方向发展,对设备可靠性的要求也日益提高。发电机组开始安装上各种传感器,实时采集大量数据,用于设备的状态监测与故障诊断。
“读研时,导师希望我能开发出算法,以自动分析这些监测数据,判断设备的状态。我发现这项研究很有意思,从生产数据中寻找规则、建立模型,然后用模型判断、预测设备状态。现在看来,这属于人工智能范畴,但当时自己并未意识到这一点,从事相关研究的人也不多。尤其在动力机械领域,这还是很前沿的方向。”胡清华回忆道。
如果说,此时人工智能在胡清华心中,还只是个火种,那么把它变为熊熊大火的,是他参加的一个学术会议。
2000年前后,中国科学院发起“龙星计划”,邀请一批在美国学术界已有一定成就的华人教授,不定期回国在某所大学,系统地讲授一门美国研究生课程。“在那个年代,数据挖掘就像现在的大数据一样时髦。2002年暑假,数据挖掘领域的顶尖学者韩家炜来北京大学授课,在课程快结束时,他还请来了在欧美大学任教的多位学者作报告。”胡清华说。
当时,还在读研的胡清华,就坐在台下。“这些平时只在论文中才能‘见’到的学者,面对面给我们讲授数据挖掘知识,实在太震撼了。”从此,他开始把研究领域从动力机械慢慢延伸至模式识别、数据挖掘。
“不务正业”助其顺利完成跨界
虽然跨界到人工智能的想法,已在胡清华脑中酝酿多时,但他“并不急于一步到位”。
在硕博阶段,胡清华依旧围着“老本行”动力机械转,但在研究过程中他应用了大量人工智能知识,并将相关成果写成十余篇论文。
此外,胡清华还阅读了大量与人工智能相关的书籍和文献,也常去参加学术会议。为更好地向同行学习,他甚至申请担任了南京大学BBS小百合数据挖掘版的版主,定期在网上组织学术讨论。
“其实,很多论文的原始想法,都源于和网友进行的讨论,可以说很多灵感都是碰撞出来的。”胡清华笑着回忆道,当时周围人觉得他在网上组织讨论是“不务正业”,但如今想来,恰是这些经历,让他更顺畅地实现了跨界。
经过漫长的酝酿期,直到博士毕业后,2009年去香港理工大学做博士后研究,胡清华才算正式迈入人工智能的大门。
其实,早在念本科时,胡清华“不务正业”的本性就已显露。
大二时,胡清华当上了校报记者,还长期为校刊《哈工大人》写专栏。“起初,写稿是为了赚稿费,拿到稿费后就可以去买更多的书。后来自己慢慢喜欢上了写东西,不写不成。”他回忆道。
无心插柳,让胡清华没想到的是,经过几年的新闻语言训练,自己的写作能力得到迅速提升,语言表达更加精准、有力,这对他后来的科研工作帮助极大。
“很多理工科学者最头疼的,就是写论文、写申请、做报告,由于之前积累的笔头功夫,写论文对于我来说,非常轻松。别人可能需要一个月才能完成的论文初稿,我不到一周就可以写好。在恶补人工智能领域相关知识时,对文字的驾轻就熟,也使我的阅读理解速度快过旁人,一些大部头的书,我有时一两周就能‘啃’完。”胡清华说。
一些人工智能学界的同行表示,胡清华清新的文风、简洁的语言风格,使他写出的论文更易被人理解,学术观点也更易被同行接受。同时,这样的语言风格也有助于提高其文章的引用率。
“当版主、记者,在当时,这些都是我的兴趣,可能看上去有些‘务不正业’,但我一直觉得,学习是触类旁通的,你永远不知道,不经意的积累,会将你的人生引向何处。”胡清华表示,他也常对学生说,要珍视自己的兴趣,它是“你科研路上最好的老师”。
在不确定性建模领域深耕10年
兴趣是最好的老师,但仅凭兴趣,并不能让胡清华在人工智能这个新领域开疆拓土。
2011年底,胡清华结束了在香港理工大学的博士后研究工作,进入天津大学。入职后,他接到的首个项目就极具挑战性,胡清华与博士生导师一起获得“国家重点基础研究发展计划(973计划)”课题的资助,开展“新能源不确定性建模”方面的研究。
胡清华介绍道,这个研究围绕电力系统中的太阳能、风能展开。“这部分能源有点‘不靠谱’,大规模利用它们时,可能会破坏电力系统的稳定性,降低供电质量。只有摸清这些能源的‘脾气’,才能让其为我所用。”他说。
对胡清华来说,新能源不确定性建模,是一个完全陌生的领域。从查资料、读文献,到收集数据、分析数据,胡清华的“拓荒之路”走得异常艰辛。
但几年努力下来,“门外汉”胡清华,硬是在该领域闯出了一片天地。“为提升风功率预报的精度,我进行了大量的建模工作并设计了众多算法。在此基础上,风速难以被确定等难题被逐步破解,风功率预报的精度随之得到提升。”他说。
2016年,这个项目顺利通过了验收,他所在的课题组被评为优秀。在一般人看来,此时研究也就该结束了。然而,胡清华“并不想就此收手”。
“围绕这一项目,还有很多东西可以挖掘,所以研究不仅没有结束,而且才刚刚开始。”在胡清华眼中,这项研究属于数据不确定性建模研究范畴,而这类研究是机器学习和数据挖掘领域的难点。“大数据时代已经到来,在利用大数据方面的最大问题就是,数据质量的不稳定。质量低下的数据,可能导致基于数据的决策出现重大偏差。”
于是,胡清华组建起一支20多人的团队,向着一个个数据不确定性建模难题,发起冲锋。从新能源的不确定性扩展到大数据的不确定性,胡清华率队从工程应用研究中发现基础研究问题,再将基础研究成果应用于工程领域,实现了科研的良性循环。
经过近10年的开疆拓土,胡清华对不确定性建模研究,有了更系统的认知,逐渐意识到这是座处在交叉学科领域的科研“富矿”。今年,胡清华获批的国家杰出青年科学基金项目,依旧是瞄准不确定性,从数据的不确定性向建模任务的不确定性延展。
“未来,我计划将团队研究的算法,应用于天气预报、森林火灾预报以及大型装备故障预报等领域,希望成果能有更广阔的应用空间。”胡清华说。
关键词: AI