智海观察

中国AI研究者希望延续全球分享的文化

2010年的某一天,计算机科学家唐杰接到了一项特殊的任务,他清华大学的领导派他去美国结识一位享誉全球的人工智能专家。

 

唐杰教授说:“领导层当时想请一位图灵奖得主给我们系做评估,帮助把我们系建立成一支全国乃至世界一流的研究队伍。他们听说过康奈尔大学的John Hopcroft教授,但没有人真的认识他。”

 

 

系里的领导认为唐杰是结识Hopcroft教授的不二人选,因为唐杰的研究方向是社会网络的用户行为,与Hopcroft的非常相似。就这样,唐杰与同事杨士强不远万里来到美国康奈尔大学,邀请Hopcroft教授去北京。

 

唐杰回忆道:“Hopcroft教授非常友好,还请我们去他家用晚餐”。就在几个月后,Hopcroft与一支由国际专家组成的团队开始为清华大学的计算机科学家出谋划策,帮助整个院系提质升级。2011年,唐杰教授以访问学者的身份再次回到了康奈尔大学,并与Hopcroft教授展开了合作。

 

这样的合作佳话现在已经很少听到了。九年之后,清华大学的计算机科学与技术系不再徘徊在边缘位置,仰赖外界帮助了。在2019年的《美国新闻和世界报导》计算机科学专业全球大学排名中,清华大学计算机系跃居榜首;不仅如此,它还是2013-2016年全球大学数学和计算领域引用量前1%论文的最大贡献者(见go.nature.com/2pvdka7)

 

中国发表的人工智能论文数量已在2006年超过美国,目前仅排在欧洲之后。2007-2017年期间,中国的人工智能论文数量从5995篇增长至15199篇,几乎是原来的三倍。

 

 

“在当时,排名靠后一些的国内院系的科学家不太会有我这样的机会,”唐杰教授说。“我是指去国外寻求合作的机会。不过,现在的中国开放程度越来越高了。所有大学都设有国际处,都在想办法与其他国家合作。”

无问西东

上世纪九十年代末期,美国计算机公司微软(Microsoft)设立了微软亚洲研究院,并聘用当地的计算机科学家。从那时起,中国的人工智能研究环境不断得到外国专家的支持。中国的电商巨头阿里巴巴、电信运营商华为以及亚洲最大的科技公司腾讯,这些企业的高管几乎全是微软亚洲研究院走出来的。李开复曾在1998年创设了微软亚洲研究院,后来加盟了谷歌中国(Google China),担任谷歌中国区总裁。李开复2009年离开谷歌自立门户,创办了一家风投公司。

 

虽然有这样的背景,中国的人工智能研究还是被卷入了政治问题。中国在2017年出台了一项规划,宣布希望在2030年成为人工智能的全球领跑者,这一国家战略让他国政客对中国抢占技术高地的潜力忧心忡忡,美国的政客尤感如芒在背。

 

就在规划出台前,部分高科技经济体的领导人已经在担心,他们说中国要求外资公司转移知识产权换取国内市场的做法会危及国际关系。

 

 2018年,美国总统特朗普正式对818个类别的中国商品施加关税,其中包括实验室设备和试剂。从那时起,美国政府开始对人工智能等敏感领域的中国科学工作者设置重重障碍,比如缩短研究生留学签证的居留时间。不仅如此,美国的一些研究院校还限制了其科学家与华为等中国企业的合作。

 

中国的计算机科学家每天都可以感受到由此带来的工作影响。南京大学人工智能学院院长周志华说,我们不断听到签证申请被延后或被拒的消息。今年2月在夏威夷举办的人工智能促进协会年会上,“许多中国的研究人员由于未能及时拿到美国签证而无法出席”,他说,“这意味着他们的同仁,包括美国的同仁,都没有机会看到他们展示最新的研发和发明成果。”

 

中国科学院计算技术研究所的陈云霁研究员指出,人工智能的研究文化与当前的政治氛围构成了鲜明的反差。

 

“人工智能研究关乎开放和速度。如果你不与别人分享你的成果,你的工作就毫无意义。因为你的成功是由全球有多少人下载并使用了你的算法或代码来衡量的。此外,研究也要立即发表,不然别人就会捷足先登。”

 

他表示,人工智能的研究人员会在arXiv和GitHub这类开放网络平台上向全球读者实时发布自己的算法、代码、数据和结果,让别人可以找到并加以利用。“我相信合作比竞争更重要,我提倡加强合作。我认为中国、美国和欧洲的人工智能科研圈并不存在真正意义上的差距。我们会相互探讨一些前沿的新技术。这么做能实现共赢。”

 

 

 

 

2016年,陈云霁在研究结果的基础上创立了寒武纪(Cambricon)——一家总部位于北京的先进半导体芯片制造公司,旨在推动人工智能驱动的技术应用在手机和服务器等设备中。据陈云霁介绍,寒武纪目前的估值在30亿美元左右。

 

陈云霁仍保留了他的学术身份,他说自己致力于将人工智能研究所倡导的开放理念发扬光大。在谈到如何让研究成果能被全世界共享时 ,他引用了清华毕业生贾扬清的故事。贾扬清在加州大学伯克利分校的伯克利人工智能研究(BAIR)实验室攻读博士时开发了Caffe——一个开源的深度学习框架。陈云霁随即指出,Caffe并不在任何国家的数据库里,也不在付费墙的后面,而是公开放在GitHub上。

 

这是一项非常重要的成果。它在GitHub上已经被下载了几万次。中国和美国的研究人员都会基于这个框架编写自己的深度学习应用,”陈云霁说,“这才是人工智能研究正确的打开方式。”

如何实现跨国合作?

人工智能领域的教授们擅于开辟线上或线下的非正式合作方式。虽然我们很少看到由中国与别国政府共同资助的研究项目,但可供研究人员合作的渠道其实一点也不少。正是这些跨国合作,催生出越来越多由中国作者与国外作者共同署名的论文。

 

西安交通大学的人工智能与机器人研究所是中国最早成立的人工智能研究团队之一。研究所始建于1986年,先后与日本、美国、英国、德国和法国等国的相关院所建立了合作关系。前所长郑南宁院士说,西安交大创造了各种合作机会,无论是举办国际会议、聘请国外知名学者担任兼职教授,还是派遣青年教职人员和博士研究生去海外进行研究合作等等。

 

“人工智能模糊了物理现实、数据和个体之间的界限,同时也带来了复杂的道德、法律、伦理和安全问题。解决这些问题是一项全球性任务,”郑南宁说道,“我们必须加强国际合作。”

 

让科学家齐聚一堂的最简单的方式无外乎学术会议了。但就在10年前,主要国际会议上还看不到中国科学家的身影。时至今日,他们不仅会前往世界各地参加顶级会议,更开始将国外的研究人员邀请到中国来。

 

2017年,在陈云霁的组织下,第22届国际计算机体系结构支持、编程语言和操作系统会议(ASPLOS)在西安召开。陈云霁说,计算机科学的会议倾向于集中在欧美。“10年前,要说服组委会让会议落户中国非常难。如今,随着嘉宾名单上的中国人越来越多,组委会也同意将举办地放在中国。我们也创造了该会议史上参与人数最多、论文提交数量最多的纪录。”                    

博士++ 

2006年,清华大学的唐杰教授创办了AMiner,一个与谷歌学术(Google Scholar)类似的学术论文搜索平台。目前,AMiner上托管了人工智能研究员Michalis Vazirgiannis及其团队开发的一个算法。

 

Vazirgiannis是巴黎综合理工学院(École Polytechnique)的数据科学和挖掘小组负责人,唐杰与Vazirgiannis初识于2012年的一次学术会议上。从那以后,Vazirgiannis多次造访唐杰的实验室,他的一名博士后还在中国待了几周,帮助部署了一个算法,让Aminer的服务效率得到了进一步提升。

 

许多由国际作者共同发表的人工智能论文也是这类交流互换的结果。大学院校也会定期将博士研究生和青年研究人员派往其它实验室进行合作。

 

在计算机科学家邵岭的科研生涯中,他先后在牛津大学、谢菲尔德大学、诺森比亚大学和东安格利亚大学这四所英国大学工作过。正因为如此,在中英两国研究人员过去十年合作发表论文的引用量排名中,邵岭位列第四。

 

“作为一名教授,你需要不断地招收博士生,这也是我们工作的主要内容,”他说,“我来自中国,自然与国内多所顶尖大学都有联系,我会从这些学校招收学生,比如北京大学、中国科学技术大学、浙江大学和西安交通大学。”

 

2018年初,邵岭在阿布扎比成立了起源人工智能研究院(Inception Institute of Artificial Intelligence),并担任首席执行官和首席科学家。之所以选择阿联酋是一个偶然,得益于他与顶尖人才之间的联系。“我之前的两个博士生现在在阿联酋工作,他们不断告诉我阿联酋的人工智能发展速度有多快,于是我决定去一探究竟。”

风从东方来

随着中国高影响力的科技公司不断崛起,人工智能的研究规模乃至带给研究人员的机遇也与日俱增。如今,全球范围内的学术人员纷纷参与到中国互联网巨头资助的项目中来(见“技术支持”)

 

 

 

比如,Vazirgiannis一直在与腾讯开展机器学习方面的合作,腾讯旗下的微信用户数已超过10亿。Vazirgiannis说:“他们给我们数据,我们再用这些数据做研究、发论文。但我们不能直接发布这些数据,它们是有版权的。”

 

在2018年的神经信息处理系统大会(NeurIPS)上,腾讯在论文发表总量中排名第五,前四名分别是谷歌、微软、Facebook和IBM。

 

腾讯人工智能实验室的工程主管肖涵曾留学德国,并创立了德中人工智能协会(German–Chinese Association of Artificial Intelligence)。这家非盈利组织致力于构建中德两国的合作桥梁。“我们在认真推动研究成果的开放共享,”对此他表示,“腾讯资助的研究一般都发表在人工智能的顶级会议上或arXiv等开放平台上。”

共享陷入僵局?

浙江大学计算机学院副院长吴飞教授曾参与制定多项中国的人工智能发展计划。其中,2017年印发的《新一代人工智能发展规划》提出,到2030年,中国的人工智能产业规模接近1500亿美元,人工智能总体达到世界领先水平。

 

《规划》还鼓励加强国际合作。吴飞教授说:“如果只是研究某个算法或方法,那一个教授就够了。但如果想开展人工智能、神经科学和数学之间的跨学科研究,我们就有必要建立紧密的国际合作。”

 

吴飞还认为,人工智能所引发的伦理和安全困境必须通过多边力量解决。“人工智能所面临的挑战不是一个国家可以单独解决的。比方说,我们可以通过国际合作达成共识,不在大规模战争中使用人工智能武器。”

 

虽然吴飞知道中美之间紧张状况会影响项目合作,但他仍希望看到由两国政府联合资助研究项目以及研究机构,让双方研究人员可以携手合作。吴飞指出,如若没有国际合作,人工智能将会演变成一股“可怕的力量”。

 

“当务之急就是展开合作。我们不能为了避免竞争而关闭合作的大门。因为这么做只会损害全人类的共同利益。”

原文作者 Sarah O’Meara是一名常驻伦敦的科学新闻自由撰稿人。Kevin Schoenmakers也贡献了部分考证工作

 

原文以AI researchers in China want to keep the global-sharing culture alive为标题

发布在2019年5月29日《自然》Spotlight上

来源:《Nature自然科研》