以价值观为本:她力量系列五丨朱海一:以人为本,构建 AI 价值观


文章转载丨AI科技评论
作者:陈彩娴
“一个机器学习算法再先进,如果最终要在人类社会中落地,都是要考虑终端用户的体验与需求。”例如,一个具备人脸识别功能的智能锁最终是要为人类所使用,共享乘车平台所使用的派单优化匹配算法与司机、乘客相关,社交平台上的资讯优化排序直接影响用户阅读体验及对社会的感知,等等。在人工智能技术的落地中,算法所体现的价值观与技术同等重要。基于此,朱海一提到“以人为中心”的研究理念,重申了机器学习与人机交互研究的关系。
朱海一现任卡内基梅隆大学计算机科学学院人机交互系(HCII)Daniel P. Siewiorek 助理教授,深耕人机交互研究多年,是国际人机交互(Human-Computer Interaction)领域里为数不多的中国代表学者之一。她的工作曾 4 次获得人机交互顶会(CHI、CSCW)最佳论文荣誉提名,在线上/线下社区与人工智能的交互研究中作出了卓越贡献。朱海一的本科与博士分别毕业于清华大学计算机科学专业与卡内基梅隆大学人机交互系,是卡内基梅隆大学人机交互系录取的第一位中国大陆留学生,也是目前 HCII 少数(3位)华人教职人员之一,少数从CMU毕业、又回到CMU任教的校友之一。近年来,朱海一致力于结合人机交互与机器学习进行研究,希望从“以人为本”的角度弥补机器学习现有的研究缺陷。与机器学习算法、理论、优化等“硬核”学科相比,朱海一认为,人机交互是一个比较“软”的方向,但注重社会心理学、经济学与计算机的交叉研究,能够为人工智能研究带来新的研究问题、研究观点与解决方法。

1、北纬37°以北
2005年高考结束后,朱海一从苏州中学毕业,开始了她的北迁之旅。作为土生土长的南方女孩,她往后的生活地点却主要集中在北纬 37° 以北,北京、匹兹堡与明尼苏达。2019年回到CMU任教之前,她曾在明尼苏达大学计算机系担任 3 年助理教授。向北,似乎是她人生的必然走向:2005年高考,朱海一以707分(含特长10分)的成绩荣登榜首,成为江苏省自恢复高考以来的第十七位理科状元。成绩出来的当天傍晚,她便接到清华与北大招生办打来的电话,两所百年学府都希望她入学。


作为中国千万高考学子梦寐以求的顶尖高校,清北自然是状元们的首选之一。她更心仪清华实用的工科专业,比如电子,但18岁的阅历还不足以帮助她确定自己的目标。在清华老师的介绍下,她了解到数学物理基础科学班:大类招生,先学基础科学,两年后再自行选择数学、物理、计算机或电子等专业。朱海一对这种机制表示赞同。于是,2005年,她选择进入清华大学数理基科班学习,成为基科班的第一届学生。尽管数学成绩一直十分优秀(高考数学考了146分),她也十分喜欢数学,觉得“数学家特别有范儿”,曾一度想到清华数学系的周坚教授门下读博,但两年基科班学习结束分流时,朱海一却选择了计算机系,转到计53班。与抽象的数学研究相比,朱海一觉得,计算机更偏应用,与实际生活的联系也更紧密。“就像周坚老师说的,我们这种做数学的人就是研究外太空的事情,对现实生活基本没有什么影响。这也是劝退我的一点。”加上大一暑假学了第一门程序语言Java,朱海一觉得程序语言很符合她的思维方式,于是便毅然选择了计算机。朱海一很清楚,自己一直是喜欢离现实生活比较近的研究内容。在计算机中,既有计算机理论等与数学相似的抽象研究,也有人机交互等与现实结合较紧密的方向。“追求务实的研究精神”,也是朱海一最后选择了人机交互方向的主要原因。本科期间,朱海一跟着计算机系的蔡莲红教授、贾珈教授、林闯教授,以及工业工程系的饶培伦教授做科研,一共参与了随机博弈Petri网、普适运算的信息产品与信息服务设计和二维人脸表情编辑器等3个项目,其中,后2个项目的研究内容偏人机交互,这也增加了她对这个方向的研究兴趣。“所以我很感谢本科时候带我做研究的这些老师。如果没有他们,我可能不会走上学术研究的道路。”对朱海一来说,居住地的变迁并不难以适应。比如,刚到北京的第一年,她很快就适应了北方的生活:“我觉得北京的冬天太舒服了,到处都有暖气。那是我第一个没有生冻疮的冬天。”还有饮食:“第一学期觉得什么都挺好吃的,结果胖成了球。”在清华的四年,朱海一不仅获得多项学业奖学金,还担任团支书、文娱委员等职务。尽管清华学霸云集,但朱海一不会觉得来自同龄人的压力很大;同样,在清华,也不会觉得状元、奖学金这类荣誉有什么特别之处:“我也不敢说我是在学霸云集的环境中出类拔萃。我自己可能从来就不是一个特别关注这些的人,我也不会觉得大家都非常厉害,因为当时本科宿舍里,大家都是状元,市状元、省状元,没有什么不一样。”读高中时,尽管学业繁重,但朱海一依然保持着自己的兴趣爱好:兵乓球、中长跑、8级手风琴选手、单簧管、无线电测向(国家二级运动员)、爬山,“很喜欢在山里飞奔找电台的感觉。”上了大学后,她也照旧在清华园广泛探索,看书、听课、考试,没有什么压力,“现在回想起来,还是觉得大学四年很美好。”与高考一样,清华的读书经历给了朱海一一种自信:这些名片很清楚地告诉她,从某种意义上讲,自己在人生的某个阶段已经做到最好。她对清华同窗情谊的感受是单纯的:大家会相互帮助,是一种友好合作的氛围。舍友之间的关系特别好,同班同学之间的关系也特别好,学习上会一起讨论,生活中会一起玩。与当下人们对高校内卷竞争氛围的观察有较大出入。比如,在朱海一刚转到计算机专业时,既要补大一、大二的计算机课程,又要准备托福、GRE考试,准备出国申请等事情。而计53班的同学对她非常友好,在组队做作业的过程中,大家一起分工做项目,不仅能够从同学的身上学到很多,做项目的经验也非常愉快。以至于后来,在参加各类学术会议时,每次遇到清华上下N界的校友,朱海一总是觉得很亲切:“即使不直接认识,也必定有共同朋友。”尽管最终没有选择数学系,但周坚的科研思想对朱海一的影响是深远的。她记得,当时在基科班上周坚的数学课时,周坚在讲数学分析,突然对着台下的一群大一学生说:“做科研要有品味。”汉语同源的情感表达缺失,是朱海一如今教学生涯的一个遗憾:“因为语言和文化的差异,对着美国学生能讲清楚课程本身的概念内容就不错了,很难像周老师这样给以学生课程之外的影响。”再谈清华,朱海一的内心是感激的:“(清华)这张名片会一直跟着你,影响着之后的入学,工作和人际关系。特别感恩母校,能够让我在离开父母之后的那段人生中非常重要的阶段,从学业到人生都自由探索,野蛮生长。”

2、CMU:人机交互的起点
“我也很好奇他们为什么会招我。”
2009年本科毕业后,朱海一赴美留学,成为CMU人机交互系(HCII)录取的第一位中国大陆博士生。在申请该项目时,她既没有前人的经验可借鉴,也没有受过系统的人机交互学科培养。而且,HCII所招收的学生中,欧美学生所占比例一向高达80%以上。卡内基梅隆大学计算机学院包含七个系:计算生物(CBD)、计算机科学(CSD)、人机交互(HCII)、软件研究(ISR)、语言技术(LTI)、机器学习(MLD)与机器人(RI),其中,在成立于1994年的人机交互系里,中国留学生的比例一直“低迷”。据AI科技评论统计,自建系以来,从 LTI 毕业的华人博士生有 76 人,RI 有 61 人,MLD 有 44 人,而 HCII 只有 16 人;目前在读的华人博士生中,RI 有 52 人,MLD 有 30 人,LTI 有 29 人,而 HCII 只有 13 人。据朱海一介绍,HCII很少直接招中国本科毕业的学生。目前在读的12位中国博士生中,也仅有3位学生是从大陆院校本科毕业后拿到博士offer的。造成比例悬殊的主要原因,大约是中国在HCI领域的研究与教学不是那么普遍,因此,对中国留学生来说,这并不是一个受欢迎的项目,申请的学生较少,申请者中拥有HCI相关研究经验的学生也不多。相比之下,HCI在美国的发展非常火热,美国本土与欧洲院校的申请者也更多。在这种情况下,中国学生的申请优势并不大。在申博时,朱海一对人机交互的理解处于非常肤浅的层面。在写个人陈述时,她把所有能想到的、与人机交互相关的研究都写了一通,包括社交计算、计算机图形学、AR/VR等等,“当时就说我感兴趣这个那个、这个那个…”弄得HCII的招生委员会非常困惑:这位同学到底对啥感兴趣?幸运的是,招生委员会里的一位老师专门写邮件,问她到底对什么感兴趣。她跑去看这位老师的主页,看到Ta是研究教育技术的,“我就说我对教育感兴趣”,就被招收了进去。所以她当时是被当成研究教育技术的学生招进去的。进了CMU后,朱海一有了更多与老师接触的机会,对人机交互的不同研究方向有了更多了解,便将研究方向转到了线上社区交互,师从两位人机交互研究权威:Robert E. Kraut与Aniket Kittur。如果说在清华的学习生活是“野蛮生长”,那么朱海一在CMU的研究生活则是“百炼成钢”。尽管都是学霸云集的顶级学府,但从读书到研究的转变,让朱海一无所适从:“当时,在CMU,我的压力是很大的,一直担心自己的学习方法不对。”读书与研究不同。读书是有教材指明问题的解法,而研究则是探索一个完全没有人解决过的问题,“而且很多时候,你是要自己提出问题,自己觉得用什么解决方法。”上课是吸收,而研究涉及到大量的讨论,要不断输出知识。人机交互并不是大多数清华CS专业的学生会选择的“正统”专业,除了计算机知识,该方向也涉及到社会心理学与经济学等学科的知识。博士阶段,朱海一主要研究线上社区的内在结构,如不同结构如何影响网上社区的存活时间长短,社区中的领导角色、结构、反馈如何影响线上社区运营等。在熟悉HCI的同时,朱海一还面临语言文化的鸿沟,“从小没有接受高强度的英语训练,只是正常地在学校上英文课,”上课时常常迷失在同学们俚语乱飞的对话中。“如果听不懂同学的一些笑话与俗语,也会影响到人际交往。虽然大家都对你很友好、很有耐心,但自己在心理上没有信心跟别人交朋友。同学邀请去聚会时,我也担心去了会尴尬。约尴尬就越不愿意去,也越缺少跟大家交流的机会。”因此,刚到美国的前两年,她非常不适应当地的学习与生活,“比较封闭,只愿意呆在自己的舒适圈里,跟其他的中国朋友玩。”在朱海一留学那会,CMU的华人学生远远少于现在,因此所有计算机专业的华人博士学生都相互认识。尽管大家的研究方向不同,但经常会一起吃饭。同胞之间的相互陪伴与关心,给她带来了极大的慰藉。“回想起来,我也没有很想强迫自己一定要去做那些可能有好影响、但让自己觉得不舒服的小事情。人的精力总是有限的。我在自己的学习研究上面已经是‘硬着头皮上’的感觉,所以我想在日常生活上对自己好一点。”在学习上,博一、博二时,朱海一常常被研究课题折磨,也只能用磕磕绊绊的英语写科研论文。幸得两位博士导师的悉心指导,在她刚开始的论文写作中,两位导师花了很多功夫帮她修改。“古稀之年、功成名就的老师一遍一遍地改,”最后要提交时,Robert Kraut还让他从事编辑工作多年的妻子帮忙做论文校对。从某种意义上说,两位博士导师是她在人机交互方向的真正领路人:“他们奠定了我如何做研究,包括学术品位的培养,比如选什么样的题目,用什么方法,怎样引发研究成果,都是他们教我的基本方法。”分水岭是在博士二年级。朱海一投出两篇论文,两篇都被成功接收,其中一篇“Effectiveness of Shared Leadership in Online Communities”还获得了CSCW 2012的最佳论文荣誉提名。这给了她很大的鼓励:“好像自己也是能做研究的。”在这篇工作中,针对以往维基百科中领导角色局限于少数人的情况,她提出了一个“共享领导”模型,假设由不同级别的社区成员(而不仅是高层)担任领导,研究不同类型的领导(交易型、厌恶型、指令型、以人为本型)在执行不同的领导行为,如何影响其他参与者对维基百科的贡献。熬过刚开始的不适期后,朱海一的研究开始走上坡路。博士毕业前,她相继发表了13篇顶会论文,一作9篇,还获得 CHI 2013的最佳论文荣誉提名、Human Factor Prize、Facebook博士奖学金等等。对此,朱海一不再谦让:“博士阶段真的是我人生中最最努力的阶段,感觉真的是经过了非常痛苦的时期。”当问到有什么方法可以“少走弯路”时,海一老师无情地掐断了我的想象:“没有什么好的经验教训,就是自己好好地熬着吧!总有一天能够把事情做成功。”就像你问你的同桌最后一道数学附加题怎么解,你的同桌回答你两个字:“努力!”但朱老师还是不忍心,又继续说:“如果大家正在经历痛苦的科研过程,就多跟人交流。不要一直死磕,多参加组会,听听类似方向的其他人在做什么。”此外,“整个研究领域的大趋势还是要一直看,不要研究一些太过时的课题。”

3、身份转换:从学生到教师
自2009年起,朱海一已在人机交互领域耕耘12年。除了对人机交互研究的进一步了解,朱海一还经历了身份的转换:从博士生到教职人员;从CMU的学生,到明尼苏达大学的助理教授,再到CMU的助理教授。2015年博士毕业后,朱海一先是在明尼苏达大学双城分校担任助理教授,随后在2019年回到卡内基梅隆大学人机交互系任教,目前是 HCII 的一名 Daniel P. Siewiorek 助理教授 (chair professor)。随着身份的转换,朱海一对自我的认知与提升也有了不同的体验:
从明尼苏达开始担任教职起,朱海一发现,仅仅关心自己的学生是远远不够的。作为助理教授,她需要指导学生,授课,管理实验室,参与系里以及学术社区的服务和建设。现在,她能够与其他教授们自如地讨论,能敏锐感知“话中话”,指导英语母语学生的学术写作。“感觉这要花10多年去学习精进。”另一点比较有趣的是:由于重回HCII担任教职,朱海一与原先的两位博士导师也从“师生”变成了“同事”。刚回CMU时,朱海一是不敢相信的:“天啊,这些人原来是我非常敬仰的大牛,而现在我们的办公室就在隔壁!”但同时,她也感到开心:因为他们完全把她当做平等共事的同事、好朋友。“比如现在 Bob 要打疫苗,我也会关心他有没有约到疫苗。我最近还给他寄了两盒口罩,因为他说他老婆的脸特别小,一般的口罩对她来说太大,我就跟他说正好我家小孩有儿童口罩,我要不要给你一盒,然后我就开车去放两盒在他们家门口。”一般来说,出于对知识多样性的考虑,HCII会希望毕业生去其他地方担任教职,朱海一的情况比较特殊。当时,朱海一在明尼苏达任教,偶然看到 HCII 发的一个招聘广告,便询问 Robert 自己能不能申请。Robert 回复会一视同仁,同时,“大家会更加考虑,你所带来的领域和知识能不能提升 HCII 目前已经覆盖的领域。”所以,在进行工作陈述时,朱海一将重点放在了明尼苏达的研究工作上,将她的工作与两位博士导师的研究区分开来。以此来说服系里的老师:“我会带回新的研究内容,帮助HCII的发展。”


目前,朱海一在社交导向的人与AI的交互研究,也正是HCII希望拓展的部分。“事实上,HCI与机器学习有许多重合的地方,但至今为止,两个领域的工作都是发表在各自的会议,两个领域之间仍然存在一个Gap。我们希望大家可以更好地沟通合作,更好地建立人与AI之间的联系。”她的研究范围不仅是线上社区,还有线下社区,“探索如何设计一个好的AI系统”。她的长期目标是使用以人为中心的方法来应对人工智能的社会挑战。2020年秋季,她与机器学习的另一位老师共同开了一门《人与AI的交互》课程,涵盖人机交互知识与机器学习的内容,希望减少AI产品/系统对用户体验的消极影响。“比如,在设计一个具有人脸识别功能的智能门锁时,这个系统擅长识别一类型的人,而不擅长识别另一类型的人。这个问题原本是一个机器学习问题,但在具体的产品应用中就变成了用户体验的问题。那么,我们要如何设计,才能减少产品的负面影响?”

4、那么,人机交互是什么?
人机交互的英文名为“Human-Computer Interaction”(人与计算机的交互),其中,“机”既指计算机,也可以延伸到其他所有技术,包括人工智能;而“人”,则指的是“机”的用户,既可以是个体用户 (individual user),也可以是团队用户 (group user)、机构用户 (organization user)等。简而言之,HCI 注重人的价值与需求,更好地理解人,从而设计出为用户服务的好产品/平台/系统/模型等等,帮助一个团队、组织或社会更好运转。根据朱海一老师的介绍,HCI 中常见的研究主题可以按照会议内容进行以下大致划分:1)CSCW:又叫“社交计算”,主要讨论人和人(可以是两个人,也可以是几百人)之间的关系,以及如何设计一个系统来帮助大家进行协作。这也是朱海一的主要研究社区;2)UbiComp:又叫“普适计算”,主要目标是更好地设计普适计算,让随处可见的计算机技术(电脑、手机、智能门锁等等)改善人们的生活;3)UIST:偏向设计交互界面。目前UIST有许多探讨AI交互界面的内容;4)DIS:以设计为焦点,适应新的社会需求,包括平面设计、网页设计、编码设计、产品设计、用户设计、服务设计等等。此外,HCI的研究主题还可以按照文章的贡献角度,分为技术向、社会向与设计向。这取决于你的工作对哪一方面的贡献价值更大。CMU HCII目前就是按照这一标准划分,其中,朱海一的研究偏社会向与设计向,主要是人机交互、机器学习与社交心理学的交叉研究。从以人为中心的角度出发,人工智能算法能否落地成功,最终是取决于算法是否符合社会的价值追求。如果技术合理的算法损害利益相关者的利益,那么也可能被社会拒绝。目前,自动化人工智能算法系统被用于管理数字世界。例如,算法可以决定Facebook用户看到的帖子排序,在滴滴等乘车app上给司机自动派单,评估维基百科上的编辑质量并采取对应行动,如回复有问题的编辑。此外,人工智能算法也越来越用于线下社区中对人类活动的决策与管理,如筛选符合入学资格的学生、帮助雇主筛选简历、帮助法官决定应拘留还是释放等待审判的被告等等。在这种情况下,当算法无法解决它们原要解决的问题,算法可能不符合甚至损害人与社区的价值需求时。比如,尽管维基百科的质量评估系统可以有效地检测和还原低质量的编辑,但研究表明,自动算法可能会降低还在学习如何做贡献的新成员的参与动力。当算法工具粗暴地恢复最初的几项编辑后,维基百科的新人成群结队地离开,违反了社区“不咬新人”的政策。在这种情况下,新人保留率低严重阻碍了维基百科的整体发展。针对这种现象,朱海一及团队(如下)提出“价值观敏感算法设计”(VSAD)的方法,该方法强调了在系统设计早期显示广泛利益相关者的价值、并在算法创建过程中纳入和平衡利益相关者价值的重要性。VSAD使用自下而上的设计:首先是定义社区利益相关者的价值追求,然后利用这种理解来指导算法的设计选择。


论文链接:https://www.aminer.cn/pub/5e1ee8cc3a55acfee9f2b1f0
这项工作获得 CHI 2020 最佳论文荣誉提名。除了应用人机交互的方法论去解决人工智能算法问题,学习人机交互知识还能为人工智能/机器学习的研究者带来什么呢?朱海一认为,对于从事机器学习研究的人员,HCI 的内涵(重视人的价值)能够为他们提供新的观点、新的问题或新的解决方法。比如,机器学习模型中的公平限制问题,数学家认为的“公平”(50% vs. 50%)并不适用于实际生活,这时候,机器学习研究员可以选择不断提高模型的准确性、发论文,也可以选择与 HCI 的工作者合作,开拓新的方向(如Fairness in Machine Learning)。另一方面,对于想要进入工业界的硕士生,朱海一认为非常有必要了解 HCI 的相关方法。“因为无论你的机器学习算法再好,在设计产品时,你最终还是要考虑很多终端用户的问题。”出于职业培养的考虑,朱海一在今年(2021年)春季推出一门课程《HCI for Product Manager 》(产品经理所需要了解的人机交互知识)。

5、最后:谈谈女性教职
作为计算机领域的少数女性教职之一,朱海一对“female faculty”(女教职)的身份也有了更深的理解。她回忆,“入坑”HCI,最初是受到清华大学计算机系史元春教授的启蒙。虽然本科期间没有跟着史老师做过研究,但在当时女性教职人员“凤毛棱角”的计算机系,她很崇拜史老师能够取得相当成就,就去查找她的研究内容,发现她是做人机交互方向的,于是在申请时也投了HCI。据朱海一观察,HCII 的学生群体中,男女比例还算比较均衡,但到了教职阶段,就能明显看出,男性教职人员更多。“如果我没有记错,整个系里已经拿到终身教职的女正教授,只有一个。”所以,她非常希望鼓励更多女博士生进入教职队伍:“因为有女性教职人员做 role model (榜样)是非常重要的。我当时在清华时,也是因为看到有史老师这样优秀的老师,才会觉得走科研道路是一个不错的选择。”


此外,女性研究者之间的peer support(同伴支持)真的非常重要。相比男导师,女教师对情感的洞察能力会更强。比如,在朱海一读博的前两年,她的两位男导师都没有注意到她的状态不大好,而系里的两位女教师却能感觉得到,常常单独给予她鼓励。“有一次,我要做presentation(报告),Sara Kiesler老师无法出席,那么多人,她却专门跑过来跟我说:‘我很想听你的prsentation,但我现在有一个急事要先走。’我当时就觉得特别感动。”就她的个人经历而言,担任教职也不影响承担家庭的责任。就她待过的明尼苏达与CMU来说,两所学校都非常重视女教职,会对女教师有很多周到的考虑,比如长聘教职延长制(tenure track extension)、远程参会、减少授课等等。“我希望大家不要觉得做教职人员很难。尤其大家都已经经历完 PhD 阶段,我自己觉得自己最痛苦的阶段可能是PhD。”在做科研、指导学生、照顾家庭的多重责任中,朱海一的态度是“不要给自己太多压力,不必事事做到完美。完成比完美重要。”关于小孩教育,她几乎是采取“放养”政策:“其实他已经比我们小的时候生活好很多啦,只要正常、健康地活着,该学习的时候去学习,能学多少就学多少。”“我考虑比较多的可能是帮他选什么学校。他该去Interview的时候,就帮他组织好,家长要填表,我都好好填。我觉得我做的比较重要的一点,是最后帮选了一个我自己觉得比较不错的学校,帮他交学费。”朱海一的名字取自“沧海一粟”。根据其父母的解释,既有“沧海一粟”的谦和寄意,也有“海纳百川,有容乃大”的豁达盼许。从学生到教职,朱海一始终保持自有的恬淡,同时不弃探索的热情与执著。作为人机交互领域小有所成的科研者,朱海一也有自己的阶段性目标。她致力于搭建人机交互与机器学习之间的桥梁,在人工智能的研究中引入以人为本的价值观,希望消除现有的偏见、缺陷、不公等问题。正如她所说:“自诞生以来,人机交互的方法解决了许多技术的缺陷,现在也轮到人工智能了。”

6、教研Q&A
1、AI科技评论:在教授《人与AI的交互》这门课中,令您觉得印象比较深刻的点是什么呢?
许多机器学习的最初诞生是在实验室里,比如写一个 SVM,做一个神经网络,对神经网络进行训练。更多时候,机器学习系统就是考虑一个简化的数学问题,然后在这个数学问题下不停地优化,实现更高的准确度。这实际上是一个问题的简化版。但如果你将机器学习系统应用到实际生活中,将其变成一个产品时,就有许多因素需要考虑,比如用户与所有的利益相关者(stakeholder)。同样是举智能门锁的例子。我装了智能门锁,那么我就是产品的用户,但其他影响人(即stakeholder)包括现在与我一起居住的家人、邻居、街道行人、外卖员等等,这些人都会被智能门锁“看”到。不同的stakeholder会有不同的担忧,那么你的产品要如何设计,其中机器学习的算法如何设计,才能取得更好的效果,不只是考虑到“我”这个直接用户,还要考虑到所有stakeholder的目标、价值考虑与隐私担忧等。相对而言,智能门锁不算高风险(high-stake)产品,因为它最大的影响不过就是把人关在门外,或者收集到其他人的画面(从而侵犯到他人的隐私)。我们现在有一些产品设置,需要考虑到儿童虐待的问题。在美国,有很多社区工作人员要处理儿童虐待、家暴等案子。社区工作人员会去到当事人的家里家访、了解案件的实情。但在家访之前,有一个步骤是screening(过滤),社区人员会收到很多报告,有些是真报告,有些是假报告,那么你要如何筛选(screen in/screen out),这就是一个很重要的决定。社区工作人员有很多政府行政数据,比如这个家庭的小孩以前被报告过多少次,这个家庭有没有收到贫困资助,学校老师有没有提供过报告,等等。但是,有了数据,要怎样才能更好地使用这些数据来帮助你作出针对这类高风险处境的决策呢?我们目前也有与这些社区服务者合作,但是这些数据有很强大的社交暗示。如果你做错一个决定,问题可能非常严重,比如小孩会被虐待至死。在这种情况下,你不能只是简单地提供一个false negative rate(假阳率)。在美国还有各种社会公平的问题,如果一个算法对不同族裔的小孩有不同的对待方式,就会有很大影响。如何解决这类有关社会公平的问题,是非常重要的。总结一下,我觉得在我们设计《Human AI Interaction》这门课的时候,我们要考虑所有用户,不仅是用户,还有stakeholder,他们的实际需求,他们相关的价值观和关注点。如何将这些实际的担忧与考虑作为算法的输入,以此来纠正、改善你的算法,我认为是一个很重要的点。
2、AI科技评论:在研究人机交互的过程中,您有用到哪些 AI 知识?
我的话是需要什么技术就用什么技术,以解决实际问题为主。比如,在儿童虐待的案例中,问题本质是一个风险评估,需要预测最后是screen in或screen out,做出是否派社会工作者去被虐待的小孩家里的决策。那你就要用所有的数据来帮助做一个二分决策(binary decision)。这时候,你就要与Fairness in ML(公平机器学习)的研究者合作,探讨如何解决公平性的问题。我们有一个合作者是研究subgroup fairness(子群公平性),有很多不同的protective attributes要考虑,不仅是对不同的肤色,也有对不同年纪,不同性别。最后都变成了一个复杂的、有不同维度的公平性问题。他就是研究这部分。在正常的机器学习方法上,你要有很多fairness constraints(公平限制)要解决,这部分问题就由他来解决。我们有时候遇到的问题也很新,没有一种HCI的方式可以直接解决,所以我们都是跟各个领域的学者进行密切合作。交流数据比较多的话,我们就跟 NLP 的人合作,需要他们帮我们检测有帮助的语言部分。比如我们最近要搭建一个聊天机器人(chatbot),使这个聊天机器人能更好地帮助训练志愿聆听者/心理咨询师。我们构建一个有心理问题的聊天机器人,这样心理咨询师就可以跟有些问题的机器人进行交流。在这个过程当中,我们要考虑如何使用conversational data(交流数据)来搭建有心理健康问题的聊天机器人。这时候,我们就与NLP的研究者在合作。她提供技术支持,我们提出具体的、独特的问题,包括如何定义这些问题,如何表达出不同程度的心理问题与焦虑。她更多是设计检测部分,我们是考虑如何涉及到不同利益相关者,吸引他们来设计这个聊天机器人。因为我们设计出来的聊天机器人,并不一定是心理咨询师认为像真人的病人。我们还是需要心理咨询师进入到整个设计过程当中,他们可以帮助我们更好地改善底层的设计。
3、AI科技评论:所以在您的研究中,AI更多是辅助你们去研究某一个问题,是吗?
对,我自己的方向是这样子。AI、机器学习等方法都是用来解决具体问题。但是,在跟我们的合作者合作中,合作者会通过跟我们的合作来提升一些机器学习的基本问题。比如做Fairness in ML的合作者,他们会将我们在现实生活中遇到的具体问题formulate出一个通用的问题,写一篇论文进行发表。Fairness也分group fairness(群体公平)和individual fairness(个体公平)。在与社区工作者合作中,我们发现,他们考虑问题不一定是从集体的角度考虑,如亚洲家庭、黑人家庭、西班牙家庭等等,而更多时候是分案例来看待儿童虐待问题。比如两个case(案例)很像,那么是不是应该公平对待、有没有公平对待。
4、AI科技评论:您认为人机交互可以如何弥补AI现在的缺陷?
机器学习有很多涉及到隐私、偏见、公平、准确性的问题。我的确觉得人机交互的很多方法正好能够弥补这些缺陷。一方面是能够更多地理解这些问题。其实这些问题都是社会/社交问题,非常复杂。如果你想解决某个问题,首先是要理解它。比如偏见,要放到具体的问题下看待,不能单单强制男生女生完全平等。在不同的具体场合,在不同的问题之下,一句话的展现是非常不一样的,有的时候很明显,有的时候非常不明显,有的时候可以量化,有的时候很难量化。HCI方法可以帮助更好地理解这些缺陷。我们发现,如果将问题量化,比如招聘时男女比例一定要设定为50%、50%,那么就会导致机器学习模型的准确性出现极大错误,或者模型的效率非常差。或者黑人家庭与亚洲家庭一定要50%、50%,两者本身的人口基数差很多,假设全球人口,只有2%到5%的亚洲家庭,30%的黑人家庭,在处理儿童虐待问题时硬要公平,那么高风险群体里面,所有种族的比例都要一模一样。这实际上也是一些机器学习研究者提出的解决缺陷的方法。你可以想象它有多离谱,所以我们这种实际研究问题的人才能够更好的帮助你,知道你在实际问题当中应该怎么解决这种偏见,让你在设计机器学习模型/算法时,更好地把这些因素考虑进去。还有一点,HCI 是从教育的角度和工具箱设计(toolkit design)的角度考虑。我们现在跟Microsoft合作,做 Fairnlearn。现在已经有这种工具箱,任何一个数据科学家都可以自己做一个模型,然后用工具箱,检测模型是否有偏见,我们看能不能用一些计算内置的方法,把偏见修改过来。我们现在做的就是,能不能设计更好的fairness toolkit(公平工具箱),看一些数据科学家是如何使用工具箱,然后我们能够更好设计 fairness toolkit。有时候数据科学家对toolkit的理解本质上都错了,你给他各种不同的metrics(衡量指标),fairness本身要表达的和他们自己的理解是有偏差的。他自己以为我解决bias(偏见)了,但实际上根本没有。我们要了解数据科学家在使用的过程中犯了什么错误,然后跟fairness in machine learning的人更好地合作,提升他们的toolkit design。我们希望,在教育场合,不管是设计教育toolkit,还是我们自己设计课程也好,可以帮助很多计算机学生更好地理解AI中的偏见和偏差。等他们毕业,进入公司,成为真正的一线工程师的时候,他们至少可以记住,而不是出于对这些产业完全无知的状态,只能指望组里的其他人来解决。很多时候,最后还是要靠前线的机器学习工程师等消除实际问题中的偏差。
5、AI科技评论:在您的研究中,人的价值、社会心理学等知识扮演了什么角色?
我们研究社会心理学、人类行为,其实是为了更好地理解人做决策的过程。事实上,现在很多具体机器学习应用的实例,都是他们来辅助人来做决策。实际上, 预测模型(predictive model) 与最终的决策(decision)有时候是有偏差的,因为机器学习只能根据历史数据做预测,历史数据可能有各种conterfactual。比如根据历史数据,你知道哪一个人最后被放出来了,但是他又去犯罪了,但你不知道没有放出来的那些人,如果被放出来的话,是不是也会去犯罪。在儿童虐待的例子中,我们只能知道你最后没有管这个case,但是你不知道这个case有没有出现严重后果,但我们不知道如果我们管了这个case,你是不是多管闲事,可能你不管它也没有关系。机器学习的预测任务只能按照历史数据来训练。除了历史数据,其实还有conterfactual、预测标签(prediction label)、历史偏见,不一定表示潜在的平等测量。所以机器学习本身一套系统训练的方法其实并不一定适合最终做决策的任务,最终还是要人来做决定。我们现在做的一部分事情是,不管是利用对人的了解、对人的心理的了解也好,都是为了能更好地设计整个机器学习的限制训练过程,如何收集到更好的数据,如何更好地使用适当训练来展现预测的“窘迫”,然后让这些结果与最终作决策的人类更好地合作。相当于人与AI进行写作的过程。对人的理解、对整个社会行为的了解是持续进行的。一旦人的社会行为被放在一个特定背景下,有时候不只是一个工程师的决策,而是一个组织的决策。一个组织的目标也会影响到我们。比如,在儿童虐待问题中,社区工作者提出他们的组织有一个新目标,这会影响到这个组织,也会影响到机器学习的训练设计。我们现在更多是辅助人与AI协作、甚至是组织与AI的决策过程。
6、AI科技评论:所以 HCI 研究是有利于实现AI算法与决策的公平性,是吗?
机器学习是一项技术,只要是技术就会有缺陷。而人机交互是一种方法,自诞生以来已经解决了各种各样的技术缺陷。我觉得现在是到了我们帮忙解决机器学习的缺陷的时候了。
7、AI科技评论:您现在有多少个学生?您指导学生的风格是怎样的?
我现在有4个PhD学生,几个硕士生,比较多本科生。4个PhD学生是我直接带,3个在CMU,1个在明尼苏达。也跟一个UCSD的学生,一个明尼苏达的学生,还有一个复旦的PhD学生密切合作。算起来,就是7个PhD学生。加上零零散散的话,现在有接近20位学生。我一直欢迎硕士生与本科生来实验室参加不同的组学习,有些本科生的科研非常优秀,我也鼓励他们申请PhD,我现在已经有两个学生成功地申请到了非常好的PhD offer。我自己的个人研究风格不好说。但是我个人觉得我在指导上还是非常 student-driven (由学生指导)的,希望学生做他们自己想做的学术。除非是学生真的特别不清楚自己想要做什么,尤其在开头阶段,我就会可能比较多地干预,给他们一些项目。学生在第一年、第二年的时候,还是花很多精力在学生的,因为就是说让他们在第一年不要struggle(挣扎)太多,或者无用的struggle太多,保证他们能上正轨。他们上了正轨之后,可能还是有的时候要激励他们一下,不要呆在舒适圈,milestone(里程碑)要按时完成。PhD学生应该是自我激励的,我觉得最重要的还是让他们做他们想做的东西,尽管他们的topic与我很不一样,以他们自己的兴趣为主。我有个学生就特别喜欢做network analysis(网络分析)的工作,我就是给他contact,或者帮他找数据。有的学生特别关注marginalized community and group(边缘社区与群体),我也是让他们更积极地往他们比较关注的方向做。我比较注重合作。与其他老师合作比较多,所以也会跟其他老师一起co-advise学生。如果硬要总结的话,一个是student-driven(学生导向),一个是collaborative(合作)。
8、AI科技评论:您现有的4个PhD学生,他们都是CS背景出身的吗?还是有其他专业的?
3个是CS背景,1个是social science背景。在美国,双学位很普遍,哪怕是计算机的本科生也可能修一个心理学学位、社科学位或HCI学位。哪怕本科是社科专业的学生,也有修一些计算机科学的课。对我来说,你要至少有对人的兴趣,对HCI的问题感兴趣,别只对计算机和数学有兴趣。
9、AI科技评论:在招博士生当中,您比较注重他们有什么样的能力或者品质?
其实都不像是我在招。CMU 有招生委员会,他们会根据不同的要求帮所有老师统一做决定,主要选拔标准是三个:research potential(研究潜力),research experience(研究经历),与解决问题的能力。先发offer,老师说服学生来,等他们来了之后再与导师一一匹配。毕竟拿到CMU offer的学生都非常强,我也就不怎么挑。

相关推荐

相关文章