就在刚刚,斯坦福大学正式发布《2021年人工智能指数报告》(“Artificial Intelligence Index Report 2021”)!
李飞飞教授十几分钟前也在推特上第一时间祝贺该报告的最新发布,表示会从头到尾的认真阅读并献上对朋友们的敬意。
自 2017 年起,由斯坦福大学主导,来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授,组建了一个小组,每年发布 AI 指数年度报告,全面追踪人工智能的最新发展状态和趋势。
该报告的负责人——斯坦福大学教授、前任谷歌首席科学家、2019年IJCAI 卓越研究奖得主Yoav Shoham 谈到该指数报告时曾经表示。
另外,本报告也是斯坦福以人为本人工智能学院(HAI)成立以来第二次发布AI指数报告,HAI是近两年斯坦福大学成立的由李飞飞教授与哲学家John Etchemend等领导的新部门。
今年的报告,从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状,并且记录了计算机视觉、自然语言理解等领域的技术进展。报告章节如下:
研发是AI进步的基础。自从1950年代技术首次激发计算机科学家和数学家的想象力以来,人工智能已发展成为具有重要商业应用的主要研究学科。在过去的20年中,AI论文的数量急剧增加。人工智能会议和预印本的兴起扩大了研究和学术交流的传播。包括中国、欧盟和美国在内的主要大国都在竞相投资人工智能研究。
从 2019 年到 2020 年,人工智能期刊的出版数量增长了34.5%,比 2018 年至 2019 年高出 19.6%。
但各区域中,排名第二的机构有所不同:在美国,企业研究的学术发表排名第二,占出版总数的 19.2%;而在中国与欧盟国家,政府主导的研究机构排名第二,分别占出版总数的 15.6% 和欧盟 17.2%。
另外值得注意的是,在2000年至2019年之间,人工智能会议论文的数量增加了四倍,而在过去十年中增长趋于平稳,2019年的会议论文数量仅比2010年的数量高1.09倍,
由于新冠疫情,大多 AI 顶会都是线上召开,因此出席人数明显增加。2020年,九个 AI 顶会(IROS、ICML、CVPR、AAAI、ICLR、ACL、AAMAS、KR、ICAPS)的
随着时间推移,大型公司在人工智能会议中的存在率不断提高 。西部大学、弗吉尼亚理工大学和艾维商学院的研究人员认为,学术界计算能力的不平等分布(他们称之为“计算鸿沟”)加剧了深度学习时代的不平等现象。
大型科技公司往往拥有更多的资源来设计AI产品,但与精英或规模较小的机构相比,它们的多元化程度也较低
,这引起了人们对人工智能内部偏见和公平的担忧。10个主要AI会议都显示出公司参与度的上升趋势,这进一步扩大了计算鸿沟。
TensorFlow(由Google开发并于2017年公开发布)在2020年仍然是最受欢迎的AI框架。2020年第二大受欢迎的框架是Keras(也由Google开发,并基于TensorFlow 2.0构建)。
除TensorFlow之外,PyTorch(由Facebook创建)是另一个越来越受欢迎的框架。
在过去的 6 年间,发表在 arXiv 上的 AI 论文数量增长了 6 倍以上(从 2015 年的 5,478 篇论文增加到 2020 年的 34,736 篇。
在2000年至2019年期间,AI论文的总数增长了近12倍。2019年,AI 学术论文占全球所有同行评审科学出版物的 3.8%,与 2011 年相比增加了 1.3%,在2000年这一比例为0.82%。
尽管技术的进步使AI系统的部署比以往任何时候都更加广泛和轻松,但对AI使用的关注也在增长,尤其是在算法偏差等问题上。诸如能够合成图像和视频的新AI功能的出现也带来了道德挑战。
AI 系统现在可以合成非常高质量的文本、音频和图像,人类甚至无法分辨出合成输出与非合成输出之间的区别。
在过去两年里,生成模型在STL-10数据集中生成令人信服的合成图像方面进展迅速,图像真实性越来越高。
这些技术将促进大量有利于社会或不利于社会的 AI 下游应用的出现,并促使研究员投入研究检测生成模型的技术中。比如,DeepFake 检测挑战(DeepFake Detection Challenge)数据显示了计算机在区分不同输出上的优秀能力。
CV 模型的性能在一些大型基准上开始趋于平缓,这表明社区需要开发并就更难的标准达成共识,以对性能进行进一步测试。
而且,在部署系统中使用的技术(例如用于分析视频中静止帧的目标检测框架)正在迅速成熟,表明将进一步部署 AI。
NLP的进展如此之快,以至于技术进步已经超过了基准测试。这一点可以从在SuperGLUE上获得人类水平性能的系统的快速兴起看出。SuperGLUE是为响应早期 NLP 进展(超越 GLUE 评估的功能)而开发的 NLP 评估套件。
大多数技术问题的度量标准都以固定的基准显示了每个时间点上最佳系统的性能。针对 AI 指数开发的新分析提供了指标,这些指标可以用在不断更新的基准测试上,也可以用在获得一段时间内一组系统整体性能表现的单个信用系统上。这些分析适用于两个符号推理问题:自动定理证明(Automated Theorem Proving)和布尔公式的可满足性(Satisfiability of Boolean formulas)。
在布尔满足问题上,虽然从2016年到2018年最佳求解器的性能没有明显变化,但在2019年和2020年有明显的改进。
在自动定理证明上解决的问题比例持续上升,表明该领域取得了进展。值得注意的是,从2008年到2013年包括FOF、TF0和TH0子集实现了强劲发展。
AI 创业公司 PostEra 使用基于 ML的技术,在新冠疫情期间快速找到了相关的药物。
PostEra:Moonshot提交的药物总数(COVID Moonshot是一项众包计划,已有500多名国际科学家加入,以加快COVID-19抗病毒药物的开发)
“Transformers架构的统治地位令人瞩目,该架构最初是用于机器翻译的,但现在已经成为几乎通用的神经网络架构。更广泛地说,尽管NLP在利用深度学习方面落后于愿景,但现在看来NLP的进步也正在推动愿景。”
“最近在语言生成方面取得的令人难以置信的进步已对NLP和机器学习领域产生了深远的影响,使以前困难的研究挑战和数据集突然变得毫无用处,同时鼓励了新的研究工作投入到这些复杂的新模型中。”
人工智能(AI)的兴起不可避免地提出了一个问题,即技术将在多大程度上影响企业、劳动力和经济。考虑到AI的最新进展和众多突破,该领域为企业带来了巨大的利益和机遇,从自动化的生产率提高到使用算法为消费者量身定制产品、大规模分析数据等等。
但是,人工智能所承诺的效率和生产率的提高也带来了巨大的挑战:公司必须努力寻找并留住熟练的人才来满足他们的生产需求,同时要牢记实施措施以减轻使用人工智能的风险。此外,COVID-19大流行给全球经济造成混乱和持续的不确定性。公司如何依靠并扩展AI技术来帮助其企业度过最困难的时期?
“药物、癌症、分子、药物发现”在 2020 年获得了最大的私人 AI 投资,总额超过 138 亿美元,是 2019 年的 4.5 倍。
2016 年至 2020 年,巴西、印度、加拿大、新加坡和南非是 AI 招聘人数增长最快的国家。尽管新冠疫情爆发,但2020年,所有采样国家的 AI 招聘人数都还在继续增长。
2015年至2020年的汇总数据显示,印度(全球平均水平的2.83倍)的AI技术相对普及率最高,其次是美国(全球平均水平的1.99倍),中国(全球平均值的1.40倍),德国(全球平均值的1.27倍)和加拿大(全球平均值的1.13倍)。
越来越多 AI 私人投资集中到少数的初创公司中。尽管出现疫情,但 2020 年的私人 AI 投资金额比 2019 年增加了9.3%,比2018年至2019年的增长率(5.7%)更高,尽管新成立公司的数量连续三年都在下降。
麦肯锡的一项调查显示,尽管越来越多人呼吁解决 AI 使用相关的道德问题,但业界在解决这些问题的努力上非常少。例如,AI 的平等和公平问题受到公司的关注相对较少。此外,与2019年相比,2020年,越来越少公司将个人隐私视为相关风险,并且受访者中,正在采取措施来减轻这些特殊风险的企业百分比没有发生变化。
尽管疫情造成了经济衰退,但在麦肯锡的一项调查中,有一半的受访者表示,新冠疫情对他们在 AI 方面的投资没有影响,27% 的受访者甚至表示 AI 投资有所增加。只有不到四分之一的企业减少了对 AI 的投资。
随着AI成为经济活动的越来越重要驱动力,想要了解它并获得从事该领域工作的必要资格的人们对之越来越感兴趣。同时,工业界对AI的需求不断增长,正吸引着更多的教授离开学术界进入部门。本章重点介绍AI人才的流动趋势。
2020年 的一项 AI 指数调查显示,过去 4 年间,世界大学均提高了在 AI 教育上的投资。在过去的 4 个学年里,向本科生与研究生传授 AI 应用技能的课程数量分别增加了 102.9% 和 41.7% ,如下图所示。
根据计算机研究协会(CRA)的年度调查,过去的10年里,在北美地区,选择进入工业界的 AI 博士生更多,而选择进入学术界工作的较少。
具体而言,过去 10 年选择进入业界工作的 AI 博士毕业生的比例增加了48% (从 2010 年的 44.4% 增至 2019 年的 65.7%,如下图蓝线所示)。
相比之下,进入学术界的 AI 博士毕业生的比例下降了44%(从 2010 年的42.1% 下降至 2019 年的 23.7%,如下图红线所示)。
根据 CRA 的调查,在过去的10年里,美国AI 博士毕业生数量占比可真谓是一冲再冲、独占鳌头———从占 CS 博士毕业生总数的 14.2%,上升到了2019 年的约 23%(如下图所示),而排名二三位的 理论&算法、机器人/视觉占比都是不到10%。
同时,其他以前热门的 CS 博士学位专业的人气则是有所下降,比如网络、软件工程和编程语言。相对于2010年,所有编译器专业都减少了博士学位的授予数量,而 AI 和机器人/视觉专业领域则有了大幅增长。
经过两年的发展,在北美地区,从大学 AI 教职人员转到业界发展的人数从 2018 年的 42 人下降至 2019 年的 33 人(其中 28 人是终身教职,5 人是无教职员工)。
其中卡内基梅隆大学在 2004 年至 2019 年间的 AI 教职员工人数最多(16人),其次是佐治亚理工学院(14人)和华盛顿大学(12人)。
2019年,北美地区 AI 博士毕业生的国际学生比例继续上升,达到64.3%,相比 2018 年增长了 4.3%。
调查数据显示,大约81.8%的国际毕业生会留在美国工作,而 8.6% 的毕业生则在其他地区任职。
另外在欧盟国家中,绝大多数专业的 AI 学术课程都只是面向硕士生授课。目前,机器人技术和自动化是本科生和硕士生最常学习的课。