人类会犯错,机器也会犯错吗?肯定会,这只是一个犯错概率的问题。
每一家人工智能公司都需要面临这样的权衡取舍,普通的人工智能可以允许较大的犯错概率,但无人驾驶等涉及人类生命的,则需要慎之又慎。
想到麦当劳当收银员,不需要接受多少培训。即便是第一天上岗工作,多数人也足以胜任这份工作。随着服务的顾客数量越来越多,他们的能力也会不断进步。虽然新上岗的收银员工作速度可能有点慢,出错率也高于老员工,但社会普遍认为,他们可以从中吸取经验教训。
我们不会经常这样想,但民航飞行员也是这种情况。令我们感到安慰的是,民航飞行员证书都受到美国交通部联邦航空管理局的监管,最少需要经历1500小时的飞行、500小时的跨国飞行、100小时的夜间飞行以及75小时的仪器操作,才能拿到这张证书。但我们也知道,飞行员的能力会随着工作经验增多而逐步提升。
2009年1月15日,当全美航空公司的1549次航班因为撞上一群加拿大雁导致发动机全部熄火时,外号“萨利”的机长切尔西·苏伦伯格(Chelsey Sullenberger)奇迹般地把飞机降落在哈德逊河上,挽救了全部155名乘客的生命。
多数记者都将他的惊人表现归功于丰富的经验。他的飞行时间总计达到19,663小时,其中,驾驶A320的时间就达到4,765小时。萨利本人也表示:“可以这样来看待这件事情:42年来,我总是定期往经验、教育和培训银行里面存钱。1月15日,我的余额已经足够多,所以我才能提出一大笔钱。”萨利和那架飞机上的所有乘客都受益于他之前服务过的成千上万名乘客。
在达到所谓的“足够好”之前,收银员和飞行员的差异在于人们对其错误的宽容度。很显然,我们对飞行员犯错的宽容度要低得多。正因如此,虽然他们可以边工作边积累经验,但我们仍会要求他们在正式为旅客服务之前接受一定量的内部培训。具体到人类从事每项工作前所需接受的培训量,我们会根据不同工作给出不同的界定。
机器学习同样如此。
人工智能应用的基础是预测。传统的计算机算法在吸收数据之后会遵循特定方式输出结果,但与之不同的是,作为当今最普遍的人工智能技术,机器学习需要通过多样化的学习流程不断进化。随着机器吸收包括结果在内的各种数据,它会找出其中的关联,然后便可在碰到之前没有见过的新数据时,根据这些关联预测结果。
也就是说,智能机器需要像收银员和飞行员一样接受训练。企业会设计各种各样的系统来培训新招募的员工,直到他们足够优秀之后再让其正式上岗,他们知道这些员工会在工作过程中吸取经验教训,不断提升自我。虽然这似乎是显而易见的,但要判断究竟是哪些因素构成了“足够好”,却显得非常重要。具体到机器智能,这就牵扯到时机问题:应该在什么时候从内部培训转向边工作边学习。
企业首先面临的问题是:他们以及他们的客户对错误的容忍度有多大?我们对某些智能机器的错误容忍度较高,有些则比较低。例如,谷歌收件箱应用读取你的电子邮件后便可利用人工智能预测你希望如何回复邮件,然后生成3条简短的回复供用户选择。
很多用户报告称,即便这项功能的失败率达到70%(也就是说,人工智能生成的回复只在30%的情况下是有用的),但他们还是很喜欢。之所以对错误有如此高的宽容度,是因为用户因为减少排版和打字获得的好处,超过了错误的预测所浪费的屏幕空间。
相比而言,我们对无人驾驶汽车的错误容忍度较很低。第一代无人驾驶汽车基本都是由谷歌开创的,需要接受专业人类驾驶员的培训,但他们只能使用有限的汽车,并驾驶这些汽车行驶数十万公里。这有点像父母在让孩子自己开车之前,通过监督的方式让其积累驾驶经验。
专业的人类驾驶员提供了一个安全的培训环境,但却很受局限。机器智能只能了解很少的情形,它们可能需要在不同环境和情况下行驶数百万英里才能学会如何应对罕见的情况,但这些罕见的情况往往更容易引发事故。对于无人驾驶汽车而言,真实的道路很险恶,而且不容有失,因为这些道路上会出现一些由人类造成的险恶情形。
随后还要面临第二个问题:在自然环境下获取用户数据有多么重要?由于明白这种训练可能需要经历漫长的时间,所以特斯拉在最近的所有车型中都安装了无人驾驶汽车硬件。其中包括一套传感器,可以用来收集环境数据和驾驶数据,然后将其上传到特斯拉的机器学习服务器上。特斯拉在很短的时间内便可通过观察驾驶员的开车方式获取培训数据。特斯拉的汽车上路行驶的里程越长,特斯拉的机器学到的数据就越多。
然而,除了在人类驾驶员驾驶特斯拉时被动地收集数据外,该公司还需要借助无人驾驶数据来理解无人驾驶系统的工作方式。正因如此,他们必须要让汽车自动驾驶,从而评估其表现,但同时也要评估驾驶员选择介入的时机。特斯拉的最终目标不是开发一个副驾驶员,也不是开发一个在父母监督下开车的青少年,而是推出全自动驾驶汽车。这就需要让人们舒服地坐在无人驾驶汽车里。
这就必须展开一些微妙的权衡。为了获取更好的数据,特斯拉需要让该公司的机器在现实环境中学习。但把现有的汽车放在现实环境中,就意味着向客户提供了一个相对“年轻且经验不足的”驾驶员——尽管它或许可以比肩甚至超越很多年轻的人类驾驶员。
不过,与Siri或Alexa这样的语音助手服务,或者谷歌收件箱的自动预测功能相比,这其中蕴含的风险还是要大得多。对于Siri、Alexa和谷歌收件箱而言,这意味着较低的用户体验,而具体到无人驾驶汽车,则需要拿人的生命来冒险。
正如Backchannel最近的一篇文章所写,这番体验可能令人恐惧。汽车可能会在毫无征兆的情况下冲出公路,或者因为把高架桥下的通道当成障碍物而猛踩刹车。较为谨慎的驾驶员或许会放弃使用自动驾驶功能,从而阻碍特斯拉的学习能力。另外,即便该公司可以说服一些人参与测试,那些人真的就是他们想要的吗?毕竟,愿意测试无人驾驶功能的人或许比普通驾驶员更愿意冒险。如果是这样,该公司的机器经过训练后会变成哪一种风格?
数据越多,机器学习速度就越快,而在显示环境下部署机器时,生成的数据也比较多。然而,现实环境中可能发生一些糟糕的事情,从而破坏公司的品牌形象。过早地把产品投入现实环境可以加快学习速度,但却要冒着品牌形象(甚至客户利益)受损的风险;过晚地投入自然环境则会放慢学习速度,但却可以有更多时间在内部改进产品,并保护品牌(甚至客户利益)。
对谷歌收件箱这样的产品来说,面对这种权衡时似乎很容易给出答案,因为糟糕表现所付出的代价很低,而通过用户使用习惯获得的学习数据却很大。所以,尽早将这类产品投入自然环境的确有道理。而对于汽车等其他产品来说,答案似乎没有那么明确。随着越来越多的公司希望在机器学习领域抢占优势,也将有越来越多地企业不得不面对这样的权衡取舍。
编译/长歌