在 AI 领域,目前最让人兴奋的模型之一,是旧金山人工智能公司 OpenAI 开发的 GPT-3。它被认为是人工智能的一个巨大飞跃。它可以生成小说、诗歌、新闻稿、代码、音乐甚至笑话。但它仍然无法通过图灵测试。这也显示出,开发者们如今不再唯图灵测试是尊。无人驾驶汽车、语音处理和图像识别等先进技术的出现,这些 70 年前无法想象的进步,都使通过测试本身变得不再那么重要。普拉萨德指出,图灵测试对 AI 的高速计算和信息查找能力几乎不屑一顾。甚至于很多时候,机器需要特意放慢速度,增加停顿,“假装思考”,来模仿人类。事实上,它们的检索速度要远高于人类。而图灵测试也仅限于文本交流,意味着它只能在对话的层面体现智能。如今的 AI 在听、看和感受等方面都获得了拓展。这些都是为了满足一些更实用的需求,比如智能家居,语音控制。而“模仿人类”的能力本身,也为人类的未来制造出更多潜在的问题,比如说用于实施钓鱼攻击的自动诈骗机器人,模仿人类用户的网络机器人水军,散布假消息的假账号。普拉萨德认为, AI 需要新的基准测试,它所追求的目标应该远超普通人类的能力。“它不仅能展现出类似人类的智力属性——包括常识、自我监督和语言表达,还能完成快速搜索、历史回溯和替代人类做任务等机器的属性。”因此,在 Alexa 的设计中,机器人是更偏重于任务导向的。即便是对话机器人,目的也是帮助人类促进学习、舒缓身心或是提供消遣。比如在对话时,机器人优先考虑的是适时表现出一些幽默感和同理心,而不是假装自己是人类。而对于人类智力的理解,在过去 70 年中也在不断进步。“自从图灵测试以来,人类实际上已经通过 fMRI (功能性磁共振成像)发现了更多关于我们自身思想和智力的秘密。” DataRobot 首席营销专员本 · 泰勒说。“如果说图灵测试是我们的登月计划,那现在就来筹划一下火星计划吧。”“图灵测试并不是一个糟糕的测试,但它并不真正衡量智力。” Octane AI 的联合创始人本·帕尔解释道,“我们需要更清晰的知觉和自我意识测试。也许还需要几十年甚至更长的时间,我们才能拥有一台真正有知觉的机器。”但无可否认的是,图灵测试仍然拥有某种魅力,它极大地激发了科技界的想象力,让从业者们收获创造的激情。苹果公司联合创始人史蒂夫·沃兹尼亚克提出的测试也同样有趣,他提议,让一个机器人试图进入你家,找到厨房,并帮你做一杯咖啡。除此之外,还有的测试试图让机器人观看电视节目并提出有意义的问题,有的则通过创造艺术的能力来进行评判 AI 的创造力。对这些考验的求索都在不断拓宽人们对机器能力想象的边界。“我相信在本世纪末,文字使用和通识教育将进步到一种程度,那就是人们可以尽情谈论会思考的机器,而不被驳斥。”在论文中,图灵提出过这样的设想。那至少,在图灵测试蒙上时代灰尘的现在,这个期盼已经成真。