共计 2695 个字符,预计需要花费 7 分钟才能阅读完成。
人类自古以来就怀揣着制造会思考机器的梦想,这一愿望可追溯至古希腊时代。传说中的皮格马利翁、代达洛斯、赫菲斯托斯被赋予传奇发明家形象,经他们之手诞生的葛拉蒂雅、塔罗斯、潘多拉,或许是人类叙述中最早的人工智能。如今,人工智能已真实活跃于众多应用和研究领域。让我们透过喧嚣,回顾人工智能的前世今生,看清它究竟是什么,现在能做什么,未来又能做什么。
早期人工智能的探索与局限
早期的人工智能迅速攻克了一些对人类大脑而言相对困难,对计算机来说却较为直接的问题,即能用一系列数学规则描述的问题。然而,人工智能面临的真正挑战恰恰相反,我们期望它能替代人类执行那些人类容易完成,却难以用规则描述的任务,比如听懂别人说话、在图片中找到人脸等。
人工智能的第一次技术发展是基于人类专家知识的系统。专家提取特定领域知识,转换为计算机可输入的规则及相应后果,计算机运用逻辑推理“理解”这些正规语言描述的说明。该技术可用于日程安排、棋类游戏(如 IBM 的深蓝战胜国际象棋大师卡斯帕罗夫)或替人报税等明确任务。但它在认知现实世界方面存在短板,且不具备自我训练和提高的能力。著名的 Cyc 项目就令人失望,例如它在读取一个关于弗雷德每天早上刮胡子的故事时,因推理引擎检测到故事中关于人的身上没有电动部件与弗雷德剃须时拿电动剃须刀的矛盾,而对“剃须时的弗雷德”是否还是人产生疑问。这表明仰仗硬编码知识的智能系统存在经典困难,人工智能系统需要具备从元数据中提取规律自主获取知识的能力,即机器学习。不过,第一波技术并非对当下毫无意义,去年美国国防高研署基于第一波人工智能技术成功完成了一项数字安全测试。孤立的技术在外部环境不成熟时,只能等待。
机器学习系统的发展与问题
第二波人工智能的典型例子来自美国国防高研署组织的自驾车研究。2004 年,自驾车视觉系统难以分辨远处黑色物体是阴影还是石块,导致大多车辆在该问题上翻车,没有一辆车跑完规定路程。2005 年,情况大为改观,5 辆车跑完了全程,原因是大多车辆开始使用机器学习技术,运用概率方法处理信息。
这一波人工智能的特点是统计学习,在语音识别、人脸识别等应用领域颇为成功。人们常说计算机“会学习”,但实际上若没有强大的将现实问题用统计数学模型描述的支撑,它就无法真正学习。当前在商业领域应用的大多是第二波人工智能技术,其模式多为输入数据(A),迅速产生简单响应(B)。虽然这已足够改变许多行业,但与科幻小说中的有感知机器人相去甚远,人类智力也远非“A→B”所能比。例如,一张拿着牙刷的小男孩图片可能被人工智能识别为拿着棒球棍的小男孩,这说明第二波技术在统计学范畴表现出色,但个体样例不可靠,在金融领域可能导致灾难性后果。前百度首席科学家吴恩达教授解释说,一个正常普通人能用少于一秒钟思考完成的任务,都可通过人工智能实现。
语境适应系统的出现与前景
第三波人工智能的定义是“语境适应”,其系统会逐渐构建“有意义”的模型描绘现实世界现象。比如,第二波系统能甄别猫的图片,但当被问为何认为是猫时,答案往往不能令人满意。而第三波系统具备知道“为什么”的能力,不会将图片标注错误。
第二波系统对数据依赖极大,如教会一个系统识别手写数字,大概需要 5 万甚至 10 万个例子才能保证基本不出错。因此,第三波基于“语境”模型系统的出现顺理成章。IBM 的辩论机器人从海量辩论文本中学习提取有说服力的论点,谷歌推出的“观点接口”用于辨别社交媒体上的恶意评论,都是成功的应用尝试。
第一波人工智能基于严格问题定义获得较强推理能力,但学习和抽象能力欠缺;第二波建立在统计模型基础上,能精准分类和预测,认知和学习能力进步显著,但丧失了推理能力,抽象能力仍不足;第三波理论上是前两波的取长补短,但实现这一目标还面临大量技术和成本问题。越依赖人类直觉、感知的问题,对机器挑战越大,去年优步无人车在旧金山当代艺术博物馆门前闯红灯的事故就是例证。
深度学习的历史变迁
深度学习有着漫长而丰富的历史,其热度跌宕起伏,还曾有过不同名字。它的历史可回溯到 20 世纪 40 年代,当时最早的学习算法多是生物学习的计算模型,被称作人工神经网络(Artificial Neural Networks,ANNs),是基于生物大脑启发的学习系统,那时的“学习”概念比现在更宽泛。如今,神经科学仅作为启发和参照,不再是该领域主导指南,因为目前科学对大脑认识有限,无法为人工智能模拟提供足够信息。媒体常将深度学习与生物大脑联系,误导舆论。实际上,现代深度学习技术除从大脑获灵感外,还架构在大量线性代数、概率、博弈理论及数字优化基础之上。
到了 80 年代,伴随认知科学兴起,神经网络又热过一次,被称作符号推理。期间的联结主义观点认为大量可简单计算的单元联结能执行智能任务,这一潮流持续到 90 年代中期终止,但其“遗产”在包括谷歌在内的很多项目中仍广泛应用。这一波研究终止很大程度是因为相关公司寻求投资时夸大其词,结果未达预期,导致投资者失望。
人工智能行业有个事实,许多自 20 世纪 80 年代起就存在的算法如今表现优秀,但在 2006 年之前并不明显,原因可能是硬件开销。当今强大而廉价的计算能力、存储能力弥补了超前优秀算法的时代鸿沟。
大数据对人工智能的变革
深度学习早在 50 年代就已出现,为何最近才变得重要?它是随机出现的狂热和泡沫吗?其实从 90 年代起,深度学习就有不少成功商业应用,但当时人们更多视之为“艺术”而非“技术”。提升深度学习算法性能需技巧,且技巧需求与训练数据尺寸成反比,随着数据量猛增,对技巧需求降低。如今的学习算法在复杂任务执行能力上达到人类水平,但其本身与 80 年代解决简单问题都困难的算法几乎一样,带来巨变的是海量数据。这些海量数据来自高度联网的计算机和全社会生活的数字化,人们的每一个行为甚至步骤都被数字化记录,这是“大数据”时代给机器学习领域的厚礼。
人工智能商业时代的关键要素
理解了人工智能的能力边界后,企业家需将其运用到企业策略中,明确价值产生环节和难以复制的要素。人工智能行业开放,顶级研究人员乐于分享成果。在这个开源世界里,数据和人才变得极其宝贵。
顶尖人工智能团队复制软件相对容易,获取数据却极为困难,所以数据是许多企业的防御堡垒。简单下载开源代码并应用于自身数据通常难以奏效,人工智能需针对商业环境和数据量身定制,这引发了激烈的人工智能人才竞争。
关于人工智能模仿人性善恶两极的潜能已有诸多讨论,但其对个体在未来可见时间里的最大威胁可能是取代部分人力工种。企业领袖有责任致力于构建一个让每个个体都有繁荣机会的世界。理解人工智能并将其应用于企业策略只是开始,而非结束。