分享

读书笔记之《认识AI:人工智能如何赋能商业》

 AIGC部落 2025-03-10 发布于广东

《认识AI:人工智能如何赋能商业》(Artificial Intelligence for Business)是一本AI基础概念科普书。作者是Doug Rose。

道格·罗斯(Doug Rose):有超过25年为各种组织提供技术、培训和流程优化变革的经验。他是美国项目管理协会(PMI)关于敏捷框架的第一本主要出版物Leading Agile Teams的作者,还是Data Science: Create Teams That Ask the Right Questions and Deliver Real Value和Enterprise Agility for Dummies两本书的作者。

序言:

要想找到最佳的商业机会,你需要更深入地了解人工智能这一工具。你可以想一想,一些顶级企业并非因为率先推向市场才获得成功。苹果并非第一家制造音乐播放器的公司,谷歌也不是最早的搜索引擎。这些公司取得成功是因为它们了解工具和技术的适用范围,以及如何将它们运用到当前及未来的商业需求当中。本书旨在让你踏上这样一条道路,即对人工智能范畴之下的不同技术进行高级别的概述。在本书中,你会看到诸多关于如何将这种技术应用到不同商业机会当中的实例。一旦你对这些工具有了更好的理解,你就能够为新企业或现有企业制定更长远的战略。商业机会多种多样(且尚待发现),难以简单罗列。我希望你能够全面了解这项技术,然后能够将其应用到你所在组织的机遇当中,甚至可以凭借它开启一段新的创业旅程。

第一部分:思考机器:人工智能概览

第1章:什么是人工智能?

定义与历史:人工智能(AI)由约翰·麦卡锡在1956年提出,目标是让计算机表现出人类智能行为。早期AI受限于硬件,但激发了人们对智能机器的想象。

智能的定义:人类智能包括知识、推理、意识、情感等,难以用单一标准衡量。AI模仿人类智能,但不等同于人类智能。

图灵测试:艾伦·图灵提出,若机器能通过自然语言交流让人难以区分其与人类,可视为智能。尽管有争议,仍激励AI发展。

当计算机处于自己的“主场”时,人工智能总是显得更加令人印象深刻——即规则清晰且可能性有限的环境。最能从人工智能中受益的组织是那些在规则明确且界限清晰的空间内工作的组织,因此谷歌等公司全面拥抱人工智能也就不足为奇了。谷歌的整个业务都涉及模式匹配——将用户的问题与庞大的答案数据库进行匹配。人工智能专家通常将这种模式称为“传统人工智能”(Good Old-Fashioned Artificial Intelligence,简称GOFAI)。

约翰·塞尔(John Searle)指出,任何符号人工智能都应被视为弱人工智能。在20世纪70年代和80年代,符号系统被用来开发能够做出专家级决策的人工智能软件,这些系统通常被称为专家系统。

在专家系统中,某一领域的专家会将计算机可以匹配的模式输入系统,以便得出特定结论。例如,在医学领域,医生可能会输入与各种诊断相对应的症状组合。护士将患者的症状输入计算机,计算机随后会在其数据库中搜索匹配的诊断,并向患者提供最可能的诊断结果。例如,如果患者有咳嗽、气短和轻微发热的症状,计算机可能会得出患者可能患有支气管炎的结论。在患者看来,计算机似乎和医生一样聪明,但实际上,计算机所做的只是将症状与可能的诊断进行匹配。

专家系统和其他符号系统一样,最终会遇到组合爆炸的问题。在尝试诊断疾病时,需要考虑的症状、诊断和变量实在太多。想想看,医生为了得出准确诊断需要采取的所有步骤——进行体格检查、询问患者病史、安排实验室检测,有时还需要排除一系列具有相似症状的其他疾病。想象一下患者对医生每个问题可能做出的所有回答,以及各种实验室检测结果的不同组合。

这些早期的专家系统还有一个严重的局限性——在某些输入条件下,系统可能无法找到匹配项。你可能在许多网站上都经历过这种情况:输入搜索词后,网站会提示没有找到匹配项。

这些符号系统将永远局限于系统本身的记忆中,它只知道被预设的信息。所以这些系统的智能性依赖于人类。他们可以用封装好的短语和记忆中存储的信息来应答。但是当这些符号系统遇到任何新的符号或者未遇见的符号时,他们就会失败。因此,未来的最大挑战是让人工智能更具普遍性,而不仅仅是匹配记忆的符号。

第2章:机器学习的兴起

机器学习的诞生:1959年,亚瑟·塞缪尔创造了能自我学习的跳棋程序,标志着机器学习的开始。机器学习让计算机通过数据学习,而非依赖预设指令。

机器学习的优势:能处理大数据,发现人类难以察觉的模式。随着数据存储和处理成本降低,机器学习迅速发展。

应用实例:包括数据安全、投资、在线软件开发、医疗、个性化营销、欺诈检测、在线搜索和智能设备等。

机器学习的一个关键优势在于,它不需要专家来创建符号模式并列出对一个问题或陈述的所有可能回应。机器能够独立创建和维护这些列表,识别模式并将它们添加到数据库中。

想象一下将机器学习应用于中文屋实验。计算机将观察自身与屋外人之间传递的纸条。在检查了数千次交流之后,计算机识别出一种交流模式,并将常见的词汇和短语添加到数据库中。现在,它可以用这些词汇和短语更快地解读收到的纸条,并快速组装回应,而无需从字符集合中逐个组合回应。它甚至可以根据这些匹配模式创建自己的词典,以便对某些收到的纸条提供完整的回应。

机器学习仍然属于弱人工智能,因为计算机并不理解交流的内容;它只是匹配符号并识别模式。最大的区别在于,计算机不再依赖专家提供模式,而是从数据中自行识别模式。随着时间的推移,计算机变得“更聪明”。

机器学习成为人工智能领域增长最快的领域之一,主要是因为数据存储和处理成本的大幅下降。我们目前正处于数据科学和大数据时代——可以通过计算机分析超大数据集以揭示模式、趋势和关联。组织正在收集海量数据,而最大的挑战在于如何处理这些数据。机器学习能够应对这一挑战,即使你不知道自己在寻找什么,它也能识别出模式。从某种意义上说,机器学习使计算机能够发现数据中的内容,并告诉你它发现了什么。

机器学习突破了符号系统的局限性。计算机系统不再依赖记忆符号,而是通过机器学习算法创建抽象概念的模型。它通过对海量数据应用机器学习算法来检测统计模式。

隐藏层使网络能够处理非线性问题。因此,如果你想确定不同品种的狗,你可以让每一层将问题分解为不同的输出。第一层可以观察狗的鼻子,第二层可以观察狗的眼睛。每一层都可以将狗分解为属于某一品种的不同概率。

如果你决定开始从事人工智能相关的工作,就要接受这样一个事实:神经网络可能会感知到人类无法感知的东西。 人工智能与人类智能并不相同。即使我们可能会得出相同的结论,但我们的思考过程肯定不一样。

第3章:锁定最佳方法

专家系统与机器学习:专家系统适用于有明确步骤的问题,机器学习适用于数据量大、模式不确定的情况。

监督学习与无监督学习:监督学习由人类标注数据,无监督学习让机器自行发现数据模式。

误差反向传播:通过调整神经网络的权重,优化分类和预测的准确性。

在启动自己的人工智能项目之前,你需要做出一些选择,例如判断专家系统或机器学习是否更适合你的特定用例。尽管机器学习无疑更为先进,但在某些应用场景中,专家系统往往是更好的选择。如果你决定采用机器学习,还需要考虑一些额外的因素,例如是否使用监督学习或无监督学习,是否使用反向传播来微调你的系统,以及是否使用回归分析来衡量不同因素的重要性。

是使用专家系统(基于规则的系统)还是机器学习?基本上,这种选择取决于数据量的大小、数据的变化程度,以及你是否有一套明确的步骤可以从这些数据中提取解决方案。当你的问题是顺序性的,并且存在有限的步骤来找到解决方案时,专家系统是最佳选择。而当你希望超越对顺序步骤的记忆,并且需要分析大量数据以进行预测或识别可能提供洞察的模式——即使你可能并不知道这些模式会提供帮助——即当你的问题存在一定不确定性时,机器学习则是更好的选择。

在启动自己的人工智能项目时,思考一下你希望如何对数据进行分类。如果你已经定义了明确的类别,并希望机器使用这些类别来对输入数据进行分类,那么你可能应该坚持使用监督学习。如果你不确定如何对数据进行分组和分类,或者你希望以一种新的方式看待数据,那么无监督学习可能是更好的选择;它可能会让计算机识别出你可能会忽略的相似性和差异性。

为了理解梯度下降,想象一个颜色渐变,它从白色到黑色显示了一系列阴影颜色的变化。

在我的果冻豆例子中,我沿着这个渐变逐渐移动,选择越来越深的颜色。只有在我确认刚刚吃掉的果冻豆是安全的之后,我才会尝试更深的颜色。换句话说,我在颜色渐变上进行微小的调整,并通过品尝果冻豆来获得反馈,以确保我走在正确的方向上。

梯度下降和反向传播使得人工神经网络能够进行类似的调整。如果一个人工神经网络正在学习扩展其果冻豆的种类,它会从白色的果冻豆开始,并沿着颜色渐变尝试越来越深色的果冻豆。网络会不断测试每种果冻豆的味道,直到最终尝到一颗黑色的果冻豆。此时,反向传播算法会启动,并告诉神经网络它在颜色渐变上走得过远了(请注意,反向传播通常只用于监督学习)。

这些算法通过调整每个连接的权重来工作。在人工神经网络中,每个神经元都有一个权重(通常在0到1之间),这表明它与前一个或后一个神经元的连接强度。权重越接近1,连接越强;权重越接近0,连接越弱。神经网络会随着时间调整这些连接的权重,以匹配不同的模式。强连接表明明确的匹配,而弱连接则表明可能的匹配或根本没有匹配。

在监督学习中,你需要一种方法来让神经网络知道它何时犯了错误——即它未能识别匹配项,或者错误地识别了匹配项。假设神经网络将一颗紫色的果冻豆误认为是黑色的果冻豆。反向传播算法会调整神经连接的权重,以减少神经网络在未来再次犯同样错误的可能性。

请记住,我的朋友和家人都需要鼓励我尝试颜色更深的果冻豆。人工神经网络也是如此。一个人需要识别出白色和黑色的果冻豆,然后帮助网络调整渐变的旋钮,以扩展其可接受的果冻豆种类。

无论你是使用反向传播还是回归分析,你的人工神经网络只能向你展示模式。它并不一定能提供答案,也不会给出解释。例如,在信用卡的例子中,网络指出,当客户开始使用信用卡进行五美元或以下的小额购物时,他们很可能会在偿还信用卡账单时遇到困难,但它并没有解释为什么会这样。在识别出这一模式之后,就需要人类来确定原因。也许在某个时候,这些人造神经网络能够自行创造出关于这些模式为何存在的理论。但就目前而言,人类需要从这些联系中寻找意义。

第4章:常见AI应用

智能机器人:结合AI的机器人能适应环境变化,如自动驾驶汽车通过传感器和神经网络学习驾驶。

自然语言处理(NLP):使机器能理解人类语言,如Siri和Alexa通过NLP与用户交流。

物联网(IoT):连接设备生成大量数据,AI分析这些数据以优化设备性能和提供服务。

第5章:将AI应用于大数据

大数据的概念:指可被计算机分析以揭示模式、趋势和关联的海量数据集。

数据科学家的作用:帮助组织理解和利用数据,选择合适的方法和技术。

机器学习与数据挖掘的区别:数据挖掘从数据中提取信息,机器学习让计算机自主学习和发现模式。

第6章:权衡你的选择

是否需要AI:并非所有问题都需要AI,有时传统方法或简单工具更有效。

机器学习与专家系统的适用性:根据问题的复杂性和数据量选择合适的技术。

AI项目的规划:考虑数据的可用性、问题的性质和预期的输出。

第二部分:机器学习

第7章:什么是机器学习?

学习的含义:机器学习是让计算机通过数据学习,而非依赖预设指令。

机器学习的过程:包括提供数据、选择算法、训练模型和测试模型。

机器学习的应用:广泛应用于多个行业,如搜索、推荐、翻译和预测等。

第8章:机器学习的不同方式

监督学习:通过标注数据训练机器,使其能预测输出。

无监督学习:让机器自行发现数据中的模式和关系。

半监督学习:结合监督和无监督学习,适用于数据量大但标注数据有限的情况。

强化学习:通过奖励机制让机器学习最优行为。

第9章:流行的机器学习算法

分类问题:如决策树、K最近邻、朴素贝叶斯等算法,用于将数据分为不同类别。

回归问题:如线性回归,用于预测连续值。

聚类问题:如K均值聚类,用于将数据分组。

第10章:应用机器学习算法

偏差-方差权衡:模型的复杂度与数据的拟合程度之间的平衡。

模型拟合:通过调整算法和数据,使模型更好地拟合数据。

算法选择:根据问题的性质选择合适的算法,如决策树、分类算法或回归算法。

第11章:忠告

探索性思维:鼓励组织成员提出问题和探索AI的潜力。

数据管理:保持训练数据和测试数据的分离,避免过早宣布模型的准确性。

算法熟悉度:了解不同算法的特点,选择合适的工具。

第三部分:人工神经网络

第12章:什么是人工神经网络?

神经网络的基本原理:模仿人脑的结构和功能,通过节点和连接进行数据处理。

感知器:神经网络的基本单元,通过输入、权重和激活函数产生输出。

学习机制:通过调整权重和偏差,使网络能更好地识别模式和进行预测。

第13章:人工神经网络在行动

数据输入:将图像等数据转换为神经网络可处理的形式。

隐藏层的作用:进行复杂计算,提取数据中的特征。

激活函数:如Sigmoid函数和ReLU函数,用于调整节点的输出。

第14章:让你的网络学习

误差反向传播:通过计算成本函数和梯度下降,调整网络的权重和偏差,优化输出。

链式法则:用于计算成本函数对每个权重的导数,指导权重的调整。

随机梯度下降:将大数据集分解为小批次,减轻网络的处理负担。

第15章:使用神经网络进行分类或聚类

分类问题:使用监督学习,将数据分为预定义的类别。

聚类问题:使用无监督学习,让网络自行发现数据中的模式和分组。

应用实例:如垃圾邮件检测、欺诈检测、面部识别等。

第16章:关键挑战

数据获取:需要大量高质量的数据,可通过公开数据源或购买获得。

数据管理:保持训练数据和测试数据的分离,避免数据偏差。

探索性方法:利用无监督学习发现未知模式,激发创新。

工具选择:根据问题的性质选择合适的工具,不盲目依赖神经网络。

第四部分:人工智能实践

第17章:利用自然语言处理的威力

第18章:客户互动自动化

第19章:提升基于数据的决策

第20章:利用机器学习预测事件及结果

第21章:构建人工智能系统

自动化vs智能化:与自动化系统不同,人工智能将设计师的触角延伸到未知环境中。换句话说,衡量人工智能系统的一个基本标准是该系统可以学习和改进,而无需人工培训师的输入或者指导。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多