分享

我在孩子班会课上的演讲稿:探索人工智能的奇幻世界

 汪子熙 2024-04-19 发布于上海

各位同学大家好,很高兴有这个机会和大家聊一聊人工智能这个话题。既然都聊到人工智能了,我就让人工智能先给大家打个招呼。

《现场演示》对手机发出指令:

我马上要给一群十多岁的小朋友们做一个关于人工智能的讲座,请你帮我写一段 100 字左右的开场白。

自我介绍略。

在我们正式开始今天的讲座之前,我们先来聊聊科目三。

我知道今年咱们班元旦庆祝会上,汪子熙同学和他的小伙伴们,一起表演了科目三舞蹈。其实大家可能不知道的是,汪子熙同学除了科目三之外,还会跳一些其他的舞蹈哦!下面我们一起来欣赏一段视频。

AIGC 生成的汪子熙舞蹈动作略。

大家觉得视频里汪子熙同学的舞姿水平怎么样?其实视频里不是汪子熙同学本人,而是用人工智能生成的汪子熙的数字化身

人工智能实际是 Artificial Intelligence 的中文翻译,简称 AI,Artificial 是形容词,意思是人工的,Intelligence 是名词,代表智能,智慧的含义。虽然说大家平时可能没有刻意去留意人工智能这个词,但实际上这个技术,早已渗透到我们生活中的方方面面了。

这里是 AI 应用在我们生活中的一些例子。

比如同学们周末,节假日和寒暑假用手机娱乐时,用过抖音,快手,头条,小红书,淘宝,拼多多,微博这些 App 吗?以小红书为例,大家注册完新账号时,App 会让大家选择一些感兴趣的领域,比如历史,体育,二次元,动漫等等,然后就会将对应领域的内容,推送给大家。

大家开始阅读文章和刷视频时,App 会默默记录大家使用 app 的行为,比如记录大家观看每个视频的时间,是否点过赞,留过言,是否转发过。所谓物以类聚,人以群分。App 会认为,大家和大家的粉丝,大家的关注者,这三类人有共同的兴趣爱好。所以智能推荐系统也会将大家的粉丝和大家的关注者喜欢看的内容,推送给大家。

这样随着大家使用 App 的时间越来越长,这些人工智能推荐系统,会越来越了解大家的喜好,推送给大家的内容也越来越精准。

再说到飞机自动驾驶和模拟系统。

咱们之前的《直冲云霄》班会课上,大家已经学到了很多飞行知识。现代飞机上都安装了完善的智能自动驾驶系统,计算机根据探测到的大气数据信息、飞机当前的飞行姿态,以及加速度数据,实时计算出符合飞行原理和导航原理要求的数据,代替飞行员来驾驶飞机。

我们知道国家培养一个飞行员非常不容易,除了熟练掌握常规飞行技术之外,一个飞行员还应该具备在各种极端天气条件和飞机发生系统故障时也能够安全驾驶的技术和心理素质。比如在电闪雷鸣的雷暴天气驾驶,或者是穿越一座正在喷发的火山上空时,飞机发动机忽然停止工作,这种情况该怎么办?显然我们不能让那些新手飞行员,真的开一架飞机飞到天上正在闪电的云层里练习。

这时候使用人工智能的飞行驾驶模拟仓就派上了用场。人工智能模拟仓可以提供逼真的飞行体验,模拟复杂的飞行环境,比如极端天气条件和系统故障等。接受训练的飞行员坐在里面训练的时候,很像在玩闯关游戏。

再说说语音识别。

《实际演示》:小明的爸爸有三个儿子,老大叫大毛,老二叫二毛,老三叫什么?

语音识别的效果演示略。

试一道难一点的题:理发师悖论。

有一位理发师,他只能给那些不给自己理发的人理发。那么请问,这位理发师能够给自己理发吗?

再试试英文对话。

What's the date today?

It's sunny today. I would like to go out for some exercises. Do you have any suggestions?

人脸识别大家应该已经很熟悉了吧。现在很多小区门禁,都是刷脸然后门就自动开了。

前几年我们坐飞机过安检时,安检员还要拿着我们的身份证,通过肉眼进行对比。现在我们走到摄像头前直接扫脸就可以通过了。

指纹识别的话,在名侦探柯南,法医秦明这些侦探类的文学作品里都提到,通过指纹能够唯一识别一个人。警察在犯罪现场提取到指纹,然后到指纹库里进行比对。在电子计算机诞生之前,这些指纹比对全靠鉴定人员用肉眼一张一张比对。在有些场合,比如雨天或者纵火现场,采集的指纹可能比较模糊,给鉴定人员带来很多困难。

而有了人工智能的辅助鉴定系统,各种干扰信息对这些系统丝毫不起作用,计算机进行的指纹比对可以瞬间就完成。

我知道咱们班上一部分同学对电脑游戏感兴趣,而且也觉得游戏里的人机简直弱爆了。人机指的是游戏里由计算机程序控制的非人类玩家角色。像《和平精英》这种手机平台上的射击游戏,人机角色的主要任务,是让新手熟悉游戏操作,提升信心。

其实人机的智能程度,理论上是可以通过人工智能程序的升级而无限制提升,只不过现实游戏公司没有必要这样去做。因为大家喜欢玩这些游戏,主要还是因为能够和身边的朋友一起,在虚拟的游戏世界里合作或者对抗,大家更在意的是同真人玩家的互动,而不是和这些毫无情感的人机角色一较高低。

大家如果留意一些科技新闻,就会发现围棋和国际象棋的世界冠军,都已经败给了人工智能程序。现代的人类棋手面前的这些人工智能对手,已经越来越强大了,它们没有喜怒哀乐,没有情绪的起伏,永远不会疲倦,思考速度极快,人类棋手下一步,人工智能就能预演出后续棋局的所有可能性。所以人类棋手和人工智能棋手的对抗,现在是胜少败多了。

AIGC 领域,GC 就是 Generated Content,生成内容的意思。我们可以让 AI 帮我们写作文,画图,生成视频。这些人工智能生成的内容,就统称为 AIGC.

刚刚我们看到 AI 生成的汪子熙同学的舞蹈,我和人工智能的语音对话,都属于人工智能生成的内容。

再比如这个效果。

汪子熙智能体效果略。

通过前面的演示,相信大家已经对人工智能的概念,有一些非常具体的感受了吧。

如果用一句话来给这个概念做一个定义,人工智能就是让电子计算机具有像人一样的智能,能够和人类一样,理解语言,识别图片,学习新事物。

那么作为一门新兴而独立的科学,人工智能的发展历史又是如何呢?

科学家们要研究如何给电子计算机赋予人类的智能,就得先搞清楚人类的智慧是从哪里来的。

在电子计算机诞生的一百多年前,就有另一门学科,叫做脑神经科学,专门研究人脑构造。这门学科经过一百多年的发展,已经取得了一些成果,比如科学家发现人脑不同的区域,有着不同的功能和作用。

有的区域负责控制我们的情绪,产生喜怒哀乐等情感,有的区域负责储存记忆,有的区域负责同人类的其他器官进行交互,产生听觉,视觉,触觉,味觉等等。

举个例子,我们在上课听讲时,眼睛看着课本或者黑板,耳朵听着老师的讲解。视觉信息首先通过眼睛接收,光线被视网膜上的感光细胞捕捉,光信号被转化为电信号。这些电信号通过视神经,传送到大脑负责处理视觉的区域。在这个区域里,神经元开始处理视觉信息的基本元素,比如眼睛看到物体的颜色、形状和运动轨迹。这就是我们眼睛能够看到东西的原理。

当学生听老师讲课时,声音通过外耳进入,振动通过中耳传递到内耳的耳蜗。在耳蜗内,声波转化为神经信号,这些信号经过听神经,传递到大脑处理听觉的区域。该区域内的神经元,开始识别声音的基本属性,比如音高和响度。所以我们就听到了声音。

大脑需要将视觉和听觉信息进行整合,这一过程主要发生在大脑的联合区域,比如颞顶交界区,这样我们才能将看到的课本或者板书,同听到的老师讲解结合起来。

当我们开始努力理解老师的讲解和课本内容时,大脑的前额叶扮演了重要角色。前额叶与高级认知功能相关,包括推理、记忆、以及抽象思维。

为了将新学的信息转化为长期记忆,海马区及其周围的结构发挥了核心作用。知识的记忆,通过大脑海马区内部神经元之间建立新连接来形成的。

大脑不同区域的神经元,通过神经连接起来,就形成了我们图上看到这种神经网络结构。

我们经常听到的那句“脑子越用越灵光”的俗语,从神经科学角度讲,是有科学依据的。经常动脑,会不断刺激大脑相关区域神经元的活性和彼此之间的联系,使我们对已有知识的记忆和理解不断加深,同时更易于接受新的知识。

脑科学也能解释很多生活中的现象。比如我们休息的时候,看漫画,或者刷手机视频,觉得很轻松,时间一会就过去了。而我们上一节课超过40分钟,或者做一些难题时,时间一长就会觉得累。原因就在于上课听讲或者刷题时,大脑多个区域处于活动状态,尤其是听一些内容比较难的课时,需要高度集中注意力才能完成特定的任务,所以大脑容易疲倦。而刷短视频,看漫画,因为大脑没有特定任务需要完成,大部分区域都处于放松的状态,所以就算连续看一小时也不会觉得累。

我们了解了人类大脑的思考过程后,怎么用电子计算机实现类似的智能呢?

我们通过一个实际的例子来了解人工智能的一些工作原理。

我请一位同学来介绍,屏幕上这两个可爱的小动物,哪一只是狗,哪一只是猫?

想一想我们幼儿时期,是如何学会辨认这两种小动物的?可能是爸爸妈妈和我们一起看绘本,指着上面的动物说,这是小猫,那是小狗。或者是爸爸妈妈牵着我们外出走路,看到路旁走过一只狗的时候,就指着它说,这是一只小狗。

人类会通过观察,和聆听周围人的教导,来学会辨认这些动物。

大家来挑战一下,你们觉得这个动物,到底是猫还是狗?

果让人工智能来识别这些图片,结果又如何呢?首先我们看看效果。

我使用的是 ChatGPT 这款人工智能程序。我上传了一张小猫的图片,它成功辨认了出来。

再试了一张照片,它居然还能认出这是拉布拉多的幼犬。

再看 ChatGPT 对待这种外观看起来有点怪异的生物时,表现怎么样?它能成功识别出这不是一种自然界真实的动物,而是基于一只猫的风格化描述。

事实上这张图片也是我用人工智能绘制出来的,我要求人工智能画一个 50% 像猫,50% 像狗的动物,最后得到了这张图片。

那么人工智能程序是如何学会辨认猫和狗的呢?

计算机科学家们受到大脑神经网络的启发,发明出了一种叫做卷积神经网络的程序。同学们现在正在学代数式的加减乘除操作。卷积是数学里的一种操作,操作的对象是函数。大家的数学课上很快就要学到函数这个重要的概念了,并且函数也是大家未来中考和高考的一个重要考点。

图片识别的卷积神经网络的示意图,这个网状结构和之前一张 ppt 里的大脑神经网络很类似。

卷积神经网络分为很多层,每一层负责不同的任务。最前面的卷积层负责提取图片的特征,得到图片中动物图形的边缘和纹理。每一层根据前一层的计算结果再进行处理,最后得到输出结果,结果是一组概率,比如这张图片代表猫的概率是 A,代表狗的概率是 B,代表猪的概率是 C,以此类推。

卷积神经网络的工作方式,大家可以做一个类比。假设咱们班要做一批手工艺术品,把全班按照纵向分成若干个小组,每个小组就好比一个卷积层。

  • 第一个小组,也就是第一个卷积层,负责把密封在塑料袋里的原材料拆封。

  • 第二个小组,负责用剪刀把原材料按照虚线剪下来。

  • 第三个小组,负责把剪下来的原材料按照图纸拼装。

  • 第四个小组,负责把拼装好的工艺品涂上颜色。

  • 第五个小组,负责在涂好色的原材料上添加花纹和题字。

总之每个小组,负责接收前一个小组完成的内容,在此基础上加工,再传递给下一个小组。

图像识别的卷积神经网络的工作原理也类似。

每一个卷积层完成的都是数学计算,使用的计算公式,大家可以类比成你们正在学的代数式,只不过是一个很长很长的代数式,未知数的个数非常多。未知数的值,来自前一个卷积层计算的结果。未知数的系数从哪里来呢?

来自海量的数据,也就是上图这些蓝色图案代表的数据。

要让人工智能能够识别猫和狗,我们就要事先准备大量的猫狗的图片。

这些图片应该尽可能多样化,包含不同品种、不同大小、不同姿态的猫和狗,从而使卷积神经网络能够学习到尽可能多的特征。

卷积神经网络通过不断的识别这些猫和狗的图片,来调节自己的计算公式中的系数,确保最后计算出的判定每种动物的概率,越来越准确。

卷积神经网络根据这些图片,不断优化自身计算公式的行为,在人工智能科学有个专门的术语,就叫做训练。

我们可以通过一个视频,来了解卷积神经网络模型,是如何通过数学的方法,提取一张图片里的特征的。

比如我们想让人工智能程序识别出数字 7.

对于同学们来说,这个任务再简单不过了。和其他数字相比,7 的特征就是水平方向一划,垂直方向再一划。

那么如何让人工智能程序识别出这种特征呢?来看下面这个视频。

那么,如何才能成为一位人工智能从业者呢?同学们现在努力学习,高考时报考大学的人工智能专业,就可以系统学习这门科学了。

目前国内有四百多所高校开设了人工智能专业。下图是全国人工智能排名前列的高校列表。

人工智能专业要学习的专业课列表。能看出里面包含很多理工科都要学习的基础课,这些基础课多是和数学相关,比如离散数学,高等数学,线性代数,也有计算机科学的基础课,比如程序设计基础,Linux 操作系统,数据库技术,计算机网络技术。当然剩下的都是人工智能这个学科的专业课程了。

家从这里能看到,梁老师每周给大家讲授的 Python 应用开发也在里面。Python 是人工智能领域使用非常广泛的一门编程语言,也是现在国内外软件开发使用的一门主流编程语言。大家将来如果把这门编程语言学到精通的程度,找一个待遇丰厚的工作不成问题。

在座的各位都是一零后,等大家将来大学毕业,走上工作岗位之后,大家所处的,是一个和现在相比,更加充满挑战和变化的社会。新的技术和理念会层出不穷,大家从现在的校内学习生活出发,养成良好的学习习惯,长大后保持终身学习,就能从容应对未来的各种挑战。

你学过的每样东西,都会在你一生中的某个时刻排上用场。

学习不能改变人生的起点,但可以改变人生的终点。

学习不能改变人生的长度,但可以改变人生的厚度。

谢谢大家的聆听。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多