分享

“深度学习”是怎样识别杯子的?

 我思故我在hyp 2019-01-25
               “深度学习”是怎样识别杯子的?

“深度学习”是怎样识别杯子的?


    我们知道,现在智能产业非常厉害,什么智能驾驶汽车,智能看病,智能人取代播音员、律师,等等。
    我估计大多数人认为这不过是电脑科技越来越发达罢了,稍微懂点电脑的人也许认为这不过是电脑程序编得越来越复杂,越来越先进罢了。其实不是这样,从过去的电脑高科技到现在的智能化,有一个质的飞跃,跟过去完全两码事了,这个质的飞跃就叫做“深度学习”。
    智能化不是比原来更聪明,而是换了一个头脑完全不同的新人。打个比方,原来那人好比是个听话的女孩,但只能老师(程序员)说啥她干啥。现在不是让那个女孩变得更聪明,而是直接换一个聪明捣蛋的男孩,关键有强大的自学能力,下面我就讲讲机器怎么自学。


“深度学习”是怎样识别杯子的?

    我后半生的工作是做软件编程序,对智能化多少有一点了解,当时我看到电视上专家讲智能化,讲深度学习,非常吃惊!
    他举一个怎样识别杯子的例子。比如以前的机器人,如果要想去拿一只杯子,首先要识别什么叫杯子。
    按照我们过去编程序的想法,首先要给“杯子”一个定义,比如大小,形状,太大的就不能叫杯子,而是桶了,太小的那是耳挖勺。太扁的那叫盘子,太瘦高的叫管子。
    我们编程人员得把符合杯子的所有限制条件全都写在程序中。但即使这样,机器人还会犯错误,因为总有我们意想不到的例外。
    比如杯子总得上口大一些是撇沿儿的吧?起码上下一边儿粗是直筒吧?但也许有一种上细下粗的怪杯子,甚至曲里拐弯的,花瓶状的。
    又比如杯子有没有把儿?也许有,也许没有。什么叫“把儿”?我们可以定义:是“半个环状物,连在杯子上”,但实际上有的杯子把儿不是环,而是只出来一个拐弯儿,甚至连弯都不拐,只出来个片儿,或者球!


“深度学习”是怎样识别杯子的?

    如果靠这样搜尽所有例外来编程序得把我们累死,而且永远不可能尽善尽美。我编过程序很清楚,再厉害的程序都会有漏洞。但“深度学习”就不是这样。
    我们想想,儿童是怎样识别杯子的?是不是在他两三岁时,就给他灌输一套杯子的定义?多大,什么形状?有没有把儿?不,完全不是这样,只是给他说:宝宝,去把杯子拿来!宝宝如果拿来一只碗,你告诉他,错了。如果他拿对了,则夸一句,摸摸头,赏一颗糖。
    “深度学习”就是模仿儿童学习的思维方式。程序员不需要编一套完整,死板的定义和程序,而是编一套自己能学习能变化的程序,根本不给出什么“鸟定义”,只是让机器人自己去试错。看看眼前的东西是不是杯子,由人来打分,判断是对还是错。训练的次数多了,机器人自己就逐渐学会什么叫杯子了。
    所谓能学习能变化的程序,说穿了就是要让机器在已有程序的基础上,能自己编新程序,自己定义参数。这种让程序自己编程序的想法,我以前在编程序时也简单实验过,很有趣,也很深刻。
    记得当时电视主持人问专家,机器人自己编程序,你们能预料得到它们怎么编吗?专家笑笑说:连我们也闹不清楚它们编了些什么程序!
    当时我听到这儿,大吃一惊!当年我让程序自己编的程序,大致能预料到会编成什么样,那只能算最浅度的学习,而现在居然连机器人的父亲——程序员也闹不清它们会编出些什么来。这才能叫做“深度学习”。想想确实是这样,父母能闹清楚孩子是怎么学习的吗?他脑子里发生了什么新变化?父母根本闹不清。


“深度学习”是怎样识别杯子的?

    当机器每次试错之后,机器会自动生成一段新程序,或更改几个参数,机器就进步了,提高了。这就叫做“自学”。这就是那个聪明捣蛋的男孩。
 
    我们大家都听说过机器人跟人类下棋的故事。刚开始的时候,所有程序和数据都是人类给它编好的,人类给它放进去许多以往高手冠军的下棋套路,有点儿像专业棋手“背棋谱”。没背过棋谱的业余玩家,跟专业高手根本没法儿对阵。
    机器人厉害不厉害,能达到多少段,不过是看放进去多少棋谱,数据库够不够大,运算速度够不够快而已。
    实际上那时的机器人很笨,自己没有一点智能,只是个计算和存储的死机器。它那时能打败卡斯帕罗夫,不过是利用了大空间和高速度而已。
    后来的机器人就有了深度学习功能,会自己编程序。一开始简直也许等于个小孩,臭棋篓子。经过与大量人类棋手对阵,经过多次失败的教训,它就能自己编出更好的程序和套路。直到最终下败人类冠军。

“深度学习”是怎样识别杯子的?

    这样的机器人才算开始有了真正的“脑子”,能学习,会思维了。这时把它叫做“机器人”,才开始有点名符其实。人类也是这样,世界上没有什么先知先觉,但只要具有强大的自学能力,丫丫学语的孩子就可能成长为诺奖超人。

    比如现在的人脸识别也是这样,一开始识别功能不强,面对一个脸型,它只会计算五官位置之间的关系。如果戴了眼睛,留了胡子,化了妆,甚至做个表情,歪鼻子斜瞪眼儿,可能就不认识了。但经过人类的训练,它能自己学习,识别能力越来越强。从理论上说,大概除了整容换脸识别不出来,其它都应该能识别了。

“深度学习”是怎样识别杯子的?


“深度学习”是怎样识别杯子的?

    不过据我所知,现在机器人的识别能力仍然比不上人类。据说有人用一张照片,就能骗过识别机。如果换了人类,哪怕是小孩,你给他一张妈妈的照片,他决不会叫妈妈。他知道那是平面的,不会动的,没有感情的一张纸片。起码孩子有两只眼睛,能利用双目视觉功能,测出脸型上五官的凸凹高低,知道它是平面的,还是立体的。
    又比如我家小区大门的人脸识别,感觉学习功能不怎么样。物业要求我们把身份证输入电脑,而身份证照片不能戴眼镜,也不能戴帽子,只要我戴了眼镜和帽子,它就不认识,不让我进大门。我必须同时掏出身份证,它再扫脸对照,才能知道是我,太麻烦。

“深度学习”是怎样识别杯子的?

    再说,我已经很多次把我的脸跟我的身份证同时让它看了,它也说了:“对比成功!进吧您呐。”按理说,它应该通过学习,逐步知道那个既戴眼镜又戴帽子的老叟就是我了,应该我每次往那儿一站就让我进去。但几个月过去了,还是死抠儿,不摘眼镜还是不认识我,非逼得我掏身份证不可。还不如我孙子。
    也许我们小区买的是便宜货?低档货?
    总之,现在的机器识别人脸虽然已经有了深度学习能力,但在智能上仍然不够高,跟人类的智能仍然有距离,大概还不如三岁小孩。但起码它不再是死程序了,它已经能自己编程序,能深度学习,可以越学越厉害。假以时日,将来能发展到哪一步,比如能不能达到成人的思维?现在还很难说。
    至于能不能达到科学家、艺术家的思维?如果没有更彻底的革命性思维,只靠所谓“深度学习”,恐怕永远也达不到那个高度。因为科学家和艺术家只靠学习培养是训练不出来的,那些都是天才,具有创造性思维的天赋,而人类是否能制造出“创造性思维”?天知道。

                2019年1月16日

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多