分享

AI人工智能的学习方向和路线是怎么样的?

 文明世界拼图 2023-04-24 发布于重庆

最近有很多同学问我,零基础学习⼈⼯智能的路线是怎么样的?

废话不多说,先上⼀张图镇楼,看看零基础学习⼈⼯智能的路线有哪些⽅向,它们之间有什么关系和区别,各自需要学习哪些东⻄。

文章图片1

在这个圈⼦技术⻔类中,⼯作岗位主要有以下三个⽅向:

  • 数据分析/机器学习:Python数据分析/量化交易/舆情分析/信号处理
  • ⾃然语⾔处理NLP:对话系统/翻译软件/物体命名/知识图谱
  • 机器视觉CV:图像分割/分类/⽬标检测/OCR/⾃动驾驶

下⾯逐⼀说明⼀下。

第一个方向:数据分析/机器学习

如果你是来⾃医疗⾏业、⼯业、零售和⾦融等⾏业 ,那么恭喜你,今年2023年⼀共投资了155起融资,你可以把数据分析、机器学习作为⼀个岗位结合到以上⾏业中进⾏就业/提升,从⽽加薪。

文章图片2
文章图片3

⽐如说,在医疗⾏业⾥⾯⽤随机森林算法进⾏预测肿瘤癌症,在⼯业中⽤SVM算法进⾏异常值分析/零件缺陷,在⾦融⾏业⾥⾯⽤Python的Pandas分析搜狐证券,并⽤机器学习的树模型建模。

文章图片4

具体要掌握哪些技能/知识/理论/项⽬呢:

  • Excel结合数据分析思维 数据分析必学编程语⾔Python Python数据分析 MySQL数据分析实战 互联⽹公司必备Tableau商业智能⼯具 数据分析必备理论基础-统计学知识 某⼚转让可⾏性数据分析
  • 量化交易-A股预测
  • 联通信号处理
  • ⽣猪价格预测
  • 京东/天猫⾼潜⽤户下单预测

总结⼀下,数据分析师/机器学习⼯程师都是在做⽂本分析、表格建模,涉及⾏业、⼯业、零售和⾦融等⾏业(互联⽹+⽅向) ,最多的⼯作就是在研究⽤户、研究流量、研究产品等

分析⽤户、流量和产品⽤到的技术主要以Python数据分析、机器学习和统计学三⼤技术栈为主,也有少部分的Excel、MySQL和Tableau等⼯具。

数据分析师/机器学习⼯程师,相对开发⽅向,对编程的要求要低⼀些(只是相对,部分产品的研发对数据分析师要求并不低),甚⾄我⻅过不少公司的数据分析师对⼈⼯智能的算法⼀⽆所知。在这种情况下,如果除了基本的数据分析的功底以外,对⼈⼯智能技术有所了解,⾃然会是你⾯试这些岗位时的加分项。

第二个方向:自然语言处理NLP

文章图片5
文章图片6

⾃然语⾔处理NLP⽅向,这是人工智能AI两⼤技术⽅向之⼀。

这个⽅向主要涉及到软件机器⼈对话/问答系统、翻译软件、物体命名分析等⼯作,涉及GPT分析、Transformer、BRET等技术。因为经常都是与⼤⽂本打交道,所以久⽽久之⾮⼯科的同学⾮常适合学NLP⽅向,尤其是来⾃互联⽹+的⾏业的同学。

这个⽅向的特点是:需要耐得住寂寞。

比不上机器视觉可以有实实在在的产品输出,也⽐不上⾃动驾驶⽅向听起来的狂拽炫酷,这个⽅向更多时间是在默默的分析和研究 ,更加适合就业,混⼝饭吃。

以chatGPT的⼤语⾔模型Transforer为例,光是学习五花⼋⻔的论⽂就需要花不少的时间。在这个领域,为了研究⼀个问题,可能花费数⽉甚⾄数年时间,这绝⾮⼀般⼈能坚持下来的。不仅如此,不是勤奋就可以成功,更多还要靠天分。

像⾕歌、百度、字节等公司⼏⼤⼈⼯智能实验室的掌⻔⼈,业界知名的李开复、陆奇这些⼈物,他们已经深谙漏洞挖掘的奥义,并将这⻔绝技融会贯通,做个梦都能想到新的玩法。不过像这样的天才实在是少之⼜少,绝⼤多数⼈都⽆法企及。

如果说程序员是苦逼的话,那⾃然语⾔处理NLP就是苦逼Plus

第三个方向:机器视觉CV

文章图片7
文章图片8

在这张图路线图中,⼀共划分了15个章节,但并不是说你得学完全部才能上⼿⼯作,对于⼀些初级岗位,学到第第⼗⼆章个阶段就⾜矣。

下⾯的内容,⼀定要结合上⾯这张图看效果才最好,建议在浏览器中新建⼀个tab⻚⾯,打开那张图,结合着看。

文章图片9

一、青铜时代

第⼀个阶段——⽯器时代,针对的是纯新⼿⼩⽩刚刚⼊场。在这个阶段,主要是打基础,需要学习的有4部分内容:

1、数据分析思维与业务流程

文章图片10

当年数据分析包含⼈⼯智能、机器学习,数据分析思维是⾯试和⽼板对话的重中之重,逻辑树、5W2H、SWOT等数据分析⽅法是互联⽹公司中必知必会的,还有掌握5个流程的细节,从明确⽬标、数据清洗、数据分析、数据展现到数据分析报告都要全⽅位掌握。

除此之外,学习在机器学习上⾯进⾏⽂本预测、表格分析等预测,要先学会Excel分析,为接下来学习表格建模做准备⼯作。

⼈⼯智能,必然要与算法经常打交道,我看到很多新⼈⼀上来就跟着⼀些培训班学习算法,学的云⾥雾⾥的。连基本的⽬标函数的概念都没建⽴起来,就急着学算法,这属于还没学会⾛路就去学跑步,本末倒置了

在基础阶段,主要以使⽤为主,学习数据分析的⽅法论、Excel、分析5步流程,对数据分析有⼀个基本的认知。

2、MySQL数据分析实战

文章图片11

数据分析中,MySQL肯定是⾮常重要的存在。作为基础阶段,这⼀⼩节主要从宏观上学习多表查询和开窗函数,⽽不是死扣某⼀个sql的某些字段意义。⾸先理解MySQL各存储引擎原理与特点,继⽽掌握SQL多表⾼级查询、开窗函数,然后掌握数据库性能调优策略,使⽤SQL进⾏数据清洗与数据规范化。

3、数据分析必学编程语⾔-Python

Python现在是职场⼈必会的编程语⾔,同时也是数据分析必须第⼀语⾔,在这个阶段⾥⾯,具备Python编程思维与编程能⼒,使⽤Python做⾃动化办公脚本,使⽤Python做爬⾍程序,熟练使⽤Python做更复杂的数据分析 与可视化代替⼯具。具体包括:

文章图片12

4、数据分析必备理论基础-统计学知识

理解统计学基础知识和理论,掌握ABTest必备统计学理论基础,常⽤的数据建模⽅法(相关/回归/逻辑回归/时间序列分析),使⽤Python等⼯具结合统计学进⾏建模、预测分析,具备满⾜⼤⼚数据分析⾯试中关于统计学⾼频考点的理论要求。

文章图片13

二、白银时代

度过了⽯器时代,你已经储备了⼀些数据分析的基础知识:Python语⾔编程,统计学知识,数据库mysql等初识,但这距离做⼈⼯智能还不够,在第⼆个⻘铜阶段,你还需要再进⼀步学习基础,在第⼀阶段之上,难度会开始慢慢上升。

文章图片14

这⼀阶段需要学习的知识有:

1、线性模型

在前⾯的⽯器时代,咱们初步接触了数据分析,了解了数据分析⽅法论的基本原理。不过那时候是偏基础的,在这个进阶的阶段,你要开始接触机器学习的内容了。

⾸先从常⽤的两⼤主流算法出发,学习算法那理论和代码建模的基本知识,随后引出互联⽹公司喜爱的机器学习项⽬,从线性理论过渡到后来的全连接神经⽹络MLP等深度学习的算法技术,从专业的⻆度上说 ,线性回归、逻辑回归和⽀持向量机等算法到现如今,只需要掌握这3个算法的理论,不需要掌握代码。

文章图片15

那么如何掌握这3个算法的线性模型呢?

  • 第⼀步,确定基本函数
  • 第⼆步,确定⽬标函数
  • 第三步,找到优化方法

掌握这3个公式,就是精华,其他的公式跟你没关系。

2、树模型

学习机器学习的线性理论,接下来就是在量化交易、⾦融⻛控、信号处理等场景中,数据只要是表格型的,就⽤到决策树、随机森林和XGBoost算法建模(这是经验之谈)。

文章图片16

由于学习的⽬的不同,所以在学习⽅法上和普通的机器学习算法就有所不同了。在这⾥咱们学习⼀下算法推导中,树模型(决策树/随机森林/XGBoost)显然没有前⾯的线模型难,当然如果你有兴趣,学的更深⼊当然更好。

三、白银时代

现在进⼊第三个阶段——⽩银时代,激动⼈⼼的时刻就要到来了,在这个阶段,我们开始全⾯学习真正的机器视觉CV了,前⾯两个阶段打下的基础,在这个阶段,也将派上⽤场。

文章图片17
文章图片18

这⼀阶段需要学习的知识有:

1、CNN卷积神经网络 / 残差网络

有了前⾯的Python编程和机器学习的基础,可以来正式学习机器视觉CV了。机器视觉CV领域内⼏⼤典型的场景:图像分割、OpenCV传统视觉、图像分类、⽬标检测、⾃动驾驶等等,每⼀个都需要详细学习,⼀边学习理论,⼀边动⼿实践。

文章图片19
文章图片20

作为⼀个下⼭的过来⼈,在学习深度学习的神经⽹络中,重点掌握理论的⽅法和写代码的⽅法,下⾯我贴2张图,已经经历过学习检验,务必记下来。

文章图片21

2、目标检测系列算法

2023年统计时间内共有151起投资事件,⼯业、泛安防、能源为热⻔赛道TOP3,⼯业赛道以53.6%的过半热度斩 获中国计算机视觉市场融资热度⾸位。表示AI视觉的⾏业成熟度和认可度已进⼊新阶段。

恭喜同学到了这步,如果你看到了这⾥,说明你已经达到6分的⽔平,还有4分,继续由我来给你分享⼀下如何学习⽬标检测算法,重点分为3块;⾸先你需要先学习⼀下基础的⽬标检测基础知识,才能掌握⽬标检测的算法Faster R-CNN ,这个是⽬前最经典的算法了,不过,这⾥呢,不要乱学,不要写代码,先要掌握理论,那么什么时候写代码、写项⽬、写论⽂呢,在YOLO系列的算法中,在⼯业界和互联⽹中有居⾼的热度,我⼿⾥的绝⼤部分的项⽬都是从YOLO算法系列实现的。

文章图片22

三、黄金时代

2023年4⽉,中国NLP赛道累计投 融资事件数达到54起。其中,⾦融、 医疗、零售、政务为NLP赛道Top4应⽤领域, 占⽐分别达到42.6%、35.2%、27.8% 与24.1%。从涉及的应⽤产品来看,主要包括智能⽂档处理 ( IDP ) 、机器⼈流程⾃动化 ( RPA/IPA ) 、专⽤搜索引擎、 ⽂本⽣成、机器翻译、垂直领域认知智能产品 (如医疗CDSS、政务舆情监测系统 ) 等。其中RPA⼚商占⽐最⾼,RPA产 品集成NLP技术可在⾃动化端到端流程上让机器做出决策,如票据处理、合同分析等,在⾦融、零售、互联⽹多⾏业领域 应⽤⼴阔。从融资事件轮次分布来看,C轮以前的融资事件占⽐达到66.7%,多集中在早期,产业仍处于快速发展阶段。

文章图片23
文章图片24
文章图片25

四、铂金时代

下⾯⽤⼀张图作为⼀个结尾,到了这步,重点就是做项⽬了。

文章图片26

希望以上内容对你的学习有所帮助!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多