分享

24年了不会还有人不知道怎么开始学深度学习机器学习吧?

 昵称39004379 2024-05-31 发布于广东

今天这篇文章来自一位国外研究生(研究方向是视频语言模),他的名字叫 Boris Meinardus,他是一名学生研究员(学生研究员:可以是任何参与研究项目的学生,包括本科生和研究生)曾为一位前 Meta 的教授工作,并接受过Google DeepMind、亚马逊 和其他一些很棒的公司的面试,并且在外网拥有众多粉丝。

图片

这篇文章主要是介绍如果让他在24年重新开始学习机器学习,他会如何做!
因为作者提到的很多资料都无法下载,所以我为大家整理了一些平替的,大家可以酌情替换学习!
在2024年,你只需要一台笔记本电脑和一份需要遵循的步骤清单,就可以开始学习机器学习。
今天将揭示你需要采取的6个关键步骤。

1.Python


图片

总的来说,这些步骤并不一定要严格按照任何特定顺序完成,不过,我非常推荐首先从学习Python的基础知识开始。
Python是几乎所有人用来从事机器学习的编程语言,这份清单上的每一步都是基于Python的。
这主要适用于那些不知道列表或字典是什么,不知道如何编写简单的if-else语句或for循环的初学者。
我甚至会说,你还需要学习列表推导式和类继承。
老实说,除了输入“Python教程”或在YTB或Google上搜索课程并开始学习之外,我不知道还能说什么。
网上有很多很棒的免费内容,但你应该始终牢记要积极地跟着教程进行编码。

图片

人工智能60天学习计划(点击图片即可跳转)


2.数学


图片

用Python享受进入机器学习的乐趣,但不要过于深入,这样你可以从一次有趣的体验开始,因为在某个阶段,你也需要学习数学。
现在,你可能会争辩说你不需要数学,因为很多工作已经被很棒的Python库自动化和解决了,这没错,但你需要了解微积分、线性代数和概率论的基础知识,以理解几乎任何机器学习方法。
话虽如此,你真的不需要复杂的数学。
大部分数学都是高中或大学入门水平的数学。
例如,你只需要理解一个函数的导数是什么以及如何计算它。
你需要知道什么是矩阵以及点积是如何工作的。
同样,网上有很多很棒的免费资源,比如这些课程

  • https://www./learn/matrix-algebra-engineers?irclickid=x-U2gpTSJxyLTxPwUx0Mo3EoUkDXeNXFjUFXWo0&irgwc=1

  • https://www./learn/linear-algebra/the-university-of-texas-at-austin-linear-algebra-foundations-to-frontiers  

  • https://www./learn/probability/harvard-university-introduction-to-probability

或者一个叫做Khan Academy的网站。
我的意思是,你甚至可以在Brilliant.org上学习你需要的大部分内容!
在我们覆盖下一个重要步骤之后,我会告诉你我学习神经网络基础数学知识的绝对最喜欢的资源。
这已经表明,你不需要一开始就匆忙地通过所有的数学课程。
事实上,我甚至不推荐这样做,因为这可能会非常令人沮丧并且毫无乐趣。
学习基础知识,然后继续下一步,学习关于机器学习开发者堆栈的知识。

图片

人工智能数学教程书(点击图片即可跳转)

3.机器学习开发者堆栈
指的是一系列工具、框架、技术和最佳实践的集合

现在你已经掌握了Python的基础知识,如果还没学过的话,可以学习一些基本工具,如Jupyter笔记本和库,如pandas、numpy和matplotlib。
Numpy是一个用于矩阵或数组进行数学计算的库。
这是一个很好的起点,因为你现在可以实现你刚刚学到的数学知识,并看到计算两个矩阵之间的点积是多么简单。
Matplotlib是一个用于可视化数据和图形的工具,你可以直接看到你正在进行的数学运算。
至少在我看来,可视化这些东西很有趣,也非常有用!
最后,pandas是一个处理表格格式数据的强大工具。
许多机器学习问题都涉及到表格数据,而pandas允许你非常方便地处理和可视化这些表格。
所有这些库都与Jupyter Notebooks配合得很好,并且是学习机器学习不可或缺的一部分。
你会发现,通过了解这些框架,你也会自动提高你的整体Python和机器学习实践能力!
但同样,只需按照一些教程专注于基础知识。
稍后,当你在项目中工作时,你会真正了解这些库。
现在,让我们回到一些理论上,并终于开始学习机器学习和深度学习吧!


4.学习机器学习


图片

到目前为止,其实所有内容都不应该花费太长时间,可能只需要几周,这取决于你投入多少时间以及你目前的水平。
但我接下来要推荐的机器学习课程确实需要一些时间。
最好且可能是最著名的机器学习课程或课程系列是Andrew Ng的机器学习专业化课程。

coursera:
https://www./specializations/machine-learning-introduction#courses
B站:
https://www.bilibili.com/video/BV1gK421x7rS/?spm_id_from=333.999.0.0

有趣的是,在这个课程中,你将已经接触到一些机器学习框架,如scikit-learn和TensorFlow。
好吧,我得承认,我个人更喜欢并会推荐PyTorch,但学习一个框架后,你可以很快地适应另一个。
虽然这是一个基础课程,但它非常重要!他们在这里教授了许多经典的机器学习概念,而这些是你在机器学习面试中需要能够轻松回答的内容。
现在,还记得我提到的学习神经网络数学的最爱资源吗?在学习了Andrew Ng的课程中的相关内容后,我会观看Andrej Karpathy在YTB上的神经网络系列。

神经网络:
https://www./playlist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ

他从零开始实现一个简单的NLP模型,一直讲到Transformer模型。
他还讲解了反向传播等所有相关的数学原理。
我非常推荐这个系列!
由于在Andrew Ng和Andrej Karpathy的课程中,你已经获得了一些所教机器学习概念的实践经验,我会继续推荐下一个更高级、更实用的课程——深度学习专业化课程。

深度学习:
https://www./specializations/deep-learning?irclickid=x-U2gpTSJxyLTxPwUx0Mo3EoUkDXeu01jUFXWo0&irgwc=1#courses

这个课程更侧重于实现和训练神经网络,而这里最棒的是,他们还包括了Huggingface 🤗,这是一个你几乎无法避免的库。
它真的很棒。
如果你觉得这门课程对Huggingface的讲解不够多,你也可以直接学习Huggingface的NLP课程。
在那里,你还可以学习NLP中更高级的概念。如果你对NLP感兴趣的话。
Huggingface:
https:///learn/nlp-course/chapter1/1

没错,这就是我会采取并推荐的2到3门课程。

图片
神经网络教程书(点击图片即可跳转)

5.如何真正变得出色


图片

到目前为止,你已经学习了很多内容,并在几个较小的项目或教程上进行了实践。
现在是真正动手并处理实际项目的时候了。
我真心地认为你在这里学到的最多,而且有两件事情我会着手去做。
首先,我会去Kaggle上工作,并直接参与挑战赛。

图片

Kaggle是一个以数据科学为主题的在线平台,旨在促进数据分析、机器学习和人工智能领域的交流、合作和竞赛。
它提供了各种各样的数据集,来自不同领域,供数据科学家、研究者和开发者使用。
Kaggle还承办数据科学竞赛,邀请全球的数据科学家参与解决实际问题,并提供丰厚的奖金作为鼓励。
除此之外,Kaggle还提供了数据可视化工具、分析平台以及社区讨论板,使数据科学家能够交流经验、分享代码和共同解决难题。
总的来说,Kaggle是一个集合了数据集、竞赛、学习资源和社区的综合平台,为数据科学和机器学习领域的从业者和学习者提供了一个宝贵的资源库和交流平台。

kaggle地址:https://www./

这里有很多适合各种水平的挑战。
尝试的时候不要低估它们的复杂性,从更简单的挑战开始,这样你就不会感到沮丧和失去动力。
如果你选择参与更困难的挑战,并且这些挑战还附带奖金,请不要期待会赢得奖金。
达到那个点真的非常困难,因为你需要大量的计算资源。

在参与Kaggle挑战赛之后,就是我最后也是最喜欢的项目类型——重新实现一篇论文并重现其结果。

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多