分享

机器学习的权利要求撰写

 乘舟泛海赏雨 2021-04-03

在看到这个新技术的时候,首先去检索一下机器学习的基本概念,使用任何一个搜索引擎都可以,我们将机器学习作为关键字输入到搜索引擎中,就可以得到检索结果,我摘抄了一点如下:

机器学习可以分成下面几种类别:

监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析统计分类

监督学习和非监督学习的差别就是训练集目标是否人标注。他们都有训练集且都有输入和输出,无监督学习与监督学习相比,训练集没有人为标注的结果。

通过上述内容可以看出,机器学习就是建立起一个函数,这个函数能够能够在有输入时,输出一个想要的值。这个函数是根据已经有的输入和输出训练出来的。乍一看到这段内容,感觉这和自动化差不多,此时为了搞清楚和自动化的区别,我们可以检索下:“机器学习和自动化的区别”,我摘抄一点检索结果如下:

二、自动化与当代 AI 的区别

如果把每个图像和这个图像是否是树叶记录下来,哪怕是最快的计算机也无法查找和存储这些多的信息。这恰恰是当初计算机所办不到的事情,没有办法仅通过演示几个例子就能让计算机搞清楚其他没有演示的情况,也就是学习能力。

曾经计算机所执行的指令都是人类所学到的知识。如今的人工智能所产生的突破并非有了意识,而是能够让计算机自己来从有限的例子中学到知识,然后将学到的知识用于今后的预测中。

这也是自动化与目前AI最大的区别,即知识是否是由机器自己发现的,这也正是很多张口闭口都是AI的人压根就没搞明白的事情。

看到这一段,似乎就能明白自动化和机器学习的区别了:假定我们希望让计算机判断一张照片里是否有猫,如果是自动化,我们需要把有猫的规则输入到计算机中,例如,有胡须、有爪子、有尾巴等等,然后计算机根据我们输入的规则来判断是否有猫,也就是说如何判断是否有猫的这个知识是人类告诉计算机的,计算机仅仅是一个执行者;如果是机器学习,则需要将有猫的照片输入到计算机中,告诉计算机这些照片都是有猫的,通过这些照片让计算机自己建立规则,通过自己建立的规则来判断是否照片中是否有猫。也就是说判断是否有猫的这个知识是计算机自己建立起来的。机器学习就是建立这样的一个算法,让计算机能够自己建立起规则。

那么,机器学习都有哪些算法呢,我们可以继续进行检索:

线性回归、 Logistic 回归、 线性判别分析(LDA)、 分类与回归树、 朴素贝叶斯、 K 近邻算法、 学习向量量化、 支持向量机(SVM)、 Bagging和随机森林、 Boosting 和 AdaBoost

对于这些算法,如果大家感兴趣可以继续进行检索,看看究竟能看懂多少。如果看不懂也没关系,因为我们已经掌握了机器学习的基本原理,那么,现在机器学习是否已经有比较成熟的模型了吗?也就是说,是否有公司做出了一个比较通用的框架,基于这个框架,我们可以在自己希望的领域中进行应用。我们再输入:“机器学习 框架”进行检索得到如下结果:

1. TensorFlow (Google)

TensorFlow最初是由Google Brain Team的研究人员和工程师开发的。其目的是面向深度神经网络和机器智能研究。自2015年底以来,TensorFlow的库已正式在GitHub上开源。TensorFlow对于快速执行基于图形的计算非常有用。灵活的TensorFlow API可以通过其GPU支持的架构在多个设备之间部署模型。

2.  Theano (蒙特利尔大学)

Theano是另一个用于快速数值计算的Python库,可以在CPU或GPU上运行。它是蒙特利尔大学蒙特利尔学习算法小组开发的一个开源项目。它的一些最突出的特性包括GPU的透明使用,与NumPy紧密结合,高效的符号区分,速度/稳定性优化以及大量的单元测试。

3. PyTorch (Facebook)

Pytorch在学术研究者中很受欢迎,也是相对比较新的深度学习框架。Facebook人工智能研究组开发了pyTorch来应对一些在它前任数据库Torch使用中遇到的问题。由于编程语言Lua的普及程度不高,Torch永远无法经历Google TensorFlow那样的迅猛发展。因此,PyTorch采用了被已经为许多研究人员,开发人员和数据科学家所熟悉的原始Python命令式编程风格。同时它还支持动态计算图,这一特性使得它对做时间序列以及自然语言处理数据相关工作的研究人员和工程师很有吸引力。

4.  Torch (NYU / Facebook)

接下来我们来谈谈Torch。它是Facebook的开源机器学习库、科学计算框架和基于Lua编程语言的脚本语言。它提供了广泛的深度学习算法,并已被Facebook,IBM,Yandex和其他公司用于解决数据流的硬件问题。

5.  Caffe (UC Berkeley)

Caffe是一个兼具表达性、速度和思维模块化的深度学习框架。由伯克利人工智能研究小组和伯克利视觉和学习中心开发。虽然其内核是用C ++编写的,但Caffe有Python和Matlab相关接口。这对训练或微调前馈分类模型非常有用。虽然它在研究中使用得并不多,但它仍然很受部署模型的欢迎,正如社区贡献者所证明的那样。

通过上述检索结果可以知道,现有技术中提供了现成的机器学习的框架,这些框架中分别使用了不同的算法。如果一个技术是对这些框架内部算法的改进,那么需要专利撰写者与技术人员进行详细的沟通以确定如何来申请专利(当然也需要考虑到开源软件和专利之间的关系,如果大家感兴趣可以自行检索)。现实中更多情况是需要申请对这些框架进行应用的专利,也可以理解为现实中的专利更多的是,关于如何利用机器学习的原理来实现某个功能的。这是因为机器学习的原理已经被上述框架实现了,企业更多的考虑在本领域中的输入和想要的输出是什么就可以了。

例如,番茄酱加工企业以前需要人工用来区分好的西红柿和坏的西红柿。如果用机器学习来实现,我们不太关心机器学习的框架是如何搭建,因为本领域技术人员可以根据上述开源的框架来完成搭建,也就是说即使不对框架进行说明,也是满足说明书公开充分的要求的。我们只需要关心输入和输出就可以。此时,我们需要一堆数据来训练这些现有的框架,这些训练用的数据可以称为训练数据。我们可以把好的西红柿照片和标识该西红柿照片是好西红柿的标签输入到框架中进行训练,并且也可以把坏的西红柿照片和标识该西红柿照片是坏西红柿的标签输入到框架中进行训练,训练结束之后可以得到一个模型,这个模型其实就是计算机自己制定的好西红柿和坏西红柿的区别。模型训练好之后,给西红柿拍照就可以根据照片判断西红柿是不是好了。

下面我写一个例子:

一种西红柿鉴别方法,其特征在于,包括:

将西红柿的照片输入到模型中,其中,所述模型使用多组训练数据训练出来的,所述多组中的训练数据中的每一组训练数据均包括:西红柿的照片和用来标识该西红柿级别的标识信息;

获取所述模型的输出信息,其中,所述输出信息包括所述西红柿的照片中的西红柿的级别。

再写一个识别猫的例子:

一种识别猫的方法,其特征在于,包括:

将待识别照片输入到模型中;

从所述模型中获取所述照片中是否有猫的结果,其中,所述模型为使用多组数据通过机器学习训练得出的,所述多组数据包括第一类数据和第二类数据,所述第一类数据中的每组数据均包括:包括猫的照片和标识该照片包括猫的标签;第二类数据中的每组数据均包括:不包括猫的照片和标识该照片不包括猫的标签。

如果大家觉得识别猫的这个方法技术特征还是有点少,创造性不够,毕竟能识别西红柿就能识别猫,在这种情况下,可以加上把猫识别出来之后怎么操作的技术特征,即将机器学习识别猫作为整个方案的一部分。修改后的权利要求如下:

一种处理流浪猫的方法,其特征在于,包括:

调用摄像头对环境进行拍照得到环境照片;

将环境照片输入到模型中确定是否有猫,其中,其中,所述模型为使用多组数据通过机器学习训练得出的,所述多组数据包括第一类数据和第二类数据,所述第一类数据中的每组数据均包括:包括猫的照片和标识该照片包括猫的标签;第二类数据中的每组数据均包括:不包括猫的照片和标识该照片不包括猫的标签;

在所述照片中有猫的情况下,播放狗的叫声。

这样的方案就显得丰富了,比单纯识别猫的方案更容易拿到授权。 

再写一个识别人的例子:

一种人类识别处理方法,其特征在于包括:

使用模型对照片进行分析,确定所述照片中人的年龄范围,其中,所述模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:照片和标识该照片上人年龄的标签。

同样的道理,如果感觉授权困难,可以把识别出人以后要做什么写出来:

一种人类识别处理方法,其特征在于包括:

获取购票的人的照片以及购票需求;

使用模型对照片进行分析,确定所述照片中人的年龄范围,其中,所述模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:照片和标识该照片上人年龄的标签;

在所述照片中的人的年龄大于60岁的情况下,为所述人分配靠窗座位。

写到这里,大家应该会撰写机器学习业务逻辑层的案子了。当然,如果遇到了技术层的案子,还是需要好好的跟发明人进行沟通的,以保证对技术方案的理解正确。

留一个作业:冰箱上使用机器学习拍照识别水果是否过期的方案,请大家写独权。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多