分享

Aura 以机器学习为核心的数据驱动型应用开发平台

 万皇之皇 2018-01-01

大数据与人工智能的历史和未来

大部分企业的数据分析和应用一般属于Business Intelligence (BI) 这个范畴,企业内的数据分析师利用企业已经积累的客户、产品等各方面数据,为企业发展提出更好的建议。传统的企业BI分析大部分是Descriptive Analytics(描述性分析)和Diagnostic Analytics(诊断分析)。Descriptive Analytics是把数据中的事实呈现出来。Diagnostic Analytics是诊断性,它的作用发现企业运营中的问题,并找出原因。通过深挖数据寻找更多价值。这两项分析是企业里各种数据分析的支柱性任务。

随着企业BI业务的不断深入,大家发现可以应用这些数据做更多更智能的事情,并构建一些更智能的应用。也就是Predictive Analytics(预测分析)。企业不仅想要知道过去发生什么,更希望能找到一些规律来帮助预测将来,为客户提供更好的服务。根据这些预测和分析,指导企业行动,把这些信息和预测能力转化成生产力。大数据平台发展支撑了现代企业大部分的Descriptive Analytics和Diagnostic Analytics任务。而更有价值的Predictive Analytics就要靠各类人工智能技术来实现。

Aura 以机器学习为核心的数据驱动型应用开发平台

想理解“人工智能”就先要明确定义什么是“智能”。人作为智能体的典范和非智能的物体有三个方面主要区别。首先,智能的人可以通过“感知”从非结构化的信息中获取各类信息。人有语言并能利用语言进行交流,视觉听觉等各类感知功能也给人提供各种信息。其次,智能体现在人可以根据获得的信息做复杂的判断。最后,智能体可以形成获取信息,决策判断、调整策略的反馈闭环。这三点是智能和非智能的重要区别。

Aura 以机器学习为核心的数据驱动型应用开发平台

机器学习这个领域正是关注智能中“决策分析“这个领域。计算机的程序源代码就是计算机做决策分析全部逻辑的呈现。传统方式一直是人通过编程语言将人类的决策分析过程以程序的形式输出给计算机。而机器学习则提供了一个新的典范,它通过处理期望的输入输出数据,自动形成决策程序,大大提高效率。

Aura平台的产品设计和架构

亚信一直在实践把人工智能带入各个领域,我们做了大量的工作来帮助企业建立属于自己的数据驱动型应用。什么是数据驱动型应用呢?与“数据驱动型应用”相对的概念是“事务驱动型应用”。事务驱动型应用是业务专家的经验固化为程序代码。数据驱动型应用则是在已经积累了相关业务数据的条件下,利用机器学习和人工智能技术来挖掘规律指导业务,这也是对企业本身的数据资源的开发。数据驱动应用在实践中的重要因素:

Aura 以机器学习为核心的数据驱动型应用开发平台

Aura 以机器学习为核心的数据驱动型应用开发平台

基于这些理解,我们设计了Aura。Aura是一个高效的数据驱动型应用程序开发的机器学习平台。Aura把上述四个重点有机的结合了起来,极大地提升了数据驱动型应用的开发效率。通过结合技术、业务、数据,并不断的更新迭代,形成效能逐步提高的正反馈闭环过程。在Aura平台上的最上层,为各种行业提供了广泛的经过实践检验的数据驱动应用程序,可以直接(或经过微调)应用于解决业务问题。提高数据驱动应用开发效率的最佳方案是已有应用的迁移,充分发挥业务与技术经验结合的最大价值。

Aura 以机器学习为核心的数据驱动型应用开发平台

Aura平台架构

在Aura的平台架构中,Aura通过使用“通用数据模型” (Common Data Model),强调领域知识的保存,标准化和重用。

Aura依托于业界最领先的技术框架,包括人工智能、机器学习和大数据系统。连接底层和高层应用开发的是科学高效的应用开发环境。Aura提供了两种方式与用户交互进行应用开发,分别是Aura Visual Pipeline 和 Aura Advanced Notebook:(a)Aura Advanced Notebook适用于数据科学家或具有编程技能的分析师的强大笔记本,(b)Aura Visual Pipeline适用于入门用户,提供了向导式的,基于科学方法和最佳应用开发实践的各种建模场景进行数据建模。机器学习和人工智能的技能知识门槛较高,为了简化学习曲线,我们定义了一些非常典型的机器学习的场景,这些典型场景是我们经过很多探索和实践抽象出来的。针对每个场景,我们都将最科学的分析建模过程形成一个向导式的流程,使用者只需要提供一些必要的信息,就可自动生成一个有效的应用模型,也使整个流程变得水到渠成。

Aura平台的运营商应用案例

亚信对数据驱动、机器学习,深度学习等方面的产品及项目研发,都会在Aura平台上进行。这是一个统一处理这类需求应用的开发环境。它最重要的核心价值之一是把我们在这个平台做过的所有的应用的最佳实践都积累在上面,或者说从技术层面将数据驱动应用中最有价值的经验,以一种模块化和流程化的方式,分享给使用这个平台的客户。

亚信主要的客户是运营商,我们在运营商的行业中做了很多和驱动相关的应用。举几个示例。

Aura 以机器学习为核心的数据驱动型应用开发平台

第一,数字内容,智慧推荐。这样的内容应用类似今日头条,把每个用户感兴趣的数字内容推送给本人。为了实现这个应用,需要做两件事,一是要找到合适的数字内容,找到有趣的新闻。二是把找到的内容,推送给真正需要他的人。之前有一些比较传统的做法,会根据历史的数据,将客户贴上标签。哪些人喜欢音乐,哪些人喜欢体育,将搜集到的所有的和这些标签对应的信息都推送给他们,这样的方法是比较静态的,而且用户标签的更新比较慢。亚信在做类似这样系统的时候,会结合最新的推荐算法与运营商业务流程。

首先我们会在做这个应用的时候,通过使用Aura平台去调用一个类似于舆情分析系统的功能模块,从网上抓取系统认为可能会被大家关注,特别是未来可能会成为热点的一些数字内容。然后在将这些数字内容和我们的特定用户进行配对的时候,我们也会采用现在大量被采用的协同滤波算法,加上在运营商行业特有的三种标签系统,将我们的数字内容和我们的用户进行精准的对接。

Aura 以机器学习为核心的数据驱动型应用开发平台

这整套流程,在我们的Aura平台上,已经被模块化成了六个基本的模块。我们的用户、工程师或者是客户的业务专家,即使是第一次接触到这个场景,对数据科学构成不太了解,也可以根据我们流程定义的这些步骤,提取平台已经帮他设计好的一些特征数据,在平台上比较高效完成产品的研发。

Aura 以机器学习为核心的数据驱动型应用开发平台

第二个应用,流量套餐和流量加油包的智慧推荐。这个应用,是所有运营商都需要的一个最基本的应用。众所周知,运营商的产品就是他的套餐、流量包,每一个运营商都有自己的套餐推荐系统。每个运营商的套餐推荐系统早期是什么样的,可以举例展示:在某一月,我们套餐数用超了,流量用完,这时候,有人会去手动的添加一些流量包补充流量,这个过程,在运营商叫做(超套)。一旦这个超套行为发生,那么在当月很可能就会接到运营商的客服人员的电话告知本月超套了,之前定的是哪一档套餐,现在推荐哪一档套餐。

Aura 以机器学习为核心的数据驱动型应用开发平台

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多