分享

图计算迎来研究热潮,如何突破商业化节点?|图计算的「世界观」线下沙龙分享会内容回顾

 江海博览 2022-08-26 发布于浙江

图片

作为人工智能领域前沿探索之一,图计算正迎来发展的黄金时代。

8 月 24 日,由《麻省理工科技评论》中国、蚂蚁技术研究院等联合举办的研讨会在北京举办。来自图计算领域的专家学者、产业及应用界人士从各自视角,洞悉了图计算的技术发展和应用前景。会上全球领先的科技市场研究机构 CB Insights 中国解读了即将于 2022 世界人工智能大会期间正式发布的《中国图计算技术及应用发展研究报告》。


图片图:研讨会部分参会嘉宾合影

中国计算机学会高性能计算专业委员会秘书长 中科院计算所研究员张云泉、北京航空航天大学软件学院教授级高工王宝会、涛思数据创始人陶建辉、以及来自能源、金融应用领域的代表探讨了图计算产学研协同合作模式。蚂蚁集团图数据库负责人洪春涛、欧若数网创始人兼 CEO 叶小萌、创邻科技联合创始人兼 COO 吴菁、Ultipa 联合创始人张建松、星环科技金融售前与解决方案部售前总监东方,从产业侧探讨了如何开启图计算应用领域“新版图”。

如何理解图这门新兴技术,
蚂蚁集团图数据库负责人洪春涛认为,图是一种更符合人的思维方式的技术,也更还原大自然本来的面貌,但对机器来说处理起来可能会更复杂。


图片图:蚂蚁集团图数据库负责人洪春涛

就像面向对象或面向过程的编程模式的区别,后者更贴近机器,可以清晰地指示机器应该如何处理。如今的关系型数据库也非常贴近机器,把数据抽象成规整的二维表,以便于机器处理。而图计算把数据抽象成图,更加方便复杂关系的还原和可视化处理,更适合海量数据的数字化时代,但同时也给计算机处理带来了很多技术挑战。

图计算提供了一种理解世界的新方式,它很有可能会成为下一代的数据底座。

对于图计算未来的发展,如今高校和产业之间的产学研联动频繁进行,分别来自学界和产业界不同的视角和观点的交锋,也在共同推动图计算领域的发展和应用落地。

图片

 图计算产学研究协同合作模式

Q:高校和产业如何实现更紧密合作

业界相对更关注短期出成果、出性能的技术,而学界相对更关注中长期的科研影响力、学术影响力。

有专家表示,两者要实现好的融合,更常见的是由业界给出具体的场景、具体的问题、具体的痛点,学界专注解决这些问题,再由业界进行商业化应用。

北京航空航天大学软件学院教授级高工王宝会表示,围绕图计算,如今学界的研究方向首先包括了以芯片为基础的分布式存储和分析计算架构,解决图计算遇到的问题;第二是分布式的图计算平台;第三是图计算与启发式算法深度融合;此外,如今多模态的数据融合是一个大的趋势,面对复杂多源多模态数据,如何用图表征学习,也是一大研究热点。最后是量子计算和图计算的结合,未来量子计算带来的超算能力,能在图计算里解决什么样的场景问题,这其中也有很大的研究空间。


图片图:北京航空航天大学软件学院教授级高工王宝会

Q:围绕图计算领域的学术研究热点有哪些

近年来,图计算技术成为一大研究重点。一位在场的学界专家认为,在这方面 AI 制药和图数据上的预训练技术是非常有前景的研究领域。目前 AI 制药用到很多图机器学习、图深度学习相关的技术,其中有一种潜在的可能性,即通过算法自动生成分子结构,快速筛选判断特定分子结构是否能作为某一种药物。

另一方面就是图数据上的预训练技术,尤其是自建构的预训练。预训练最近在 AI 学界和产业界,比如视觉、自然语言处理方面都有很大的进展,潜在的可能在于,面对一个大规模数据来说,如果可以只训练一个通用的模型,模型生成的属性、特征可以自动应用到下游各个机器学习应用中,那将可以节省上千个团队的尝试和努力。

Q:如何快速培养一门新兴技术

涛思数据创始人陶建辉表示,开源可以快速带来用户和使用场景、积累反馈,进而大大加快产品迭代的速度,而在市场开拓和全球化拓展方面,选择开源也可能会有意想不到的效果。


图片图:涛思数据创始人陶建辉 

开源对产品迭代的好处尤其巨大,陶建辉根据自身开源项目 TDengine 的切身体会谈到,产品发布之后,会有很多研发领域的资深人士看到里面的代码,“他们看到问题反馈给你,就相当于我们获得了高质量的代码评审。”

如果没有开源,要获取各种场景的用户需求和意见是非常难且周期很长的,但有了开源之后,来自全球的开发者可以随时发表意见,这在很大程度可以推动开发者的思考,并加快产品迭代。“一个闭源公司要花 10 年时间做的事情,我觉得开源软件公司 1 年就能做到。因为用户的反馈实在太多了。”

图片

如何开启图计算应用领域“新版图”

Q:哪些业务应该用图数据库解决

星环科技金融售前与解决方案部售前总监东方表示,首先以点边表示的图数据比传统关系型数据更加便于可视化。其次对于交易关系、企业关联关系的查询等场景,关系型数据库很难满足多度关联查询的时效性,而图数据库甚至可以以毫秒级的速度给出结果。这种场景下,图数据库可以说帮助类似业务场景实现了从 0 到 1 的过程。


图片图:星环科技金融售前与解决方案部售前总监东方

在这个问题上,欧若数网创始人兼 CEO 叶小萌认为,是否应该用图数据库,有一个比较简单的判断方式。因为图不是图片图像,而是一个关系网络。所以业务的关系网络中如果只是一跳或两跳关系,那就不适合用图数据库,如果是多跳关系,图数据库就是最好的选择。


图片图:欧若数网创始人兼 CEO 叶小萌

Q:业界在实际应用过程中的痛点问题

在场的一位金融应用领域代表指出,关键的还是技术如何与业务实现更深入的融合。比如证券公司有非常多业务,如何把图计算、图数据库恰当地应用到每一个业务场景是一个问题,因为即使是公司的一员,也很难了解其他业务的场景。

所以业界要做的第一件事就是先了解自己的业务场景,用图计算技术完成一些有意义的工作。而实现完美的融合,这是最重要也是最困难的点。

星环科技金融售前与解决方案部售前总监东方表示,“推广图计算,刚开始的时候,就像拿着榔头找钉子的过程。图是一个很好的工具,相当于手上有一个榔头,但是不知道场景需求,也就是钉子在哪儿。在和客户的交流过程中可以明显感受到砸钉子的过程是比较困难的。其实知识图谱与图计算技术在各行各业都有深入应用的前景,关键在于理解场景要点和业务需求。”


要解决这个问题,他认为首先可以依赖有经验的合作伙伴,一起了解业务场景共同推进,其次是修炼内功,加强对自身业务的理解。

创邻科技联合创始人兼 COO 吴菁指出,目前图数据库技术还处在早期阶段,一方面人才是极度欠缺的。在实现落地时,不能仅仅是把数据库卖给客户,因为客户内部也没有足够成熟的技术人员来使用,市场上非常缺乏相关的运维人员,这也是落地时遇到的客观难题。


图片

图:创邻科技联合创始人兼 COO 吴菁

另一方面,图数据库的技术的生态不成熟,缺少成熟的中间件、应用等角色,这就会倒逼厂商要做完整的解决方案。

Q:关于图计算的未来

Ultipa 联合创始人张建松表达了乐观的态度,从数据上来看,图数据库的市场增速已经超过了 100%。“我们先前置一个概念:人工智能发展的终极目标是实现强人工智能,强人工智能指的是让机器和算法像人类一样具备图的思维方式,而图思维方式的本质就是能 100% 实现映射和还原世界,并能在提供深层计算能力的同时,打破系统间、数据间存在的藩篱,并对多源、多维的数据进行深度下钻、关联、归因分析——这实际上就是一种图计算与分析的方式。所以,我们可以预见到未来图数据库与(实时)图计算技术的发展,不仅会占有一席之地,尤其是随着数据规模的不断扩大、数据复杂性的不断提高,图会成为未来数据库技术发展的主流方向之一。”


图片图:Ultipa 联合创始人张建松


此外,在 AI 领域,如今我们正处于第二代人工智能,张建松认为图计算、图算法方面的创新将在第三代人工智能时期广泛出现,且这些特征和算法是白盒化的,因而能够极大推动下一代人工智能技术的发展。

蚂蚁集团图数据库负责人洪春涛认为,长远来看,技术问题总能被一个一个解决,而更友好和自然的抽象对生产力的提升却会越来越重要。图模型作为一种通用的数据模型,是比二维表更自然,更好理解的。图计算基于图模型抽象,对数据进行处理,可以更好的分析复杂关系数据。目前图计算已经被应用于风控,社交,推荐等场景,并取得了很好的业务效果。但是我们也看到,目前图计算应用还是作为传统大数据技术的一个补充手段,用于处理传统大数据技术无法解决的问题。图模型作为一种通用数据模型,其在通用性上和表达能力上是优于传统关系模型的。因此我们认为图计算可以且应当被用于更广泛的场景中。而要达到这个目标,关键的是生态,我们期待让更多人看到其中的机会并参与进来,构建更完善的图计算生态。

“长期我们前途光明,短期还是需要努力。”洪春涛说。

图片

CB Insights 中国:《中国图计算技术及应用发展研究报告》

图计算爆发增长在即,围绕中国图计算技术及应用话题,CB Insights 中国在会上提前解读了《中国图计算技术及应用发展研究报告》(以下简称报告)。

《报告》中指出,图数据能更自然、直观地表述数据间的关联关系,是一种更符合人类思考方式的抽象表达。随着企业对数据间复杂关联的深度挖掘需求日益增长,图数据的应用开始受到越来越多的关注。根据 DB-Engines Popularity 指数,近五年来图数据库关注热度翻倍,在各种类型数据库中连续多年保持第一。此外,根据 CB Insights 数据,过去三年间国内外共有近 15 家企业获得了超过 20 笔融资,其中海外知名图数据库企业 Neo4j 在 2021 年 6 月的 F 轮融资中获得 3.25 亿美元投资,成为数据库历史上最大的一笔投资。


图片

《报告》还指出,近年来图计算领域不仅在学术研究方面快速发展,在产业应用方面也正在大步推进中,目前行业参与者中,既有蚂蚁、阿里、腾讯、AWS 等公有云、软件、数据库等领域的巨头,也有 Neo4j、TigerGraph、创邻科技、欧若数网等国内外创业企业。目前图计算仍处于商业化初期,市场对其认知仍不足;应用场景也相对有限,主要集中于金融风控、能源电力、社交网络等之中。未来对于图计算领域的众多学术机构和厂商来说,如何联动学研两侧、完善行业生态、提升市场认知、开拓更多应用场景,前路依然任重而道远。 

《中国图计算技术及应用发展研究报告》全文将于 9 月初在 CB Insights 中国发布,欢迎大家持续关注。

图片

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多