分享

如何训练城市规划专业AI

 传承专家老杨 2023-07-19 发布于广东

上期《为什么AI如今聪明到可以写出高考作文》的文章中,我们探讨了AI技术方向的转变,以及训练专业型AI的可能性,今天我们继续探讨——普通规划师,如何在不依赖任何IT技能的情况下,训练一个城市规划专业AI来辅助团队工作

AI时代行业格局

在进入正题之前,先简单介绍一下AI时代的行业格局,这关系到训练方式的选择

第一层是硬件,代表公司是英伟达和AMD。硬件厂商生产AI运算所需要的硬件,提供的是算力基础
第二层是模型,例如open ai的gpt模型(chatgpt的基础),以及国内各厂商的自研大模型。模型开发者提供的是算法
第三层是应用,大到open ai的chatgpt(gpt是模型,chatgpt是应用,应用基于模型),小到各式各样的AI工具(辅助写作AI、速读论文AI等),都属于应用。

第三层还可以细分,分为通用型应用和专业应用

chatgpt就是典型的通用型应用。通过结合各种插件,chatgpt可以成为某一行业的专业助手,而chatgpt本身则有发展成为平台的趋势,这有点类似于微信这样的超级app。

专业型应用专注于某一专业领域,城市规划专业AI就属于这一类。

听不懂?没关系,看下面这张AI生态和移动互联网生态的类比图,秒懂。

图片


训练平台选择

在理解了上面的AI行业格局之后,训练专业AI的路径呼之欲出——在各大厂商已经构建好的算力算法基础上进行AI训练

硬件和模型是少数大厂的领域,普通参与者专注于构建AI应用即可,没有必要再造一个轮子。

目前国内大模型通常只开放了使用功能,没有开放用户自主训练功能,但未来各大厂商开放模型的自主训练功能应该是大趋势。

最近小编发现了一个可以自己上传训练资料的平台——由王建硕老师创建的chato平台。平台给用户配置好了训练环境,而且有可视化的操作界面,上手非常方便,极大降低了AI训练的技术门槛。下面的城市规划AI训练使用chato平台演示。

图片

上传训练语料

平台提供了两种训练方式,文档素材学习和知识问答学习。

AI回答问题会优先参考知识问答的内容。基于这种设计,在训练城市规划AI时,可以先给AI大量的技术规范文件,然后再针对性的录入一些对准确度要求较高的问答内容。

上传一份《东莞城市规划管理技术规定》。

图片

学习完成后,进行聊天演示,看看训练结果如何。

图片

训练语料加工

可以看到回答的效果并不理想,AI直接遗漏了C1-C4用地,而且没有区分用地的二级类和三级类。

这是由于语言模型对于表格内容的学习效果不好,无法准确理解表格的层级关系,而恰恰城市规划专业知识中包含了大量的表格内容,这就引出了下面的话题——对训练语料进行加工。

正如数据分析之前需要对数据进行清洗加工,AI训练同样需要对训练材料进行一定处理,方便AI理解材料中的内容,表格型的内容使用纯文字的形式表达,会更便于AI学习。

用word准备一份关于用地分类体系的解释,这个解释采用纯文字形式来描述用地分类之间的层级关系。

图片


将这份word文档给AI学习之后,再次提问,看看会发生什么。

图片

图片

图片

先说这些回答超出预期的地方。

第一——AI的回答很灵活

AI并没有很机械的给出“C类包含C1、C2、C3、C4……”这样的回答,而是灵活的结合了两份文档的内容。

AI通过我们补充的知识,学习到了三级用地分类之间的包含关系,同时也保留了在城市规划技术规范学到的用地代码和用地名称的对应,以及用地功能内涵。

第二——AI展现了举一反三的能力

在后面补充的那份解释用地层级的文档中,只列举了C类用地的三个层级,并没有列举其他地类,但AI能准确回答出R1包含R11、R12、R13、R14。看上去AI完全“理解”了用地层级的概念。

不足的地方是——AI回答中仍有大量错误。用地代码、用地名称、用地功能内涵有大量张冠李戴的情况(C1-C6的代码、名称、功能对应几乎全是错的)。这也是由于前面所说的,语言模型对于表格的理解不佳。

再给AI补充一份纯文字内容,来解释用地代码、用地名称、用地功能内涵的对应关系。

图片

待AI将素材学习完毕,再次提问,看看会发生什么。

图片

这一次的回答完全准确。

这个例子已经能很好的展现专业型AI的潜力。并非所有的AI都会产生杜撰内容,通过严格控制训练材料,完全可以对AI的回答做更精准的控制。

城市规划AI应用前景

看完上面这个训练案例,大家可能会有疑问,费时费力去训练一个城市规划AI,最终只是问它一些非常基础的问题,效率远不如自己直接去看技术规范?

让AI能准确无误的回答基础问题只是开端,后续有更多的具体应用方式例如团队知识库、文本编写辅助等。

AI对话机器人有很好的可复用性和扩展性,既可以将训练好的AI公开发布,供多人使用,也可以直接分享训练成果,在已有基础上做更多的专业训练,满足不同团队的需求。

看到了这里,不如了解一下我们最新上的产品——数据超市
少有的城市数据汇集地,数据多,数据信息清晰,数据下载快捷,还有很多免费数据!!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多