模型在线服务 · TI

蓝月向清风 2019-02-26

展开全文

模型部署和服务

模型部署和服务，目的是将模型从离线服务轻松变成在线服务，对闭环模型非常重要，尤其在深度学习中更是如此。TI-ONE上就可以把模型通过在线部署方式，让您的模型可以直接对用户提供服务

1. 模型部署

在模型训练节点（小尾巴），左侧工具栏中的个人模型/共享模型右键菜单里都有模型部署的入口。如下

小尾巴

模型组件

进入部署参数配置页面，配置好以后就可以部署了

字段说明：

模型组：个人模型服务的组别，和工程类似，一个用户可以有多个模型服务组。系统给每个用户一个默认的模型服务组；
实例类型：模型服务的资源配置（CPU，GPU，内存），平台初始化定制好多种类型。
实例数：上述的资源配置的套数。
服务分类：分为2类TFServing和inference模式。机器学习(如Spark，xgBoost)模型部署为inference模式；深度学习则选择TFServing。
对于机器学习模型服务，用户可根据业务场景，自行实现线上服务脚本，达到最大化的灵活度。目前仅支持Python类型脚本，脚本需要遵循如下规范，具体实现请参考附件：

主类名统一定义为 InferenceService
类中包括__init__(self, model_path)、 load_model(self) 和 process_request(self,request) 三个方法
__init__(self, model_path)用于初始化参数，并调用load_model()方法，model_path中保存模型路径。
load_model(self)用于初始化环境及模型加载。
process_request(self, request)在线任务获取数据请求时，将调用process_request()方法进行处理，request保存Json形式的请求数据，通过request.get()方法获取各字段。
脚本的定义，可以按照代码中的6个步骤进行实现：
# 1. 引入环境变量# <1. Spark> from pyspark.ml.classification import LogisticRegressionModel# <1. Spark> from pyspark import SparkContext# <2. Tensorflow> import tensorflow as tf# <3. XGBoost> import xgboost as xgbclass InferenceService: ''' logistic regression online service ''' def __init__(self, model_path): self.model_path = model_path # 参数定义 self.load_model() def load_model(self): # 2. 环境变量定义 # <1 Spark> sc = SparkContext(appName=__name__, master='local') # <2 Tensorflow> self.sess = tf.Session() # <3. XGBoost> bst = xgb.Booster({'nthread':1}) # 3 模型加载 # <1 Spark> spark_model = LogisticRegressionModel.load(self.model_path) # <2 Tensorflow> ckpt = tf.train.get_checkpoint_state(self.model_path) # <3. XGBoost> bst.load_model(self.model_path+'/LocalFile') def process_request(self, request): # 4. Json字段获取，以type和data两个字段为例 # {'type':'libsvm','feature_num':'523','data':{'insts':'0 1:0 2:1.0 3:565 '}} data_type = request.get('type', 'dense') data = request.get('data') # 5. 逻辑定义 # 6. 返回结果 return result

部署版本：分为新增部署或替换部署。新增指在原有的服务基础上，用当前的模型新建一个版本的服务，替换则是把原有的版本替换成当前的。
进入部署参数配置页面，配置好以后就可以部署了

2. 模型服务

新增模型服务组

系统为每个用户自动新增了一个“用户登陆名的模型服务组”，用户也可以新建自己的模型服务组，如下

模型部署后，可以在“模型服务”TAB进行管理，如下

模型服务状态有3种：

部署中：模型服务正在部署过程中

服务中：部署已经成功，可提供服务

部署失败: 失败后可查询部署的日志（卡片右上角）定位，如果申请的资源超过上限，也会部署失败

可以最多支持6个版本的模型服务，即可支持1个模型6个版本同时在线服务。

模型服务操作

重新部署：部署后可能由于底层系统的app没启动起来，或者app执行异常退出部署失败，可进行重新部署。
删除：点击卡片上的“删除”按钮是删除这个版本的模型服务，点击模型服务右上角的删除按钮则是一键删除模型的所有版本的在线实例。

模型服务日志查看：

提供2种日志查看：

上图中，右上角的日志按钮点击进去后，将列出该模型部署日志，下面的在版本卡片上的“日志”链接点击进去，可以看到这个版本的模型的服务日志，即APP日志。当然，如果部署失败，服务没有启动起来，那么服务日志是看不到内容的。

3.模型服务指标

点击模型服务的卡片，就可以进入到模型服务指标和可视化性能页面。模型的指标都可以在这里看到，您可以在此查阅到模型自身信息以及服务的性能。

这个页面中会展示如下信息

模型指标：模型基本信息，和训练时模型观察台看到的是一致的。. 服务地址：本版本提供服务的URL. 服务性能：该版本模型服务的访问量曲线. 可视化性能：模型自身的服务性能。如上图中例子就是模型训练过程损失函数曲线

4.模型服务的使用

模型服务支持两种协议类型，HTTP和GRPC模型。其中HTTP模块目前支持xgboost，spark以及tf。GRPC是社区版本tensorflow serving的内部服务实现，相关的接口参考serving的相关配置。

这里说明一下HTTP的接口说明，在使用前需要准备Inference在线模型加载和处理类，该类中必须包括下面的内容。

//固定名称，实现的接口类，必须这样的名称，请不要修改。class InferenceService:

//类初始化函数，该函数包含了变量model_path，服务框架在加载类时会把模型所在目录或是模型文件传入进来，根据这个路径用户可以加载自己的模型到内存中以提供服务def __init__(self, model_path):

//类的请求处理函数，传入的是http请求的json内容例如请求的http请求为： //curl -H 'Content-Type: application/json' -X POST --data '{'type':'libsvm','feature_num':'524','data':{'insts':'0 1:0 2:1.0 3:565 4:9 5:6 6:47200.0 7:15 8:0.48 9:1959200.0 10:-65535.0 11:0.0 12:0.6447333333333334 524:-65535.0'}}' http://119.29.47.157:9991/gpu_cluster/tione-33333333/inference-1525426013831-85-model-service-2009-0//predict/m47/1 //其中 request为 -Data指定的内容，这里用户可以自己定位传输数据的接口，我们这里建议接口为type：libsvm和dense feature_num：feasture的number数据，data为数据内容，可以支持多条数据，建议批量请求 def process_request(self, request):

完整的参考例子：

用户的请求测试命令为：curl -H 'Content-Type: application/json' -X POST --data '{'type':'libsvm','feature_num':'524','data':{'insts':'0 1:0 2:1.0 3:565 4:9 5:6 6:47200.0 7:15 8:0.48 9:1959200.0 10:-65535.0 11:0.0 12:0.6447333333333334 524:-65535.0'}}' http://119.29.47.157:9991/gpu_cluster/tione-33333333/inference-1525426013831-85-model-service-2009-0//predict/m47/1

返回json结果：{'message': 'SUCCESS', 'code': 0, 'data': {'insts': [0.6868814826011658]}}