1.1 机器学习和人工智能、深度学习的关系 机器学习是人工智能的一个子集,深度学习又是机器学习的一个子集。机器学习与深度学习都是需要大量数据来“喂”的,是大数据技术上的一个应用,同时深度学习还需要更高的运算能力支撑,如 GPU。作为目前最热的机器学习方法,深度学习在计算机视觉、自然语言处理领域已经取得了非凡的成就。但小伙伴们也应注意到,深度学习模型需要大量的训练数据才能展现出神奇的效果,对于现实生活中常常遇到的小样本问题,传统的机器学习方法就已经可以很好地解决了,没必要“杀鸡用牛刀”,且由于数据量小,深度学习方法的精度不一定比传统的机器学习方法高。 传统的机器学习算法有很多,如普通最小二乘法、Lasso 回归、岭回归、K-最近邻、支持向量机、决策树、随机森林、AdaBoost、XGBoost 等。在机器学习领域,有种说法叫“世上没有免费的午餐”,就是说,没有任何一种算法能在每个问题上都取得最好的效果。针对这个问题,学习算法 a 可能更好,而针对那个问题,学习算法 b 可能更好。在脱离实际问题的情况下,空泛地谈论哪种算法好毫无意义,要谈论算法优劣必须针对具体学习问题。 ![]() 1.2 机器学习建模流程 闲话少叙,进入正题! ![]() ![]() 图 3 机器学习模型建模流程 4. 选择合适的机器学习方法,在训练集上训练模型。 5. 采用网格搜索和十折交叉验证方法优化机器学习模型的超参数。在机器学习模型中,有两类参数:1)模型参数,需要从数据中学习得到,如线性回归的加权系数;2)调优参数,需要在训练机器学习模型之前人为设定,称为超参数(hyper-parameter)。为达到最优的模型性能,通常情况下需要对超参数进行调优。 7. 解释机器学习模型的预测结果,验证机器学习模型的可靠性。机器学习这类非参数模型是一个“黑箱”,不能对潜在的物理或力学机制给出明确的解释,如果机器学习模型解释的规律与力学规律不符,即使性能再好,也不能用于生产实践。机器学习模型解释的方法很多,如 SHAP 方法、部分依赖图(PDP)等。
![]() 乔保娟 工学博士 高级工程师 SAUSAGE 软件计算核心负责人,从事建筑结构非线性分析及软件开发研究 肖从真工作室 |
|
来自: nplaiyanfang > 《14-SAUSG》