lightGBM总结 发表于 2019-03-27 | 分类于 机器学习算法 lightGBM的优化1.直方图算法2.按叶子生长(leaf-wise)3.直方图加速4.直接支持类别特征5.特征并行和数据并行 使用注意1.设置提前停止2.自动处理类别特征3.缺失值处理 spark 重点相关1.spark job 提交流程,及dag有向无环图生成流程2.spark shuffle 原理(shuffle read,shuffle write)3.spark 内存区域管理(2.0以前,2.0后) col存储的特点(优势)1.块遍历2.压缩3.延迟物化