最近基于AI的换脸应用非常的火爆,同时也引起了新一轮的网络伦理大讨论。如果光从技术的角度看,对于视频中的人体动作信息,通常可以通过泰勒展开分解成零阶运动信息与一阶运动信息,如文献[1,2]中提到的,动作的分解可以为图片动画化提供很好的光流信息,而图片动画化是提供换脸技术的一个方法。
为何基于树的模型在表格型数据中能优于深度学习?
基于树的模型(Tree-based model),比如GBDT,XGBoost,Random Forest等仍然是Kaggle,天池等数据比赛中最为常用的算法,在遇到表格型数据(Tabular data)的时候,这些树模型在大多数场景中甚至表现优于深度学习,要知道后者已经在诸多领域(CV,NLP,语音处理等)已经占据了绝对的优势地位。那么为何如此呢?
模型无关的全局特征依赖分析方法 I ——部分依赖曲线分析与条件依赖曲线分析
公司内部用的LTR(Learning To Rank)平台能够对树模型的特征依赖进行曲线绘制,其中绘制的原理没能从内部文档中找到,只是大概知道这个特征依赖曲线能够反应树模型中每个特征的输入输出响应。后面在和同事的交流中渐渐发现了一些端倪,后经过调研后初步得到一些结论,本文简单笔记之。
浅论分布式训练中的recompute机制
我们在进行对比学习训练时候,经常需要设置大的batch size,而显卡的显存大小是限制batch size大小的最主要因素,在实践过程中我们经常采用recompute
机制,通过用计算换空间的方式,减少模型的内存消耗。然,在动态图训练时候,recompute
机制需要进行手动的停止同步和梯度融合,本文纪录下这个问题。
【见闻录系列】浅谈搜索系统与推荐系统的一点区别
之前北京爬山的时候,刚好遇到京东搞推荐相关的朋友,在交流过程中发现推荐系统似乎和搜索系统在模型选用上有很大差别,特别是在排序模型这块。后面在学习王喆老师的《深度学习推荐系统》一书时,发现在推荐系统中经常采用深度网络模型,以进行特征的深层次交叉,而对传统的(但具有可解释性)树模型的应用似乎没看到。
【见闻录系列】我所理解的搜索业务二三事
之前笔者在博文[1]中谈到了在工作一年的过程中,笔者对“业务”两个字的认识,并且尝试解释了我所理解的“技术赋能业务”。在前文的基础上,本文希望进一步纪录下此时我对于搜索业务的认识。
一文详解静态图和动态图中的自动求导机制
4年前打算写一个关于autodiff的系列文章,因为工作和学习上比较忙碌(Lan Duo :P),就一直拖到了现在。刚好最近又在学习OPEN MLSYS[2],借此机会将静态图中的autodiff笔记也一并写完吧。