万字长文漫谈视频理解

Posted on 2022-12-24 | In 视频理解

Words count in article: 24k 字 | Reading time ≈ 88 分钟

AI算法已经渗入到了我们生活的方方面面，无论是购物推荐，广告推送，搜索引擎还是多媒体影音娱乐，都有AI算法的影子。作为多媒体中重要的信息载体，视频的地位可以说是数一数二的，然而目前对于AI算法在视频上的应用还不够成熟，理解视频内容仍然是一个重要的问题亟待解决攻克。

运动的零阶分解与一阶分解以及在图片动画化中的应用 I

Posted on 2022-12-24 | In 计算机图形学

Words count in article: 6.8k 字 | Reading time ≈ 24 分钟

最近基于AI的换脸应用非常的火爆，同时也引起了新一轮的网络伦理大讨论。如果光从技术的角度看，对于视频中的人体动作信息，通常可以通过泰勒展开分解成零阶运动信息与一阶运动信息，如文献[1,2]中提到的，动作的分解可以为图片动画化提供很好的光流信息，而图片动画化是提供换脸技术的一个方法。

【论文极速读】VQ-VAE：一种稀疏表征学习方法

Posted on 2022-12-24 | In 论文极速读

Words count in article: 1k 字 | Reading time ≈ 3 分钟

最近有需求对特征进行稀疏编码，看到一篇论文VQ-VAE，简单进行笔记下。

为何基于树的模型在表格型数据中能优于深度学习？

Posted on 2022-12-24 | In 深度学习

Words count in article: 3.7k 字 | Reading time ≈ 12 分钟

基于树的模型（Tree-based model），比如GBDT，XGBoost，Random Forest等仍然是Kaggle，天池等数据比赛中最为常用的算法，在遇到表格型数据（Tabular data）的时候，这些树模型在大多数场景中甚至表现优于深度学习，要知道后者已经在诸多领域（CV，NLP，语音处理等）已经占据了绝对的优势地位。那么为何如此呢？

模型无关的全局特征依赖分析方法 I ——部分依赖曲线分析与条件依赖曲线分析

Posted on 2022-12-23 | In 模型分析系列

Words count in article: 4.6k 字 | Reading time ≈ 17 分钟

公司内部用的LTR（Learning To Rank）平台能够对树模型的特征依赖进行曲线绘制，其中绘制的原理没能从内部文档中找到，只是大概知道这个特征依赖曲线能够反应树模型中每个特征的输入输出响应。后面在和同事的交流中渐渐发现了一些端倪，后经过调研后初步得到一些结论，本文简单笔记之。

hinge loss的一种实现方法

Posted on 2022-12-23 | In 笔记

Words count in article: 860 字 | Reading time ≈ 3 分钟

本文讲解hinge loss高效的一种实现方法。

【Debug危机系列】Embedding层的千层套路

Posted on 2022-12-23 | In Debug危机系列

Words count in article: 2.2k 字 | Reading time ≈ 9 分钟

这次的debug案例来自于朋友的一个问题，Embedding层的前向和反向速度是否会随着token的增多而增加呢？本文对这个问题进行讨论。

浅论分布式训练中的recompute机制

Posted on 2022-12-23 | In 深度学习系统

Words count in article: 3.5k 字 | Reading time ≈ 13 分钟

我们在进行对比学习训练时候，经常需要设置大的batch size，而显卡的显存大小是限制batch size大小的最主要因素，在实践过程中我们经常采用recompute机制，通过用计算换空间的方式，减少模型的内存消耗。然，在动态图训练时候，recompute机制需要进行手动的停止同步和梯度融合，本文纪录下这个问题。

【见闻录系列】浅谈搜索系统与推荐系统的一点区别

Posted on 2022-12-23 | In 见闻录系列

Words count in article: 3.1k 字 | Reading time ≈ 10 分钟

之前北京爬山的时候，刚好遇到京东搞推荐相关的朋友，在交流过程中发现推荐系统似乎和搜索系统在模型选用上有很大差别，特别是在排序模型这块。后面在学习王喆老师的《深度学习推荐系统》一书时，发现在推荐系统中经常采用深度网络模型，以进行特征的深层次交叉，而对传统的（但具有可解释性）树模型的应用似乎没看到。

【见闻录系列】我所理解的搜索业务二三事

Posted on 2022-12-23 | In 见闻录系列

Words count in article: 7.8k 字 | Reading time ≈ 27 分钟

之前笔者在博文[1]中谈到了在工作一年的过程中，笔者对“业务”两个字的认识，并且尝试解释了我所理解的“技术赋能业务”。在前文的基础上，本文希望进一步纪录下此时我对于搜索业务的认识。