机器学习杂货铺总店


  • Home

  • About

  • Tags

  • Categories

  • Archives

  • Search

基于图结构的视频理解——组织视频序列的非线性流

Posted on 2022-12-24 | In 视频理解
Words count in article: 3.1k 字 | Reading time ≈ 11 分钟

我们在之前的博文[1]中曾经花了很长的篇幅介绍了视频理解与表征的一些内容,当然,由于篇幅原因,其实还是省略了很多内容的,特别是一些比较新的研究成果都没能进行介绍,在本文,我们继续我们的视频理解之旅,我们将在本文介绍一种基于图结构的视频理解方法,其可以组织视频序列中一些人为编辑或者镜头切换导致的非线性流,是一项非常有意思的研究。

Read more »

GBDT-梯度提升决策树的一些思考

Posted on 2022-12-24 | In 笔记
Words count in article: 1.7k 字 | Reading time ≈ 6 分钟

最近笔者工作中用到了GBRank模型,其中用到了GBDT梯度提升决策树,原论文的原文并不是很容易看懂,在本文纪录下GBDT的一些原理和个人理解,作为笔记。

Read more »

万字长文漫谈视频理解

Posted on 2022-12-24 | In 视频理解
Words count in article: 24k 字 | Reading time ≈ 88 分钟

AI算法已经渗入到了我们生活的方方面面,无论是购物推荐,广告推送,搜索引擎还是多媒体影音娱乐,都有AI算法的影子。作为多媒体中重要的信息载体,视频的地位可以说是数一数二的,然而目前对于AI算法在视频上的应用还不够成熟,理解视频内容仍然是一个重要的问题亟待解决攻克。

Read more »

运动的零阶分解与一阶分解以及在图片动画化中的应用 I

Posted on 2022-12-24 | In 计算机图形学
Words count in article: 6.8k 字 | Reading time ≈ 24 分钟

最近基于AI的换脸应用非常的火爆,同时也引起了新一轮的网络伦理大讨论。如果光从技术的角度看,对于视频中的人体动作信息,通常可以通过泰勒展开分解成零阶运动信息与一阶运动信息,如文献[1,2]中提到的,动作的分解可以为图片动画化提供很好的光流信息,而图片动画化是提供换脸技术的一个方法。

Read more »

【论文极速读】VQ-VAE:一种稀疏表征学习方法

Posted on 2022-12-24 | In 论文极速读
Words count in article: 1k 字 | Reading time ≈ 3 分钟

最近有需求对特征进行稀疏编码,看到一篇论文VQ-VAE,简单进行笔记下。

Read more »

为何基于树的模型在表格型数据中能优于深度学习?

Posted on 2022-12-24 | In 深度学习
Words count in article: 3.7k 字 | Reading time ≈ 12 分钟

基于树的模型(Tree-based model),比如GBDT,XGBoost,Random Forest等仍然是Kaggle,天池等数据比赛中最为常用的算法,在遇到表格型数据(Tabular data)的时候,这些树模型在大多数场景中甚至表现优于深度学习,要知道后者已经在诸多领域(CV,NLP,语音处理等)已经占据了绝对的优势地位。那么为何如此呢?

Read more »

模型无关的全局特征依赖分析方法 I ——部分依赖曲线分析与条件依赖曲线分析

Posted on 2022-12-23 | In 模型分析系列
Words count in article: 4.6k 字 | Reading time ≈ 17 分钟

公司内部用的LTR(Learning To Rank)平台能够对树模型的特征依赖进行曲线绘制,其中绘制的原理没能从内部文档中找到,只是大概知道这个特征依赖曲线能够反应树模型中每个特征的输入输出响应。后面在和同事的交流中渐渐发现了一些端倪,后经过调研后初步得到一些结论,本文简单笔记之。

Read more »

hinge loss的一种实现方法

Posted on 2022-12-23 | In 笔记
Words count in article: 860 字 | Reading time ≈ 3 分钟

本文讲解hinge loss高效的一种实现方法。

Read more »

【Debug危机系列】Embedding层的千层套路

Posted on 2022-12-23 | In Debug危机系列
Words count in article: 2.2k 字 | Reading time ≈ 9 分钟

这次的debug案例来自于朋友的一个问题,Embedding层的前向和反向速度是否会随着token的增多而增加呢?本文对这个问题进行讨论。

Read more »

浅论分布式训练中的recompute机制

Posted on 2022-12-23 | In 深度学习系统
Words count in article: 3.5k 字 | Reading time ≈ 13 分钟

我们在进行对比学习训练时候,经常需要设置大的batch size,而显卡的显存大小是限制batch size大小的最主要因素,在实践过程中我们经常采用recompute机制,通过用计算换空间的方式,减少模型的内存消耗。然,在动态图训练时候,recompute机制需要进行手动的停止同步和梯度融合,本文纪录下这个问题。

Read more »
上一页1…111213下一页

126 posts
40 categories
226 tags
RSS
GitHub E-Mail StackOverflow
© 2026 FesianXu
该站点文章共424.3k字,欢迎光临~