机器学习杂货铺总店


  • Home

  • About

  • Tags

  • Categories

  • Archives

  • Search

【darknet源码系列-1】 darknet源码中的常见数据结构

Posted on 2022-12-24 | In 深度学习系统
Words count in article: 32k 字 | Reading time ≈ 1:55 分钟

最近笔者在好奇如何从最底层开始搭建一个深度学习系统,之前都是采用现成的成熟深度学习框架,比如PyTorch,TensorFlow等进行模型的搭建,对底层原理了解不是特别深刻。因此笔者最近在阅读darknet的源码,希望能从中学习到一些底层的知识,本文主要是对darknet中常见的数据结构进行记录和分析。

Read more »

【darknet源码系列-3】 在darknet中,如何根据解析出来的配置进行网络层构建

Posted on 2022-12-24 | In 深度学习系统
Words count in article: 260k 字 | Reading time ≈ 15:46 分钟

笔者在[1,2]中已经对darknet如何进行配置解析进行了讲解,现在我们需要将解析出来的配置进行对应的网络层构建。

Read more »

【darknet源码系列-2】 darknet源码中的cfg解析

Posted on 2022-12-24 | In 深度学习系统
Words count in article: 37k 字 | Reading time ≈ 2:14 分钟

笔者在[1]一文中简单介绍了在darknet中常见的数据结构,本文继续上文的节奏,介绍如何从cfg文本文件中解析出整个网络的结构与参数。

Read more »

搜索系统中的一些指标

Posted on 2022-12-24 | In 搜索系统
Words count in article: 197k 字 | Reading time ≈ 11:58 分钟

本文作为笔者在学习搜索系统中时候遇到的一些指标以及其含义,计算方式的笔记。

Read more »

从零开始的搜索系统学习笔记

Posted on 2022-12-24 | In 搜索系统
Words count in article: 17k 字 | Reading time ≈ 1:03 分钟

笔者在百度实习的过程中,从零开始开始学习了一些关于信息搜索系统的知识,觉得受益匪浅,在此笔记,希望对读者有所帮助。

Read more »

视频分析与多模态融合之一,为什么需要多模态融合

Posted on 2022-12-24 | In 多模态模型
Words count in article: 10k 字 | Reading time ≈ 38 mins. 分钟

在前文《万字长文漫谈视频理解》[1]中,笔者曾经对视频理解中常用的一些技术进行了简单介绍,然而限于篇幅,意犹未尽。在实习工作中,笔者进一步接触了更多视频分析在视频搜索中的一些应用,深感之前对视频分析在业界中应用的理解过于狭隘。本文作为笔者对前文的一个补充,进一步讨论一下视频分析以及其在搜索推荐系统中的一些应用。本文是该系列的第一篇,主要介绍了通用的视频图片语义以及讨论了多模态模型的必要性。

Read more »

基于图结构的视频理解——组织视频序列的非线性流

Posted on 2022-12-24 | In 视频理解
Words count in article: 340k 字 | Reading time ≈ 20:37 分钟

我们在之前的博文[1]中曾经花了很长的篇幅介绍了视频理解与表征的一些内容,当然,由于篇幅原因,其实还是省略了很多内容的,特别是一些比较新的研究成果都没能进行介绍,在本文,我们继续我们的视频理解之旅,我们将在本文介绍一种基于图结构的视频理解方法,其可以组织视频序列中一些人为编辑或者镜头切换导致的非线性流,是一项非常有意思的研究。

Read more »

GBDT-梯度提升决策树的一些思考

Posted on 2022-12-24 | In 笔记
Words count in article: 354k 字 | Reading time ≈ 21:26 分钟

最近笔者工作中用到了GBRank模型,其中用到了GBDT梯度提升决策树,原论文的原文并不是很容易看懂,在本文纪录下GBDT的一些原理和个人理解,作为笔记。

Read more »

万字长文漫谈视频理解

Posted on 2022-12-24 | In 视频理解
Words count in article: 731k 字 | Reading time ≈ 44:18 分钟

AI算法已经渗入到了我们生活的方方面面,无论是购物推荐,广告推送,搜索引擎还是多媒体影音娱乐,都有AI算法的影子。作为多媒体中重要的信息载体,视频的地位可以说是数一数二的,然而目前对于AI算法在视频上的应用还不够成熟,理解视频内容仍然是一个重要的问题亟待解决攻克。

Read more »

运动的零阶分解与一阶分解以及在图片动画化中的应用 I

Posted on 2022-12-24 | In 计算机图形学
Words count in article: 660k 字 | Reading time ≈ 40:01 分钟

最近基于AI的换脸应用非常的火爆,同时也引起了新一轮的网络伦理大讨论。如果光从技术的角度看,对于视频中的人体动作信息,通常可以通过泰勒展开分解成零阶运动信息与一阶运动信息,如文献[1,2]中提到的,动作的分解可以为图片动画化提供很好的光流信息,而图片动画化是提供换脸技术的一个方法。

Read more »
上一页1…10111213下一页

122 posts
40 categories
217 tags
RSS
GitHub E-Mail StackOverflow
© 2025 FesianXu
该站点文章共447k字,欢迎光临~