论相机中心投影中，相机中心的作用

最近笔者在好奇如何从最底层开始搭建一个深度学习系统，之前都是采用现成的成熟深度学习框架，比如PyTorch，TensorFlow等进行模型的搭建，对底层原理了解不是特别深刻。因此笔者最近在阅读darknet的源码，希望能从中学习到一些底层的知识，本文主要是对darknet中常见的数据结构进行记录和分析。

【darknet源码系列-3】在darknet中，如何根据解析出来的配置进行网络层构建

Posted on 2022-12-24 | In 深度学习系统

Words count in article: 5.3k 字 | Reading time ≈ 23 分钟

笔者在[1,2]中已经对darknet如何进行配置解析进行了讲解，现在我们需要将解析出来的配置进行对应的网络层构建。

【darknet源码系列-2】 darknet源码中的cfg解析

Posted on 2022-12-24 | In 深度学习系统

Words count in article: 3.5k 字 | Reading time ≈ 14 分钟

笔者在[1]一文中简单介绍了在darknet中常见的数据结构，本文继续上文的节奏，介绍如何从cfg文本文件中解析出整个网络的结构与参数。

搜索系统中的一些指标

Posted on 2022-12-24 | In 搜索系统

Words count in article: 2.2k 字 | Reading time ≈ 8 分钟

本文作为笔者在学习搜索系统中时候遇到的一些指标以及其含义，计算方式的笔记。

从零开始的搜索系统学习笔记

Posted on 2022-12-24 | In 搜索系统

Words count in article: 4.8k 字 | Reading time ≈ 16 分钟

笔者在百度实习的过程中，从零开始开始学习了一些关于信息搜索系统的知识，觉得受益匪浅，在此笔记，希望对读者有所帮助。

视频分析与多模态融合之一，为什么需要多模态融合

Posted on 2022-12-24 | In 多模态模型

Words count in article: 4.3k 字 | Reading time ≈ 15 分钟

在前文《万字长文漫谈视频理解》[1]中，笔者曾经对视频理解中常用的一些技术进行了简单介绍，然而限于篇幅，意犹未尽。在实习工作中，笔者进一步接触了更多视频分析在视频搜索中的一些应用，深感之前对视频分析在业界中应用的理解过于狭隘。本文作为笔者对前文的一个补充，进一步讨论一下视频分析以及其在搜索推荐系统中的一些应用。本文是该系列的第一篇，主要介绍了通用的视频图片语义以及讨论了多模态模型的必要性。