在中心投影中,相机中心作为聚集光线的理想中心,其具有核心的作用,本文参考[1]中的讨论,加上一些见解,作为笔者学习过程中的笔记。
双目三维重建——层次化重建思考
本文是笔者阅读[1]第10章内容的笔记,本文从宏观的角度阐述了双目三维重建的若干种层次化的方法,包括投影重建,仿射重建和相似性重建到最后的欧几里德重建等。本文作为介绍性质的文章,只提供了这些方法的思路,并没有太多的细节,细节将会由之后的博文继续展开。
一文理解C语言中的volatile修饰符
volatile
修饰符是在嵌入式开发和多线程并发编程中常见的修饰符,理解其对于实践过程非常有帮助,此文参考了[1],并且附上了笔者的一些例子,希望对大家有所帮助。
【darknet源码系列-1】 darknet源码中的常见数据结构
最近笔者在好奇如何从最底层开始搭建一个深度学习系统,之前都是采用现成的成熟深度学习框架,比如PyTorch
,TensorFlow
等进行模型的搭建,对底层原理了解不是特别深刻。因此笔者最近在阅读darknet的源码,希望能从中学习到一些底层的知识,本文主要是对darknet中常见的数据结构进行记录和分析。
【darknet源码系列-3】 在darknet中,如何根据解析出来的配置进行网络层构建
笔者在[1,2]中已经对darknet
如何进行配置解析进行了讲解,现在我们需要将解析出来的配置进行对应的网络层构建。
【darknet源码系列-2】 darknet源码中的cfg解析
笔者在[1]一文中简单介绍了在darknet
中常见的数据结构,本文继续上文的节奏,介绍如何从cfg
文本文件中解析出整个网络的结构与参数。
视频分析与多模态融合之一,为什么需要多模态融合
在前文《万字长文漫谈视频理解》[1]中,笔者曾经对视频理解中常用的一些技术进行了简单介绍,然而限于篇幅,意犹未尽。在实习工作中,笔者进一步接触了更多视频分析在视频搜索中的一些应用,深感之前对视频分析在业界中应用的理解过于狭隘。本文作为笔者对前文的一个补充,进一步讨论一下视频分析以及其在搜索推荐系统中的一些应用。本文是该系列的第一篇,主要介绍了通用的视频图片语义以及讨论了多模态模型的必要性。