人体动作捕捉技术(简称人体动捕技术)是影视游戏行业中常用的技术,其可以实现精确的人体姿态,运动捕捉,但是用于此的设备昂贵,很难在日常生活中广泛应用。视频人体动作捕捉技术指的是输入视频片段,捕捉其中场景中的人体运动信息,基于这种技术,可以从互联网中海量的视频中提取其中的人体运动姿态数据,具有很广阔的应用场景。本文打算介绍视频人体动作捕捉相关的一些工作并且笔者的一些个人看法 。
《geometric deep learning笔记系列》第三篇,GCN的空间域理解,Message Passing以及其含义
在上一篇文章中[1],我们介绍了Graph Convolution Network的推导以及背后的思路等,但是,其实我们会发现,在傅立叶域上定义出来的GCN操作,其实也可以在空间域上进行理解,其就是所谓的消息传递机制,我们在本篇文章将会接着[1],继续介绍Message Passing机制。
《geometric deep learning笔记系列》第二篇,在Graph上定义卷积操作,图卷积网络
我们曾在[1]中探讨了欧几里德结构数据(如图像,音视频,文本等)和非欧几里德结构数据(如Graph和Manifold等)之间的不同点,在本文中,我们探讨如何在非欧几里德结构数据,特别是Graph数据上定义出卷积操作,以便于实现深度神经学习。
《geometric deep learning笔记系列》第一篇,Non-Euclidean Structure Data之我见
本文是笔者在学习Geometric deep learning
的过程中的一些笔记和想法,较为零散,主要纪录了非欧几里德结构数据和欧几里德结构数据之间的区别,后续会引出图卷积网络模型。
中心投影中透视的形成
我们知道在透视法中,相互平行的平行线会在无限远处相交于一点,我们称之为理想点(ideal point),对于这个透视成像的介绍,我们在之前的文章[1,2,3]中都或多或少介绍过,同时还引入了齐次坐标系,以便于对投影变换下的不同情况进行统一建模...
投影相机,透视相机,弱透视相机和仿射相机的区别和联系
相机一般来说是一种从3D到2D的一种投影工具,其按照数学模型可以分为投影相机,透视相机,弱透视相机和仿射相机等,笔者在本文中尝试对其进行区分和联系。
相机的针孔模型及其内参数,外参数的理解
在相机成像过程中,我们经常会提到相机的内参数,外参数,这些参数决定了一个相机的成像的效果,是后续一系列计算机视觉问题的基础中的基础,然而因为较为底层的原因,现在却比较少人关心它,笔者最近在学习一些底层的计算机视觉成像理论,感觉有所裨益,希望能在此进行笔记,作为备忘,如果能对读者有所帮助,则是更好不过了。
相机中的透视投影几何——讨论相机中的正交投影,弱透视投影以及透视的一些性质
相机中的成像其本质是从3D实体世界中的物体投影到2D成像平面上,在这个过程中存在着许多投影相关的内容,本文讨论了一些透视投影的内容,作为笔者在学习过程中的笔记。
【多视角立体视觉系列】 conic圆锥线和quadric二次曲锥面的定义和应用
之前我们讨论过一些几何元素,比如点线面等,在本文中,我们将谈到称之为圆锥线和二次曲锥面的几何元素,这种类型的曲线对于讨论计算机视觉中投影是非常有效的,同时也是定义不同几何变换——投影变换,仿射变换,欧几里德变换等区别的要点之一,需要我们很好地掌握。