之前在[1]中曾经讨论过在集群中分布式训练大型模型需要一些特别的分布式数据加载器设计,文章最后还讨论了由于分布式多机多卡训练过程中,某个trainer由于数据读取,将会导致其他所有trainer阻塞等待,造成了很大的计算资源浪费的情况。本文针对这种情况,提出一种基于多进程的解法。
集群深度学习训练实践笔记——分布式数据读取器
本文主要作为笔者在分布式集群中训练深度学习模型,特别是一些大规模模型和在海量数据下的训练的经验,本文实践以paddle 2.1为例,包括paddle 动态图和静态图的使用等。
一文搞懂卡尔曼滤波,从传感器数据融合开始谈起
最近在一个项目中接触到了卡尔曼滤波,并且对此进行了学习,发现其是一个很有意思的信息融合的算法,可以结合多种传感器的信息(存在噪声),得到更为理想的估计,因此在此进行笔记和心得纪录。本人不是从事控制相关专业工作,可能在短暂的自学过程中对此存在误解,若有谬误,望联系指出,谢谢。
视频人体动作捕捉技术
人体动作捕捉技术(简称人体动捕技术)是影视游戏行业中常用的技术,其可以实现精确的人体姿态,运动捕捉,但是用于此的设备昂贵,很难在日常生活中广泛应用。视频人体动作捕捉技术指的是输入视频片段,捕捉其中场景中的人体运动信息,基于这种技术,可以从互联网中海量的视频中提取其中的人体运动姿态数据,具有很广阔的应用场景。本文打算介绍视频人体动作捕捉相关的一些工作并且笔者的一些个人看法 。
《geometric deep learning笔记系列》第三篇,GCN的空间域理解,Message Passing以及其含义
在上一篇文章中[1],我们介绍了Graph Convolution Network的推导以及背后的思路等,但是,其实我们会发现,在傅立叶域上定义出来的GCN操作,其实也可以在空间域上进行理解,其就是所谓的消息传递机制,我们在本篇文章将会接着[1],继续介绍Message Passing机制。
《geometric deep learning笔记系列》第二篇,在Graph上定义卷积操作,图卷积网络
我们曾在[1]中探讨了欧几里德结构数据(如图像,音视频,文本等)和非欧几里德结构数据(如Graph和Manifold等)之间的不同点,在本文中,我们探讨如何在非欧几里德结构数据,特别是Graph数据上定义出卷积操作,以便于实现深度神经学习。
《geometric deep learning笔记系列》第一篇,Non-Euclidean Structure Data之我见
本文是笔者在学习Geometric deep learning
的过程中的一些笔记和想法,较为零散,主要纪录了非欧几里德结构数据和欧几里德结构数据之间的区别,后续会引出图卷积网络模型。
中心投影中透视的形成
我们知道在透视法中,相互平行的平行线会在无限远处相交于一点,我们称之为理想点(ideal point),对于这个透视成像的介绍,我们在之前的文章[1,2,3]中都或多或少介绍过,同时还引入了齐次坐标系,以便于对投影变换下的不同情况进行统一建模...
投影相机,透视相机,弱透视相机和仿射相机的区别和联系
相机一般来说是一种从3D到2D的一种投影工具,其按照数学模型可以分为投影相机,透视相机,弱透视相机和仿射相机等,笔者在本文中尝试对其进行区分和联系。