给自己Linux搞个『回收站』，防止文件误删除

最近chatGPT、GPT-4火爆了全网，笔者觉得大规模语言模型（Large Language Model, LLM）可能是未来人工智能发展的方向，因此最近也在恶补相关的论文。本次分享一个经典的工作，该工作介绍了LLM中的一种独特模型属性——“能力涌现”，而这个能力可以说是chatGPT、GPT-4等对话模型的基石...

视频与图片检索中的多模态语义匹配模型：原理、启示、应用与展望

Posted on 2023-03-04 | In 多模态模型

Words count in article: 2029k 字 | Reading time ≈ 122:59 分钟

三多前笔者在《万字长文漫谈视频理解》[1]一文中，曾经将自己对视频理解的认识进行过简单总结，幸而获得了朋友们的认可，能让读者认可是笔者最为骄傲的成就。现在看来文中观点有不少纰漏狭隘之处，特别是近年来多模态模型的流行，更让视频理解这个方向出现了诸多变革技术，之前在博文《视频分析与多模态融合之一，为什么需要多模态融合》 [2] 曾经尝试对[1]进行补丁，但是限于笔者时间和当时的认识水平，并没有进行展开讨论。本文希望能对近年来的多模态模型进行简单总结，并且简单讨论这些模型在图片搜索和视频搜索这类富媒体检索场景中的应用可能性。

【Hadoop Streaming实践系列】大规模字段提取的实践

Posted on 2023-02-11 | In Hadoop使用

Words count in article: 25k 字 | Reading time ≈ 1:29 分钟

本文介绍如何利用Hadoop Streaming任务进行数以十亿计的大规模字段提取。

【论文极速读】MoCo v3：MoCo机制下Transformer模型的训练不稳定现象

Posted on 2023-02-11 | In 论文极速读

Words count in article: 30k 字 | Reading time ≈ 1:49 分钟

之前笔者在[1]中介绍过MoCo v1模型通过解耦batch size和负样本队列大小，从而实现超大负样本队列的对比学习训练方案；在[2]中我们提到了当前对比学习训练中提高负样本数量的一些方法；在[3]中提到了将MoCo扩展到多模态检索中的方案。在本文，我们介绍下MoCo v3，一种尝试在Transformer模型中引入MoCo机制的方法，并且最重要的，介绍其中作者得到的一些训练的小技巧（Trick）。

【论文极速读】 Efficient Net：一种组合扩大卷积网络规模的方法

Posted on 2023-02-11 | In 论文极速读

Words count in article: 247k 字 | Reading time ≈ 14:59 分钟

最近笔者需要基于Efficient Net作为图片编码器进行实验，之前一直没去看原论文，今天抽空去翻了下原论文，简单记下笔记。