机器学习杂货铺总店


  • Home

  • About

  • Tags

  • Categories

  • Archives

  • Search

关系视觉相似度(Relational Visual Similarity)

Posted on 2026-01-11 | In 多模态检索
Words count in article: 37k 字 | Reading time ≈ 2:03 分钟

不同于传统的属性语义相似度,关系视觉相似尝试度量图片之间的关系逻辑上的相似度...

Read more »

视觉大语言模型未能充分利用视觉表征

Posted on 2025-09-13 | In 计算机视觉
Words count in article: 6.2k 字 | Reading time ≈ 21 分钟 分钟

这两天看到一篇新挂在arxiv上的文章 [1],讨论了下视觉大语言模型的视觉表征退化问题。先前的研究将VLM缺陷归咎于视觉编码器薄弱,并提出集成编码器方案以弥补不足,本文认为可能是底座LLM不能充分利用视觉编码器的特征...

Read more »

大模型偏好对齐中的DPO和PPO方法

Posted on 2025-09-13 | In 大模型后训练
Words count in article: 776k 字 | Reading time ≈ 43:05 分钟

也许一文能够看懂的DPO和PPO方法...

Read more »

BoNBoN——结合行为模仿和偏好对齐进行Best-of-N对齐的方法

Posted on 2025-03-24 | In 大模型
Words count in article: 496k 字 | Reading time ≈ 27:35 分钟

BoNBoN结合了行为模仿和偏好对齐,在模型的Best-of-N结果基础上进行对齐...

Read more »

给定计算预算下的最佳LLM模型尺寸与预训练数据量分配

Posted on 2025-03-14 | In 大规模语言模型
Words count in article: 213k 字 | Reading time ≈ 11:50 分钟

如果给定了计算预算C,如何分配LLM的模型尺寸N和训练的数据量D,才能使得模型的效果L最好呢...

Read more »

大模型推理时的尺度扩展定律

Posted on 2025-03-02 | In 大规模语言模型
Words count in article: 135k 字 | Reading time ≈ 7:29 分钟

大模型的尺度扩展定律告诉我们:『LLM的性能会随着模型的参数量、模型的训练量、模型的训练数据量的增加而增加』。训练存在尺度扩展定律,测试也存在尺度扩展定律,实践告诉我们在推理时候增大计算量,往往可以获得模型性能收益。那么在给定了计算预算的前提下,如何安排预算才能达到最好的模型效果呢?

Read more »

世界多胞体与世界模型

Posted on 2025-02-09 | In 世界模型
Words count in article: 34k 字 | Reading time ≈ 1:52 分钟

本文记一下我的一个胡思乱想,也不知道有没有现有的论文去研究这个东西,有空我去看看...

Read more »

从一个例子开始,理解互联网岗位分工

Posted on 2025-02-09 | In 互联网趣闻
Words count in article: 15k 字 | Reading time ≈ 50 分钟 分钟

你我皆牛马,活在网中间~

Read more »

奖励模型中的尺度扩展定律和奖励劫持

Posted on 2025-02-09 | In 大模型后训练
Words count in article: 218k 字 | Reading time ≈ 12:07 分钟

奖励模型(Reward Model)中的尺度扩展规律(Scaling Laws),也即是通过扩展奖励模型的模型大小、数据量等去提升奖励模型的能力...

Read more »

MeCO——给预训练数据增加源信息,就能减少33%的训练量并且提升效果

Posted on 2025-01-11 | In 大模型预训练
Words count in article: 6k 字 | Reading time ≈ 20 分钟 分钟

最近看到一篇预训练的文章,只在每条预训练数据的前面加上一个源信息(即是该信息的URL信息),就能加速训练(+33%)并且提升下游任务的效果...

Read more »
12…13下一页

125 posts
40 categories
223 tags
RSS
GitHub E-Mail StackOverflow
© 2026 FesianXu
该站点文章共461k字,欢迎光临~