机器学习杂货铺总店


  • Home

  • About

  • Tags

  • Categories

  • Archives

  • Search
Good! 122 posts in total. Keep on posting.

2025

BoNBoN——结合行为模仿和偏好对齐进行Best-of-N对齐的方法

03-24

给定计算预算下的最佳LLM模型尺寸与预训练数据量分配

03-14

大模型推理时的尺度扩展定律

03-02

世界多胞体与世界模型

02-09

从一个例子开始,理解互联网岗位分工

02-09

奖励模型中的尺度扩展定律和奖励劫持

02-09

MeCO——给预训练数据增加源信息,就能减少33%的训练量并且提升效果

01-11

DoReMi——一种通过代理模型估计大模型预训练最佳数据配比的方法

01-05

2024

基于shell的简单好用多进程wrapper

12-21

CatLIP,加速2.7倍!采用分类损失的CLIP水准的预训练视觉编码器

11-10
12…13下一页

122 posts
40 categories
217 tags
RSS
GitHub E-Mail StackOverflow
© 2025 FesianXu
该站点文章共447k字,欢迎光临~