机器学习杂货铺总店
Home
About
Tags
Categories
Archives
Search
Good! 122 posts in total. Keep on posting.
2025
BoNBoN——结合行为模仿和偏好对齐进行Best-of-N对齐的方法
03-24
给定计算预算下的最佳LLM模型尺寸与预训练数据量分配
03-14
大模型推理时的尺度扩展定律
03-02
世界多胞体与世界模型
02-09
从一个例子开始,理解互联网岗位分工
02-09
奖励模型中的尺度扩展定律和奖励劫持
02-09
MeCO——给预训练数据增加源信息,就能减少33%的训练量并且提升效果
01-11
DoReMi——一种通过代理模型估计大模型预训练最佳数据配比的方法
01-05
2024
基于shell的简单好用多进程wrapper
12-21
CatLIP,加速2.7倍!采用分类损失的CLIP水准的预训练视觉编码器
11-10
1
2
…
13
下一页