机器学习杂货铺总店


  • Home

  • About

  • Tags

  • Categories

  • Archives

  • Search

多模态大模型Tag

解耦多模态大模型中的视觉语义压缩与视觉语义摘要

11-06

Flamingo:一种交织图文的视觉语言大模型方法

10-18

Alignment与Correspondence,用于量化衡量MLLM中视觉特征的视觉语义对齐与视觉结构程度的方法

10-15

基于CLIP特征的多模态大模型中的视觉短板问题

07-06

BLIP2——采用Q-Former融合视觉语义与LLM能力的方法

06-12

【论文极速读】MetaLM, 一种融合因果语言模型和非因果语言模型的方法

06-08

Kosmos-2, 在多模态大语言模型中引入基准和指代能力

06-08

Kosmos-1, 通用接口架构下的多模态大语言模型

06-08

【论文极速读】 指令微调BLIP, 一种对指令微调敏感的Q-Former设计

06-08

【论文极速读】 LLava, 指令跟随的多模态大语言模型

06-08

122 posts
40 categories
217 tags
RSS
GitHub E-Mail StackOverflow
© 2025 FesianXu
该站点文章共447k字,欢迎光临~