阿里云推大规模视觉语言模型开源,支持中英文多种语言
(资料图片仅供参考)
阿里云于8月25日推出了大规模视觉语言模型Qwen-VL,该模型已在ModeScope开源。此前,阿里云已经开源了通用模型Qwen-7B和对话模型Qwen-7B-Chat。Qwen-VL是一款支持中英文等多种语言的视觉语言模型,相较于此前的视觉语言模型,除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。Qwen-VL以Qwen-7B为基座语言模型,在模型架构上引入视觉编码器,使得模型支持视觉信号输入,该模型支持的图像输入分辨率为448,此前开源的视觉语言模型通常仅支持224分辨率。官方表示,该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景,在主流的多模态任务评测和多模态聊天能力评测中,取得了远超同等规模通用模型的表现。在Qwen-VL的基础上,通义千问团队使用对齐机制,打造了基于语言模型的视觉AI助手Qwen-VL-Chat,可让开发者快速搭建具备多模态能力的对话应用。通义千问团队同时表示,为了测试模型的多模态对话能力,他们构建了一套基于GPT-4打分机制的测试集“试金石”,对Qwen-VL-Chat及其他模型进行对比测试,Qwen-VL-Chat在中英文的对齐评测中均取得了开源视觉语言模型最好结果。
关键词:
下一篇:最后一页
- 广州科技活动周进入预热 明日正式启动300多场主题活动接踵而来
- 深化重点领域信用建设 广州正式出台新型监管机制实施方案
- 女童不慎掉入20米深井 18岁小姨三次下井成功营救
- 西安3个区域12月28日起每日开展全员核酸 官方提倡民众居家健身
- 浙江乐清一核酸检测结果异常人员 复采复检为阴性
- 浙江本轮疫情报告确诊病例490例 提倡“双节”非必要不出省
- 西安警方通报6起涉疫违法案件
- 西安新一轮核酸筛查日检测能力达160万管
- 西安市累计报告本土确诊病例811例
- 重庆曝光4起违反中央八项规定精神典型问题 警示党员干部清新过节
-
物流企业主动举报 广州白云嘉禾成功截获假冒奢侈品480件
8月25日,一快递企业主动向广州市白云区嘉禾街道打假办举报在清点仓库
-
陕西省紫阳县发布暴雨蓝色预警
紫阳县气象台2023年08月26日03时45分发布暴雨蓝色预警信号:预计我县瓦
-
游记五百字优秀作文(五百字优秀作文)
1、我的小伙伴我有一个特别好的同学,也是我的好伙伴,我们一起玩、一
-
梦见打老鼠是什么征兆
梦见打老鼠通常被视为一种预示。这个梦境可能象征着你对一些麻烦或者烦
-
瑞典足协官方:将在秋天或明年春天为伊布举行告别仪式,向他致敬
直播吧8月25日讯瑞典足协官方宣布,将择日为伊布举行告别仪式,向他取
-
智利二季度出口创2019年末以来最大跌幅
根据智利央行数据,智第二季度出口额较去年同期下降6%,创2019年末以来
-
23浙商证券CP007票面利率为2.0800%
23浙商证券CP007票面利率为2 0800%
-
叉车证怎么考要多少钱一个(叉车证怎么考)
首先,学开叉车,必须经过正规培训机构的培训。培训机构应当向市安监局
-
这次执行,法院请来了砌墙师傅……
被执行人欠债不还,却把自己名下相邻的两套住房打通后改造成200平方米
-
吃安眠药不如多吃“这菜”,连吃一周,夜尿止了,一觉睡到自然醒
失眠是一种常见的睡眠障碍,以前在中老年人当中比较常见,但随着社会的
X 关闭
阿里云推大规模视觉语言模型开源,支持中英文多种语言
广州出租车资格证需要体检什么项目_广州出租车资格证
杭州全力打造首届碳中和亚运会
视频|智己汽车:全球首秀成都车展,智己LS6盲订订单8小时突破6000台
10月,好运说来就来,难逃富贵,过上神仙般生活的星座
X 关闭
得知西安疫情防控“升级” 男子夜骑共享单车回咸阳淳化
中国医生将任SIU主席背后:从追随者同行者到引领者
海南省通报政法队伍教育整顿成果
云南两地发现核酸阳性人员 西安实行最严格的社会面管控
广东梅州大埔中央红色交通线沿线发现多株百岁古树