(相关资料图)
阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
标签:
责任编辑:techtoutiao
央行今日开展2210亿元7天期逆回购操作08月25日 10:47
中国第二大高端口腔诊所马泷齿科赴港IPO08月25日 10:43
阿里平头哥半导体在深圳成立新公司08月25日 10:42
Wand.app获得420万美元战略投资08月25日 10:45
好未来在天津成立教育科技公司08月25日 10:51