CogAgent

  • 类型:其他软件
  • 平台:安卓
  • 语言:中文
  • 大小:1 M
  • 版本:1.0
  • 更新:2024-01-16
×
下载预约

确定

应用介绍

CogAgent大模型下载,近日清华大学合作推出了一款看图答题小能手:CogAgent,据悉,可以告知《原神》游戏操作步骤等内容,功能十分强大,喜欢的用户们欢迎前来体验呢。

CogAgent大模型介绍

清华 KEG 实验室近日和智谱 AI 合作,联合推出了新一代图像理解大模型 CogAgent。

该模型基于此前推出的 CogVLM,通过视觉 GUI Agent,使用视觉模态(而非文本)对 GUI 界面进行更全面直接的感知,从而作出规划和决策。

CogAgent大模型功能

CogAgent 可以接受 1120×1120 的高分辨率图像输入,具备视觉问答、视觉定位(Grounding)、GUI Agent 等多种能力,在 9 个经典的图像理解榜单上(含 VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE 等)取得了通用能力第一的成绩。

例如,用户输入一张关于 CogVLM 项目的 GitHub 的图片,然后询问如何给这个项目点“Star”,然后 CogAgent 就会反馈出结果。

例如用户输入一张原神游戏的截图,可以询问“当前任务中的队友是谁?”,CogAgent 会给出相关的回答。

新海马下载(www.xinhaima.com).浙ICP备17029770号-3

投诉和举报请发邮件到xinhaima2021#126.com(请将#换成@),我们会尽快处理