【财新网】
字节跳动正加速视觉、语音等多模态模型的商业化。12月18日上午,字节跳动旗下火山引擎在上海发布豆包视觉理解模型,通过火山引擎开放给企业客户,并再次打出了低于行业的定价。在现场演示中,豆包视觉理解模型识别出了杂志插图中的外太空星云、一段“贪吃蛇”游戏代码并给出修正意见、桌面上的物件和使用方法、体检报告中的单项指标解读、联想图画想表达的谚语、推荐穿搭以及根据实物发送抖音商城里的商品链接等。目前豆包视觉理解模型已经接入豆包App和PC端产品。
【财新网】
字节跳动正加速视觉、语音等多模态模型的商业化。12月18日上午,字节跳动旗下火山引擎在上海发布豆包视觉理解模型,通过火山引擎开放给企业客户,并再次打出了低于行业的定价。在现场演示中,豆包视觉理解模型识别出了杂志插图中的外太空星云、一段“贪吃蛇”游戏代码并给出修正意见、桌面上的物件和使用方法、体检报告中的单项指标解读、联想图画想表达的谚语、推荐穿搭以及根据实物发送抖音商城里的商品链接等。目前豆包视觉理解模型已经接入豆包App和PC端产品。
责任编辑:覃敏 | 版面编辑:肖子何
GPT革命|美国数据公司Databricks拟筹资100亿美元 投后估值620亿美元
2024年12月19日GPT革命|字节跳动发布豆包视觉理解模型 定价比行业低85%
2024年12月18日GPT革命|智谱AI完成新一轮30亿元融资 新战投和国资加入
2024年12月17日财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。
免费订阅财新网主编精选版电邮