阿里巴巴AI旗舰应用产品夸克近日升级其AI超级框功能,发布「AI相机」,让用户可以「拍照问夸克」。 基于视觉理解与思考推理的强大模型能力,夸克AI超级框可以从视觉出发,进一步理解和回答物理世界中的各类问题。 夸克AI超级框持续快速迭代,提升超级智能体的多模态能力,打造用户生活、工作、学习的AI超级入口。
在工作、学习、生活各类场景中,面对复杂物体、表格和图形时,用户往往难以准确描述真实需求。 夸克「AI相机」能深入理解用户意图,更好地实现视觉搜索、多轮问答、图像处理与创作。
夸克搜索负责人张帆表示:「我们希望通过提升AI超级框的多模态能力,打造用户与现实物理世界之间的全新交互方式和产品体验。 AI时代,夸克将继续围绕信息的获取、消费、编辑、传输、管理、决策和创作,由AI超级框承载更多的需求、更好的交互、更大的能力。」
基于AI超级框背后的视觉理解和推理模型能力,「拍照问夸克」能在手机和计算机上进行图片搜索、问答、思考、编辑以及创作。 全新的多模态产品入口和交互体验,让「AI相机」成为 AI 时代用户表达问题和获取信息的重要方式。
「拍照问夸克」能精准识别图片中的人物、物体和诸多细节,深入理解用户需求并联想相关问题。 比如,拍照搜索文物时自动关联历史背景,上传商品图片时可以跳转同款商品链接。 夸克可以迅速识别人物、动物、植物、建筑、风景、美食、艺术品、商品、多语言资料和故障代码等,经过多轮问答和深度思考,满足用户需求。
深入理解意图,完成复杂任务
过去,用户需要切换多个AI工具才能完成围绕图片的复杂任务。 现在,夸克进一步提升智能体在视觉搜索的产品体验和使用场景,满足用户对现实物理世界的解读、处理和创作。
「拍照问夸克」将搜索、扫描、修图、翻译、创作等能力聚合为统一入口。 针对较为复杂的图像,用户可一次上传10张图片进行深度推理并完成各类复杂任务。 目前,夸克具备近百个专业智能体,包括搜索、健康、学习、旅游、商品、创作等,持续通过模型能力升级来优化智能体组合策略,满足用户对图像信息的个性化需求。
旅行中,「拍照问夸克」化身「专业导游」,边逛边拍获取文物讲解、景点攻略; 工作中,它能辅助分析数据图表、优化代码逻辑,生成工作总结文档; 在健康领域,它可以对体检报告中的异常指标进行分析并提供康复方案建议; 娱乐场景中,它还可以提供趣味游戏建议。 此外,拍照问夸克还支持多种语言提问和翻译解读。
今年3月,夸克发布「AI超级框」,为中国市场逾2亿用户带来全新智能体验。 随着「拍照问夸克」上线,「AI超级框」在多模态交互上极大拓展了应用场景。 AI数据分析机构Xsignal 发布的内地AI产品排名显示,夸克在用户活跃率方面排名第一,次日留存率同样稳居榜首。