阿里AI实验室发布AliGinie2.0系统,引入机器视觉,增强多模态交互体验

3月22日,阿里巴巴人工智能实验室在北京召开2018年春季发布会。与媒体猜测的不同,这一次发布的核心产品并不是一款新的硬件产品,而是将天猫精灵内置的人机交互系统AliGenie升级到了2.0。

根据阿里巴巴人工智能实验室负责人浅雪介绍,AliGenie2.0在语音交互的基础上引入了视觉能力,能够进行视觉认知、多模态交互、情景感知等,智能音箱融合语音、图像、触摸等多模态交互能力正在成为新的标配。

其中,AliGenie 2.0的视觉认知能力包括图像识别、人脸识别、物体检测;AliGenie 2.0的多模态交互能力可以通过对语音、图像、触摸等多种交互形态的融合,模拟人与人之间的交流方式。

AliGenie2.0的情景感知能力,则基于你所在的上下文、对话场景自主学习,深刻理解情景需求。这一升级将重新定义机器和人的交互方式,让机器和人的交流更像是人与人之间的交流。

浅雪介绍道,人与人之间的交流,尤其是面对面的交流,综合了语音、图像、触觉等多种方式,是一种多模态融合的交互。基于这些自然能力的交互,这是人机交互未来的趋势和方向。

打通视觉、语音能让天猫精灵能更全面、智能的感知外面的世界,进而更好地理解用户需求,并且付诸于行动。

除了多模态交互体验,官方表示AliGenie2.0的一大亮点是情景感知能力,基于用户所在的上下文、对话场景自主学习,理解情景需求,作为背后技术支撑的自然语言理解平台。

据悉,近年来在知识体系和算法升级上均有突破,目前有1亿实体,10亿关系、5个以上垂直搜索引擎,覆盖人物\娱乐\自然\社会\健康等,构建了20个大类知识图谱,采用全新的序列标注模型提高对语言的容错性和自动学习能力。

对于AliGenie 2.0将应用于哪些场景当中,浅雪表示视觉认知主要面向儿童,提供识别绘画册、识字卡讲故事等识别功能,可以识别国内很多儿童出版社初版的流行儿童读物。

视觉识别系统也推出了面向老人的药盒识别功能,能识别市面4万种常见药,并通过扫码报出药品的过期时间。

接下来,AliGenie 2.0版本将主要在儿童教育、游戏、动画、养老、IoT等领域进行重点扩展。我们还将在家庭、新零售等领域展开2.0版本的相关合作和生态扩展。

此外,AliGenie目前的合作伙伴覆盖航空、养老、儿童教育、酒店、汽车、家电、影音等领域,近100个品牌。

在AliGenie 2.0阶段,迎来了在家电行业与LG、博世的合作。同时,在汽车行业,也开始了与沃尔沃、宝马、奔驰的合作探讨。

发表评论

电子邮件地址不会被公开。 必填项已用*标注