“双十一”人工智能的第11年定义了新的在线购物方法

2019-11-12 10:30 来源:科技日报

“双十一”到了第11年,现场直播正如火如荼地进行着。主播李佳琪的“所有女孩”这句话已经成为直播时代的宣言,无数人掏空了口袋。在今年的“双十一”期间,淘宝直播已经成为企业的标准。服装、美容化妆品、食品和其他行业的企业已经开始使用直播工具。有些人甚至开玩笑说,对于还没有直播的商店来说,这就好像没有详细的页面。

为了拥有更好的观看体验,淘宝自主开发了新的音视频实时通信架构,实现大规模低延时直播,将延时从5秒减少到7秒,减少到不到2秒,提高了用户和主持人的互动效率。此外,人工智能技术还可以实时识别主持人解释的商品,并将其显示在直播页面上。

是的,在时代的风吹来的地方,技术首先到达。直播和短片很流行。在这个新的“双十一”游戏的背后,还有一个不断改进的人工智能。

人工智能助手和主持人分享了他的担忧

成千上万的手剁派对进进出出,主持人每分钟都被这种情况淹没。这时,他的艾秘书出现了。帮助主人并提供诸如主人问答、商品问答、优惠券问答等服务是轻而易举的事情。换句话说,你在工作室里问的大多数问题都是由人工智能助手回答的。

据阿里巴巴达摩研究所高级主任、阿里巴巴集团智能服务部总经理赵坤介绍,人工智能秘书使用自然语言理解和基于知识地图的问答技术,能够准确分析直播中商品和主持人观众的复杂表情和问题,实现直播中多对一沟通的高效快速响应,大大提高直播中客户问题的回应率和解决率。

除了基于文本,人工智能客服还可以基于图片进行智能问答。赵坤表示,人工智能客服使用图像分析算法来理解图像的内容,结合用户的提问,自动理解并识别能够回答用户的图片作为答案,并突出显示图片中精确的回答位置。目前,智能图像问答已经覆盖了家电数字化、休闲果蔬、母婴清洗与保护等多个行业。

直升机派对很方便,卖家也能从人工智能中获益。在“双十一”期间,卖家需要制作大量的宣传地图、海报地图等。在短时间内,使用图像智能生成技术。基于智能图像生成技术,人工智能设计人员可以改变传统的设计模式,在短时间内完成大量横幅广告、海报地图和场馆地图的设计。卖家只需输入他想要达到的风格和尺寸,系统就可以代替人工完成材料分析、铺垫、配色等耗时费力的设计项目,并实时生成多套满足要求的设计解决方案。

据阿里巴巴达摩研究所高级算法专家谢宣松称,该系统已经达到高级设计师的标准。它可以提供数十种方案,每秒钟设计8000张不同的海报。在去年的“双十一”期间,人工智能设计师为20万个企业和商家设计了近600万张图片。消费者在天猫网站上看到的几乎所有可移动商品的海报和图片都来自于此。

除了图片,短片也是标准的。谢宣松介绍,短视频智能设计产品是基于图像智能识别技术和视频智能生成技术,帮助用户在很短的时间内完成大量商品营销短视频的设计和制作。“用户只需输入商品详细页面的链接或从本地上传图片和视频资料,就可以进行一系列复杂的设计工作,如图片资料分析和过滤、商品理解和定位、视频资料裁剪准备、视频脚本导演、视频渲染生成等。并可以根据用户的风格和大小等简单的个性化要求进行输入,为ge提供流媒体内容的解决方案

今年,对话机器人学会了阿拉伯语、法语和繁体中文,并推出了马来语-英语、泰语-英语等混合语言问答功能赵昆说,“混合语言问答在马来西亚和其他地方非常普遍。在当地的客户服务领域,大部分用户用英语咨询,少数用户用马来语咨询,英语和马来语经常混杂在一起。对话机器人不仅需要同时理解两种语言,还需要理解复杂语言的混合使用并给出相应的答案。”

但是,它不使用机器翻译技术,而是跨语言学习,一种自然语言处理技术。“小型语言缺乏大规模的训练语料库,很难通过过去的机器学习技术获得。跨语言学习可以克服资源匮乏的瓶颈。”赵昆解释说,跨语言学习是一种多语言自然语言处理技术。它帮助算法模型通过语言与语言之间的知识转移,利用足够的语料库资源(如中文和英文)提高理解小型语言的能力,从而快速扩展机器人的多语言支持功能。在跨语言学习技术的帮助下,对话机器人可以掌握更多的语言,甚至像土耳其语和乌尔都语这样的小语言。

”一般来说,语言是一种符号,不同的语言是不同的符号系统。虚拟语言中所指的每件事物/知识都对应于一个特定的身份,该身份由不同语言中的不同符号来表示,或者不同语言中使用的符号被映射到相同的语义空间。跨语言学习的作用是帮助机器理解语言所指的身份标记,并借助资源丰富的语言学习缺乏资源的语言。”赵坤进一步解释道。

他说,基于语言间的交叉映射关系,对于机器来说,在缺乏资源的情况下通过混合多种语言来学习语言间的共性可能比学习一种语言要好。2017年,对话机器人首次登陆海外。花了六个月的时间学习印度尼西亚语,花了六个月的时间找到了一个类似中国机器人在智能客服位置的解决方案。现在,多语言机器人学习一种新语言的时间已经缩短到两周。

声波纹识别开启了语音购物的第一年

Double Eleven。语音购物然而,在她向我们走来之前,我们打了一千次电话,催促她:消费者可以直接下订单,只要他们告诉天猫精灵他们想买什么。如果启用了“声波纹支付”功能,也可以进行直接语音支付。

“语音购物的第一年”听起来很高科技。据报道,数百万人体验过语音购物,其中一半以上是第一次尝试。声纹识别技术采用基于深度网络的注意力嵌入模型,通过网络结构的参数设计模拟基于人耳感知的频谱特征,能够在一定程度上消除同一个人在不同场景发音下的频谱特征差异干扰,显著提高远场交互下的声纹识别性能。

如果你说话,你可以付钱。你如何确保安全?阿里巴巴人工智能实验室语音技术首席科学家聂在清表示,作为首个达到语音识别技术商业水平的智能扬声器,天猫精灵的语音识别率已经达到99%,这是其支持语音支付功能的基础。在支付级应用下,用户可以通过三个不到10秒的交互语音准确描述用户健壮的语音特征,识别准确率达到99%以上。

不仅如此,利用中文识别的自然语言理解算法,语音设备可以准确定位消费者需要购买的商品,并基于平台大数据和依靠声纹推荐能力为消费者做出个性化推荐。“在语音购物场景中,天猫向导(Tmall Wizard)可以基于注意力记忆网络独立学习各个行业的导购体验,并结合用户的特点呈现最佳导购流程,从而成为最了解用户和行业的智能导购员。”聂在清说。

此外,今年11日,消费者还可以体验ar彩妆试用产品。AR化妆试验获得数字信息,如颜色编号和材料