近日,于重庆举办的“中国元宇宙发展高峰论坛”上,商汤智能产业研究院院长田丰受邀参会并发表主题演讲,分享了AI数字人的前沿方向以及商汤赋能实体产业的创新应用成果。
会上,商汤科技联合增强现实核心技术产业联盟(CARA)共同发布了《企业级AI数字人:数字经济发展“新动能”》白皮书,首次将数字人的发展划分为L1~L5五个等级,并阐述了商汤对AI数字人技术趋势的核心洞察。
田丰指出,AI时代,数字人正在从有颜无智的“CG数字模特”,进化为可提高生产力、驱动创新服务的“拟人服务式AI”,融入数字中国的千行百业,成为“十四五”数字经济的新交互媒介、新商业智能服务、新政务便民窗口。通过数字技术实现对现实世界的改造,AI数字人将促进数字经济与实体经济的融合和发展,成为实体产业生产力的代表。
L4级数字人将推动生产力变革
曾经,游戏、电影中创作的逼真CG人物是科幻遐想的代表。如今,这样的人物已经可以在现实世界中与我们面对面互动,变身各式各样的服务助手。
从完全手工创作到完全智能化交互,在白皮书中,商汤从生产自动化和拟人化两个维度,将数字人的进化历程划分为五个阶段:
L1级:主要以人工制作为主;
L2级:依靠动捕设备采集表情、肢体等动作,例如电影动画制作;
L3级:可依靠算法驱动口型、表情和动作,例如虚拟化身实时互动;
L4级:实现部分智能化交互,在垂直领域创新服务模式;
L5级:实现完全智能化交互,打造真正的个性化虚拟助手。
达到L4级别,意味着数字人不仅实现了AI仿真动画生成能力与自然语言理解能力的结合,通过学习大量的真人会话、语气、表情和动作,可根据表达内容生成相应神态和全身动作,输出栩栩如生的拟人效果,同时,结合AI算法在制作流程中的深度融合(AIGC),制作效率也得到了大幅提升。只有达到L4或更高级别,AI数字人才能真正的走入千行百业,推动生产力的变革。
在深度学习技术的加持下,更高级别的AI数字人将逐步兼具人类认知能力和机器认知能力,既可以在短时间内学习不同领域的人类知识,成为相关领域的专家,同时又可以在海量数据中提取更多规律,超越人类的现有认知,突破生产力的边界。
实现AI数字人“量产”,提效千行百业
作为AI数字人技术的领导者,商汤以原创的多模态交互、深度学习和全栈式的AIGC(AI Generated Content)技术,构建了智能化生成、智能化驱动和智能化交互三大引擎,打造出“一站式”AI数字人生产流水线。在实现媲美真人的逼真程度上,让AI数字人“更聪明、更专业”,并实现“听得懂,看得见,说得出”的人机交互效果。
得益于自动化的流水线,商汤已根据行业需求,快速、灵活地创建了不同角色的AI数字人,在文旅、展馆、金融、教育、商超等实体产业中规模化应用,为用户提供多样化的服务和体验。
比如,在上海中共一大纪念馆中,商汤AI数字人担任讲解员,为参会者讲解党史;在广州永旺商城,商汤AI数字人则是导购员,为顾客提供智能的问询服务;在宁波银行上海分行,担任大堂经理,提供各类业务咨询和问题回复。在2020年世界人工智能大会上,商汤AI数字人还担任大会导览员,向参会嘉宾讲解AI在不同领域的落地应用和成果。
而在医院场景,AI数字人可以为患者进行分诊导诊,在减轻导诊台压力的同时为患者带来有温度的关怀。在智能汽车的车舱中,AI数字人还可化身虚拟行车伴侣,为用户定制专属形象,并通过媲美真人的动作和语言与用户互动,为人车交互融入更多情感元素。
随着技术发展迈向更高阶的智能等级,AI数字人也将不仅限于我们所看到的人物形象,它成为可以通过不断机器学习,成为突破想象力的AI智能体。
例如在游戏中,AI驱动的NPC可以与人类玩家协同作战;在社群中,AI可以成为担任社群管理员,提升运营效率和管理水平。
在不远的未来,无论是在现实世界还是影视、游戏作品中,AI数字人、AI智能体都将无处不在,为我们增添娱乐体验、带来便捷服务、实现效率提升,深刻改变我们的生活和工作方式。