目前,以先进的人工智能技术——AI数字人为核心的企业智能化应用正在蓬展,它们是降低成本、提高效率的得力助手。依据iiMedia Research所发布的《2024年虚拟数字人产业发展概览》,超过五成的被调查企业已采纳了虚拟人技术,同时有超过三成被调查的企业表达了将来要运用此项技术的意愿。这种背景下,有关如何有效执行数字人直播的讨论成为热门话题。
本期内容,我们将以头部数字人源码厂商灰豚所搭建的数字人直播系统为例,深入剖析数字人直播的详尽流程。
在数字人直播的舞台上,作为核心角色的数字人主播其逼真程度在视觉体验上起到了决定性作用。负责搭建数字人直播平台的厂商会综合运用多种尖端技术来确保数字人主播在外观上的真实感。
以灰豚为例,其采用了一系列核心技术如三维重建、TTSA+音视频驱动、ARKit表情识别和AIGC等,并基于海量的公共模型和全球语言支持的AI语音库,还提供了照片克隆、AI数字人克隆、AI声音人克隆以及灰豚MotionAI大模型等多种克隆模式。
通过这些先进技术,灰豚所构建的数字人直播系统中的数字人主播不仅在外观、表情、情绪和肢体动作等细节上实现了与真人的高度还原,同时还能根据用户选择的克隆模式呈现出多样化的形态和直播状态。
值得一提的是,其独特的“1+N”数字人训练模式更为数字人主播增添了丰富的成长与行业属性。结合与真人无异的外观、静态播报以及自由行动等多元化的直播状态,这一模式有效避免了因技术差异而产生的割裂感。
当数字人主播的克隆工作完成后,便进入了数字人直播间的设计与搭建环节。从灰豚的数字人直播系统来看,用户除了可以选择平台自带的模板外,还能利用AI绘画功能或通过平台的定制化服务来创建自己想要的直播场景。
在数字人直播的架构中,如果说外部的数字人主播和直播间是表面的装饰,那么直播内容则是内部的骨架。如果内容质量不佳,即使外在再华丽也会让整场直播陷入形式大于内容的境地。
为此,灰豚在其平台上提供了AI文案、AI直播语音互动等多种运营工具,并支持客户通过定制化服务添加新功能。平台还提供领先的AI智能运营和公域平台引流方案、一对一的专业帮扶及陪跑服务,以确保直播内容的丰富性及整个平台的稳定运行。
完成数字人主播克隆、直播间搭建以及内容生成三大步骤后,用户便可启动全天候的数字人直播服务。直播结束后,通过平台的数据分析功能对效果进行评估并调整策略。