
产品简介
百度智能云曦灵是百度公司基于其文心大模型技术,倾力打造的一款行业领先的数字人生产与应用平台。此产品并非单一工具,而是一个集成了数字人形象生成、内容创作、实时互动和业务配置于一体的综合性解决方案。该平台旨在通过先进的AI技术,大幅降低企业和个人开发者使用数字人的门槛和成本,推动虚拟数字人在各行各业的普及与产业升级。曦灵平台提供了两种主要的服务模式:一个是面向普通用户的SaaS应用平台,用户可以通过网页直接进行数字人克隆、视频制作和直播开启等操作;另一个是面向开发者的开放平台,通过提供丰富的API和SDK组件,允许开发者将数字人的核心能力(如形象定制、视频合成、交互对话等)深度集成到自己的产品与服务中,实现高度定制化的应用。无论是需要一个7x24小时不间断的虚拟主播,还是一个能说会道的智能客服,曦灵都致力于提供高效、逼真且易于部署的数字人服务。
主要功能
-
多样化数字人生成与克隆:平台支持多种方式创建数字人形象。用户可以仅用一张照片和一段音频就快速生成一个可被AI驱动的2D数字人分身;或通过上传1-8分钟的真人视频,进行“极速克隆”(30分钟完成,口型由AI匹配)或“精品克隆”(4-6小时完成,高度还原真人口型),以满足不同场景对效率和逼真度的需求。此外,平台还支持通过文本描述一键生成超写实的3D数字人形象,极大丰富了形象选择。
-
AI驱动的视频内容创作:曦灵提供了强大的视频工作台,用户无需专业的视频剪辑技能即可高效生产内容。支持“主题生成视频”,输入主题即可自动生成脚本和分镜;支持“口播脚本生成”,输入文案即可匹配画面;还支持直接上传PPT,自动生成数字人讲解视频。内置的编辑器还提供AI帮写、智能配乐、自动字幕等功能,赋能短视频营销、知识付费、新闻播报等内容的批量化生产。
-
智能化数字人直播:平台为电商直播、本地生活等场景提供了“直播工作台”,可以实现分钟级搭建专业直播间。通过授权电商平台账号,可自动获取商品信息并生成带货脚本。直播过程中,数字人不仅能7x24小时不间断播报,还能通过AI实时改写话术、智能回复弹幕,甚至支持真人随时接管,通过麦克风驱动数字人口型进行实时互动,有效提升直播效率与转化率。
-
可交互的数字人对话服务:用户可以构建具备知识、技能和人格的交互式数字人。通过上传企业文档、问答库等资料,即可训练出专属的智能客服或虚拟助手。这些交互式数字人可以部署在网站、小程序、公众号或线下大屏等终端,为用户提供7x24小时的专业问答与服务,有效分担人工客服的压力。
-
高自由度的开放平台(API/SDK):曦灵为开发者提供了全面的API接口与SDK,支持公有云调用和私有化部署。开发者可以按需调用形象定制、声音克隆、视频合成、云端/终端渲染交互、直播推流等核心组件能力,将数字人无缝集成到自有的应用生态中,实现金融、媒体、互娱等领域的深度定制化解决方案。
使用方法
百度曦灵平台根据用户的不同需求,分为直接使用的应用平台和供开发者集成的开放平台,以下为应用平台(SaaS)的核心使用流程:
-
注册与登录
访问百度智能云曦灵官网,使用百度智能云账号完成注册和登录。首次登录通常可以领取免费的体验权益。 -
创建或选择数字人形象
进入平台后,首先需要一个数字人形象。您可以:- 从数字人广场选择:平台提供包含2D、3D在内的数百个公共数字人形象供用户直接使用。
- 克隆专属数字人:点击“创建数字人”,根据需求选择克隆类型。
- 照片克隆:上传一张正面照片,最快秒级生成2D数字人,适用于AI名片等场景。
- 2D视频克隆:根据拍摄指导录制一段1-8分钟的真人视频并上传,选择“极速克隆”或“精品克隆”进行训练。
- 3D形象生成:输入对外貌、服饰风格的文字描述,AI即可自动生成一个3D数字人形象。
-
使用工作台进行内容生产
拥有数字人形象后,进入相应的工作台开始创作:- 视频工作台:选择一种创作模式(如“口播脚本生成”),输入您的文案,选择刚创建的数字人、音色和背景模板,点击生成。在编辑器中可以对字幕、配乐、动作等进行微调,最后导出视频。
- 直播工作台:选择对应的直播平台(如抖音、快手)并完成账号授权。选择要讲解的商品,平台将自动生成直播脚本。调整直播间背景、主播形象和音色后,点击“开启直播”,获取推流地址,并使用官方直播伴侣软件将画面推送到您的直播间。
-
发布与管理
生成的视频或AI卡片会保存在“我的作品”中,可随时下载和分享。开启的直播可在直播工作台中进行监控和管理。所有创建的数字人、克隆的声音等资产,均可在“我的资产”中进行管理。
产品价格
1. 应用平台 (SaaS) 定价计划:
该模式主要以功能包和会员时长的方式付费,适合直接使用平台进行内容创作的用户。
- 视频会员包:
- 月度会员:¥699/月,包含120分钟视频时长。
- 年度会员:¥7,999/年,包含1500分钟视频时长。
- 直播会员包:
- 月度会员:¥4,999/月,包含31天直播权益。
- 年度会员:¥58,999/年,包含372天直播权益。
- 超级尊享套餐:
- 月度套餐:¥7,999/月,整合了直播、视频、AI卡片和2D精品克隆等多种权益。
- 年度套餐:¥75,999/年,提供更丰富的全年直播、视频时长和多次克隆权益。
- 产品补充包:
- 2D数字人精品克隆:¥3,000/次。
- 音色克隆:¥1,000/次。
- 文生3D数字人:¥4,999/次。
- 视频时长拓展:¥6/分钟。
2. 开放平台 (API/SDK) 定价计划:
- 定制服务:按次付费,例如照片数字人定制20元/次,2D小样本数字人定制(通用口型)1,000元/次。影视级的非凡人像定制价格更高。
- 视频组件:按“时长包”或“并发路数”计费。例如,2D小样本数字人视频生成时长包为300元/100分钟,购买专属并发路数则为2,000元/月。
- 交互/直播组件:主要按“并发路数”计费。例如,云渲染2D数字人交互,1路并发为2,400元/月;直播API则为2,000元/月/路。
应用场景
-
电商直播与带货:利用数字人进行7x24小时无人值守直播,自动讲解商品卖点、与观众弹幕互动,大幅降低人力成本,抓住所有流量高峰,尤其适合需要搭建直播矩阵的品牌商家。
-
短视频营销与IP打造:企业可快速、低成本地批量生成产品介绍、品牌宣传、活动预热等营销短视频,并能塑造统一、稳定的品牌虚拟IP形象,避免因真人主播变动带来的风险。
-
在线教育与企业内训:将PPT或课程讲义一键转化为数字人授课视频,制作标准化、高质量的在线课程。用于企业内部培训时,可确保持续、统一地向员工传递知识和技能。
-
金融与运营商服务:在银行、证券或电信营业厅,数字人可以作为智能客服,为客户提供业务咨询、产品介绍和办理指引等服务,提升服务效率和客户体验,实现智能化分流。
-
媒体资讯与新闻播报:将数字人应用于新闻播报场景,作为虚拟新闻主播,能够实现新闻稿件的快速生成和播报,保证新闻发布的时效性,并可轻松支持多语种播报。