百度打造国内首个可交互超写实明星数字人,背后技术有多高深?

发布时间:2025-05-13 18:00

日前,百度APP正式上线了以明星龚俊为原型的数字人语音搜索助理。据介绍,这是国内首个可以在在APP端实现用户互动的超写实数字人。用户进入该功能界面后,可以与“龚俊”实时交互,如询问天气等问题,“龚俊”将快速识别、搜索,并语音播报首条搜索结果。此外,用户也可以命令“龚俊”完成APP内的部分控制功能,如打开夜间模式、进入书架页面等。


据媒体报道称,该数字人在模型上,百度使用4D扫描技术捕捉龚俊真人的说话以及日常表情的面部细微变化,以实现对其本人的超写实还原。而在语音识别上,百度赋予了其超高准确率的语音识别技术,准确率达到98%,并且对于中英文混杂、生僻字、方言等各种语音也能准确识别。另外,在语音合成上,该数字人依托于TTS(Text To Speech)技术,可以无限接近于原声。

从专利角度看,根据智慧芽数据显示,百度及其关联公司在全球126个国家/地区中,共有1700余件与“语音识别”相关的专利申请。其中,有效专利840余件,授权发明专利730余件。通过对上述全部专利进行分析可知,百度在语音识别技术领域的专利布局,主要聚焦于

语音交互、语音信息、人工智能、语音信号、语音合成、语音控制等相关的技术领域。

目前,虚拟偶像市场火热,众多企业、机构纷纷发布自己的虚拟偶像,如DOTA2官方虚拟偶像dodo,清华大学虚拟学生华智冰,湖南卫视虚拟主持人小漾,还有此前就已经在二次元圈内大火的初音未来、洛天依等。

量子位发布的《虚拟数字人深度产业报告》显示,虚拟数字人的应用可分为服务型虚拟人和身份型虚拟人。替代真人服务中的虚拟主播和虚拟IP中的虚拟偶像是目前的市场热点。报告预计,在2030年,我国虚拟数字人整体市场规模将达到2700亿。身份型虚拟数字人约1750亿。服务型虚拟数字人总规模超过950亿。目前市场仍处于前期培育阶段。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

预期中的A股港股双双暴涨并没有出现,为什么?

预期中的A股港股双双暴涨并没有出现,为什么?

童童读财

2025-05-13 14:45:08

关键时刻,李嘉诚跳出来了!

关键时刻,李嘉诚跳出来了!

财经要参

2025-05-13 09:05:11

刚刚,来伊份再次回应“带血创可贴”事

刚刚,来伊份再次回应“带血创可贴”事

鲁中晨报

2025-05-13 14:36:16

网友们发现刘明侦一家三代都在电子科大任职

网友们发现刘明侦一家三代都在电子科大任职

清晖有墨

2025-05-13 11:04:52

摩根大通:上调中国2025年GDP增速预测

摩根大通:上调中国2025年GDP增速预测

财联社

2025-05-13 16:18:23

网址:百度打造国内首个可交互超写实明星数字人,背后技术有多高深? http://www.mxgxt.com/news/view/1170365

相关内容

龚俊数字人上线后:用两年让每个人实现数字人自由,百度要把数字人做成一门生意
独家揭秘龚俊、邓丽君等明星数字人背后的“黑科技”
AI技术正在深度赋能数字娱乐产业
互联网大厂纷纷“造人”背后:虚拟数字人的现状与挑战
专利破万 “技术创维”打造新高度
详解百度智能云数字明星运营平台:AI如何赋能虚拟IP
AI大伽百人谈|AI与艺术的交互:探索技术与创造力的融合
数字人智慧交互大屏新升级!魔珐与洲明打造沉浸式交互体验
借助AI数字人克隆,打造价值百万个人IP
元宇宙“明星天团”在线扩容,咪咕超写实数智达人入列

随便看看