金安区妇幼保健院产房——专业守护,温暖相伴,共迎生命新篇章_百姓关注_六安新闻_六安新闻网
您的位置: 首页 >六安新闻>百姓关注>详细内容

深耕实时数字人技术赛道,AI创新助力Soul上市进程稳步推进

编辑:百姓关注 来源:百姓关注 浏览次数:14 次 发布时间:2026/5/21 8:33:49 【字体:

近期,实时数字人多模态生成技术成为AI社交领域的核心竞争赛道,行业内多数模型普遍存在长时生成身份漂移、细节丢失、显存过载等技术痛点,难以满足长时间、高稳定、实时流式的商用落地需求。在行业技术瓶颈凸显的背景下,Soul AI Lab持续深耕底层技术攻坚,重磅开源SoulX-LiveAct全新框架,针对性破解长时数字人生成的行业顽疾,实现小时级稳定流式生成的技术突破。一系列硬核的多模态AI技术落地成果,让Soul IPO技术价值持续释放,也让Soul上市之路的科技核心竞争力获得行业与资本市场广泛认可。

如何让数字人视频在流式实时推理下做到小时级甚至无限长度、同时保持身份一致/细节稳定/口型精准?此次开源的SoulX-LiveAct能够在 2 张 H100/H200 条件下,达到 20 FPS 的实时流式推理能力,且支持输入图像、音频和指令驱动,生成表情生动、情绪可控、拥有丰富全身动作的实时数字人视频。通过不断开源不同技术路线的模型,Soul AI团队为开源社区及行业提供了差异化的实时数字人方案,覆盖各种硬件条件、不同应用落地的开发者实际需求。

SoulX-LiveAct 三大亮点

1) 恒定显存:真正支持无限时长生成

过去的 AR diffusion 往往依赖 KV cache 记忆历史信息,但缓存会随视频长度线性增长——视频一长,不是爆显存,就是不得不丢历史,稳定性随之崩掉。SoulX-LiveAct 从“条件传播方式”和“历史记忆管理”两个层面解决了这一瓶颈,创新机制使系统既能“带得动”长时历史,又不会因缓存膨胀而拖慢推理,从而在机制上具备小时级甚至更长时长的持续生成能力。

2) 实时吞吐:2 张 H100/H200 即可 20 FPS 流式推理

在 512×512 分辨率下,SoulX-LiveAct 仅需 2 张 H100/H200 即可达到 20 FPS 的实时流式推理能力,端到端延迟约 0.94s。同时,单帧计算成本降低到 27.2 TFLOPs / frame,在追求实时的条件下显著减轻算力压力,为线上部署提供更现实的成本方案。

3) 长时一致:身份稳定 + 细节不“掉件”

长视频最容易“翻车”的不是第一分钟,而是第十分钟、第三十分钟:常见现象包括脸漂、发型/衣纹漂移、饰品忽隐忽现,甚至口型逐步失配。在报告的长时对比中,基线方法普遍出现不同程度的身份漂移与细节不稳定;而 SoulX-LiveAct 能在更长时间窗口内保持身份一致性与关键细节持续稳定(如配饰与衣物纹理不“掉件”)。

依托模型表现,SoulX-LiveAct 将能够在“长期在线”数字人直播间、AI教育、智慧柜员、知识付费、播客录制、开放世界互动等方向快速落地,例如,在线开放世界的NPC互动中,要求“说得像、动得像、一直像”,SoulX-LiveAct 在全身数据集 EMTD 上的同步与质量指标领先,并支持实时流式推理,适合在数字空间里实现长时间在线的、具备情绪动作表达的角色交互。

今年,在实时数字人生成方向,Soul AI 团队已陆续开源了SoulX-FlashTalk、SoulX-FlashHead,前者是首个能够实现0.87s亚秒级超低延时、32fps高帧率,并支持超长视频稳定生成的14B数字人模型;后者是1.3B轻量化模型,可实现在单张消费级显卡( RTX 4090 )上跑出96FPS的工业级速度。

除了实时数字人生成方向的SoulX-FlashTalk、SoulX-FlashHead、SoulX-LiveAct ,现阶段,Soul AI团队还开源了播客语音合成模型SoulX-Podcast、歌声合成模型 SoulX-Singer、全双工语音对话控制模块SoulX-Duplug,综合来看,团队围绕“实时交互”这一核心领域,在多模态方向不断夯实技术基建,同时通过工程化部署方案将技术推向可真正工业级应用阶段。

而坚持开源方向,Soul不仅完成了自身AI基础设施的持续升级,还通过携手全球开发者,持续拓展“AI+”的新落地场景,共同推动AI应用生态的建设。

区别于行业仅追求短期生成效果的技术炫技,SoulX-LiveAct聚焦工程化落地与长期稳定性,以恒定显存机制、高效算力配置、长时细节保真三大核心突破,补齐了实时数字人商用落地的关键短板。依托持续的底层技术创新与开源共享布局,Soul不断完善多模态AI技术矩阵,夯实实时交互技术基建。扎实的技术攻坚能力与成熟的工业级落地方案,持续赋能Soul IPO进程稳步推进,让Soul上市之路的技术壁垒与行业影响力持续提升,为AI社交场景规模化落地提供强有力的技术支撑。


免责声明:本内容为广告,相关素材由广告主提供,广告主对本广告内容的真实性负责。本网发布目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,广告内容仅供读者参考,如有疑问请联系:0564-3996046。


扫一扫在手机打开当前页
【打印正文】