百度吴甜:大模型能力的拓展探索出了更富想象力的创新应用
新京报贝壳财经讯(记者罗亦丹)5月20日,百度AI Day活动在北京举办,百度集团副总裁吴甜对文心大模型最新版本的技术创新进行了系统性讲解。她表示,文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码等技术,大幅提升了跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。
吴甜表示,大模型的能力进一步拓展、效率进一步提升之后,可以探索更前瞻、更有想象力的创新应用。
她以需要综合运用多模态AI技术的超拟真数字人场景举例称,百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播,直播转化率达31%,降低80%直播开播成本。
此外,中国信通院在活动现场发布大模型推理能力评估结果。结果显示,百度文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。
编辑 陈莉 校对 柳宝庆