产经 > 科技

中科院自动化所发布通用AI平台可实现图文音＂无缝转换＂

新华社，北京

2021-07-12 14:22

已收藏

新华社北京7月12日电(记者董瑞丰)从检索图像、描述视频，到吟诗作赋、续写文章，再到识别语音、双语翻译，虚拟人"小初"日前亮相2021世界人工智能大会，展示了图、文、音三种模态的智能转换和生成。

"小初"具备这样的能力，得益于一个名为"紫东太初"的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发，基于国产化基础软硬件，仅采用一个大模型，即可"锻炼"人工智能在视觉、文本、语音多个场景的理解能力。

中科院自动化所所长徐波介绍，"大数据+大模型+多模态"将改变当前单一模型对应单一任务的人工智能研发范式，多模态大模型将成为不同领域的共性平台技术，是迈向通用人工智能的重要路径探索。

"`紫东太初`实现了图、文、音三种模态的统一表达，以图生音，以音生图，将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。"徐波说。

据了解，中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型，并通过跨模态语义关联，构建了三模态预训练大模型。

本网站的所有金融数据和信息乃为一般性质，仅作为一般资料来源，不构成任何投资决定的意见或建议。本网站的观点代表新华财金社发布时的意见，且可能更改。新华财金社将做出合理努力，保证其网站内容准确即时，但新华财金社对其准确性、适当性和完整性概不发表任何保证或声明，概不就因访问、使用或未能使用新华财金社网站或因其内容的任何错误或遗漏而产生的任何直接、偶然、必然、间接或惩罚性损失承担任何责任。

会员登录

中科院自动化所发布通用AI平台可实现图文音＂无缝转换＂

Copyright © 2015 - Xinhua Finance Agency Ltd. All rights reserved.
如果使用IE浏览器，请使用IE10或以上版本访问本网站。

会员登录

中科院自动化所发布通用AI平台 可实现图文音＂无缝转换＂

today=new Date() theYear = today.getYear() if(theYear >= 100 && theYear < 2000) theYear=theYear-100+2000 Copyright © 2015 - document.write(theYear); Xinhua Finance Agency Ltd. All rights reserved.如果使用IE浏览器，请使用IE10或以上版本访问本网站。

中科院自动化所发布通用AI平台可实现图文音＂无缝转换＂

Copyright © 2015 - Xinhua Finance Agency Ltd. All rights reserved.
如果使用IE浏览器，请使用IE10或以上版本访问本网站。