上海证券：互联网传媒行业周观点：国内首款AI音乐生成大模型启动内测，谷歌发布Gemini1.5Pro

发布者：wx****b8

2024-04-18

346 KB 3 页

游戏上海证券

文件列表：

上海证券：互联网传媒行业周观点：国内首款AI音乐生成大模型启动内测，谷歌发布Gemini1.5Pro.pdf

下载文档

资源简介

主要观点 4月2日，昆仑万维打造的国内首款AI音乐生成大模型“天工SkyMusic”开启邀请测试，该模型拥有流畅的编配、好听的旋律，逼真且充满情感的人声。除歌曲整体的音乐品质之外，“天工SkyMusic”拥有清晰逼真的人声，模型的AI人声合成能够产生中文水平极高、发音清晰的歌声，展现出卓越的音频质量和逼真的演唱效果，在中文发音上优于国外大模型。与市面上Suno等AI音乐工具相比，AI音乐生成大模型“天工SkyMusic”采用的是基于MoE架构的4000亿级参数多模态超级大模型“天工3.0”，在逻辑推理、语义理解和泛化能力的加持下，“天工SkyMusic”的响应速度和训练推理效率较高。 4月10日，谷歌在官网正式发布了Gemini1.5Pro，现在可在180多个国家/地区使用。Gemini1.5Pro除了能生成创意文本、代码之外，能根据用户输入的文本提示，理解、总结上传的视频、音频内容进行深度总结，并且支持100万tokens上下文，目前可以在GoogleAIStudio开发平台中免费试用。谷歌对API进行三个优化：1）系统指令方面，可以在GoogleAIStudio和GeminiAPI

加载中...

已阅读到文档的结尾了

下载文档