文件列表:
上海证券:互联网传媒行业周观点:国内首款AI音乐生成大模型启动内测,谷歌发布Gemini1.5Pro.pdf |
下载文档 |
资源简介
>
主要观点
4月2日,昆仑万维打造的国内首款AI音乐生成大模型“天工SkyMusic”开启邀请测试,该模型拥有流畅的编配、好听的旋律,逼真且充满情感的人声。除歌曲整体的音乐品质之外,“天工SkyMusic”拥有清晰逼真的人声,模型的AI人声合成能够产生中文水平极高、发音清晰的歌声,展现出卓越的音频质量和逼真的演唱效果,在中文发音上优于国外大模型。与市面上Suno等AI音乐工具相比,AI音乐生成大模型“天工SkyMusic”采用的是基于MoE架构的4000亿级参数多模态超级大模型“天工3.0”,在逻辑推理、语义理解和泛化能力的加持下,“天工SkyMusic”的响应速度和训练推理效率较高。
4月10日,谷歌在官网正式发布了Gemini1.5Pro,现在可在180多个国家/地区使用。Gemini1.5Pro除了能生成创意文本、代码之外,能根据用户输入的文本提示,理解、总结上传的视频、音频内容进行深度总结,并且支持100万tokens上下文,目前可以在GoogleAIStudio开发平台中免费试用。谷歌对API进行三个优化:1)系统指令方面,可以在GoogleAIStudio和GeminiAPI
加载中...
已阅读到文档的结尾了