文件列表:
上海证券:互联网传媒行业周报-周观点:中国电信语音大模型支持30种方言,清华发布YOLOv10.pdf |
下载文档 |
资源简介
>
主要观点
5月25日,中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混说的大模型。在2024智算云生态大会上,星辰语音大模型被官宣发布并开源。识别方面,大模型打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,在国际语音顶会INTERSPEECH2024离散语音单元建模挑战赛上,星辰语音识别大模型斩获了语音识别赛道冠军。同时在NIST(美国国家标准与技术研究院)举办的低资源粤语电话Babel语音识别任务上,取得业内最优结果。场景落地方面,星辰语音大模型已在北京、福建、江西、广西等地万号智能客服系统试点应用。它能秒懂方言然后服务用户,日均处理约200万通电话。智能客服翼声平台也接入了星辰大模型的语音理解和分析能力,实现31省全覆盖,每天处理125万通客服电话。
5月23日,由清华发布YOLOv10论文,升级目标检测系统的YOLO系列。YOLO因为性能强大、消耗算力较少,一直以来都是实时目标检测领域的主要范式。该框架被广泛用于各种实际应用,包括自动驾驶、监控和物流。其高效、准确的物体检测能力使
加载中...
已阅读到文档的结尾了