文件列表:
中泰证券:BloombergGPT-金融领域的500亿参数的语言模型.pdf |
下载文档 |
资源简介
>
BloombergGPT-为金融行业打造的大语言模型近日,彭博发布一篇关于BloombergGPT开发情况的研究论文《BloombergGPT:ALargeLanguageModelforFinance》,文章详细介绍了这一全新的大规模生成式人工智能(AI)模型。该大语言模型(LLM)专门针对各类金融数据进行训练,以全方位支持金融领域的自然语言处理(NLP)任务。该模型将帮助彭博改进现有的金融NLP任务,如市场情绪分析、命名实体识别、新闻分类和问题回答等。此外,BloombergGPT还将释放更多新机遇,调动彭博终端上的海量数据,将人工智能蕴藏的全部潜力带到金融领域。目前已知的最大的领域特定数据集为训练BloombergGPT,彭博构建了一个全面的数据集“FINPILE”,主要由英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件,以及从彭博档案库中提取的社交媒体消息。同时彭博将FINPILE与公共数据集进行叠加,成为了包含超7,000亿词例(tokens)的大型训练语料库,其中彭博“FINPILE”贡献了3635亿词例(tokens),占比51.27%,且该部分的数据质量更高
加载中...
已阅读到文档的结尾了