文件列表:
Datartisan刘晓葳:文本挖掘方法与应用简介 |
下载文档 |
资源简介
>
《文本挖掘方法与应用简介》内容提要:基础
什么是文本数据
为什么要挖掘文本数据
知识储备与基本概念
方法
如何获取文本数据
如何预处理文本数据
如何挖掘文本数据
如何可视化呈现文本
流程
文本数据获取
文本数据预处理
文本数据分析与挖掘
文本数据可视化
实践
文本挖掘的应用场景
文本挖掘的主观与客观
如何使用文本挖掘
文本挖掘方法与应用简介 报告人:刘晓葳那么首先,到现在你还纠结于大数据的概念?大数据:知道要“以数据为大”了解文本挖掘的意义 A-HUMAN-CENTRIC-MODEL:人本模型分享提要什么是文本数据
表示:数值数据:3;文本数据:”3”
形式:非结构性、自由形态的文字,亦或是许多符合特定计算机语言的语法及语法规则、构成文字和语句的字符串
广泛性:社交网站;电子商务平台;文献集合;知识库
文本数据成为互联网生态的重要组成网络试图解决的问题为:
减少信息摩擦,加快信息传递在大量文本信息进入网络传播介质之后,文本数据成为互联网生态的重要组成。
它影响人机之间的信息效率:如何使得文本数据可被计算机理解?如何利用计算机帮助解读文本数据?
它影响机器之间的信息效率:如何规划范式,使
加载中...
本文档仅能预览20页