36氪研究院：2016年计算机视觉行业研究报告

发布者：wx****8a

2016-09-08

2 MB 40 页

36氪研究院人工智能（AI）

文件列表：

36Kr-计算机视觉行业研究报告-20160908.pdf

下载文档

资源简介

计算机视觉是指用计算机来模拟人的视觉系统，实现人的视觉功能，以适应、理解外界环境和控制自身的运动。概括的说，视觉系统主要解决的是物体识别、物体形状和方位确认以及物体运动判断这三个问题。而计算机视觉的研究，则是专注于让机器代替人眼，解决这些问题。物体的识别：即理解物体是什么，对物体的识别主要体现在两方面，第一是是将不同物体归类，第二是对同类型物体的区分与鉴别，如不同人脸的鉴别。物体识别要求既能抽象出物体的共同属性，又能分别出相似物体间的细微差别。物体形状和方位的确定：判断物体的形状和方位是为了让物体在视觉的三维空间里得到记忆的重建，进而进行场景分析与判断。物体运动的判断：和物体形状方位的确定一样，对物体的运动的判断也是一种对于场景的重建和理解，用于进行视觉主体（人或机器）对场景的分析，乃至做出自身行动的决策，实现视觉主体和场景的交互。计算机视觉作为计算机的眼睛，是机器认识世界、看懂世界的一种方式。而认识世界、看懂世界是人工智能产品或方案不可或缺的重要部分。唯有看见，才能够做出分析判断，进而代替人类完成更多的任务。它与语音识别、语言识别一并构成了人工智能的感知智能，让机器完成对外部

加载中...

本文档仅能预览20页

继续阅读请下载文档