做淘寶的網(wǎng)站企業(yè)網(wǎng)站營銷的優(yōu)缺點(diǎn)
1 生活中的計(jì)算機(jī)視覺
生活中的各種計(jì)算機(jī)視覺識(shí)別系統(tǒng)已經(jīng)廣泛地應(yīng)用起來了。
2 計(jì)算機(jī)視覺與其他學(xué)科的關(guān)系
認(rèn)知科學(xué)和神經(jīng)科學(xué)是研究人類視覺系統(tǒng)的,如果能把人類視覺系統(tǒng)學(xué)習(xí)得更好,可以遷移到計(jì)算機(jī)視覺。是計(jì)算機(jī)視覺的理論基礎(chǔ)。
算法、系統(tǒng)、框架、機(jī)器學(xué)習(xí)等是計(jì)算機(jī)視覺的工具。
光學(xué)設(shè)備采集圖像給計(jì)算機(jī)視覺提供輸入
圖像處理強(qiáng)調(diào)的是:我輸入的是圖像,輸出的也是圖像,比如增強(qiáng)亮度、去噪
計(jì)算機(jī)視覺系統(tǒng):輸入的圖像,輸出的不只是圖像。
應(yīng)用:①圖像檢索。文字搜圖,計(jì)算機(jī)視覺識(shí)別后給圖像打了標(biāo)簽。在互聯(lián)網(wǎng)上占領(lǐng)大的流量的還是圖像和視頻。②機(jī)器人。
3 計(jì)算機(jī)視覺的介紹
首先談?wù)勚悄艿母拍?#xff0c;1997年的人工智能系統(tǒng)“深藍(lán)”,戰(zhàn)勝了國際象棋的世界冠軍。2015年和2017年AlphaGo戰(zhàn)勝了李世石和柯潔。
但是這是不是真的智能,現(xiàn)在的人工智能系統(tǒng)能下棋,但是它不能創(chuàng)作詩歌超過人類最優(yōu)秀的詩人。從這個(gè)角度看,這并不是真的智能,它有一個(gè)很好的搜索算法,去搜索出最優(yōu)解。因此,現(xiàn)在只能在數(shù)理和數(shù)學(xué)計(jì)算上部分實(shí)現(xiàn)人類的智能。
4 三維重構(gòu)
計(jì)算機(jī)視覺系統(tǒng)還不夠完善。
5 什么是視覺系統(tǒng)
感知 + 解釋
人類的視覺系統(tǒng)
機(jī)器視覺系統(tǒng)
機(jī)器看到的是什么?是一個(gè)灰度圖,是一個(gè)二維矩陣300 * 400
語義鴻溝:從像素到語義內(nèi)容。存在的極大的差距
我們首先會(huì)從人類的視覺系統(tǒng)中去借鑒
6 人類的視覺系統(tǒng)是什么樣的
諾貝爾獎(jiǎng)成果:讓貓去看圖片。確定視覺和大腦皮層的關(guān)系。
給貓看了大量的圖片,但是貓的大腦皮層沒有反應(yīng)。
給貓看簡單的圖形,某些神經(jīng)元會(huì)有反應(yīng)。通過后續(xù)實(shí)驗(yàn),發(fā)現(xiàn)大腦對(duì)視覺信息的處理事分層的。
人類的視覺系統(tǒng)非常優(yōu)秀。
任務(wù):人類能以多快的速度和多高的精度去區(qū)分動(dòng)物和非動(dòng)物
過了150ms,區(qū)分動(dòng)物和非動(dòng)物的腦電波信號(hào)就不一樣了。
7 運(yùn)動(dòng)視盲
8 利用上下文去理解語義
上下文背景引導(dǎo)了我們理解圖像的過程。
實(shí)際上A、B的顏色是一樣的。人類的視覺系統(tǒng)會(huì)對(duì)B進(jìn)行自動(dòng)增強(qiáng)。
9 計(jì)算機(jī)視覺的起源
MIT的研究生暑期項(xiàng)目
1966年,計(jì)算機(jī)視覺從圖像處理中獨(dú)立出來
先驅(qū)人物:馬爾
計(jì)算機(jī)視覺的框架:①計(jì)算理論:任務(wù)是什么?②表達(dá)和算法:輸入和輸出是什么?③硬件實(shí)現(xiàn):
10 我們能從圖像中獲取什么信息
3D信息更多地是用于定位
①SLAM
②三維重建
③漫游:一天建成羅馬
從這個(gè)角度,計(jì)算機(jī)視覺分為兩個(gè)大方向:從圖像中恢復(fù)3D結(jié)構(gòu)信息、從圖像中恢復(fù)語義信息
11 計(jì)算機(jī)視覺的發(fā)展歷程
12 為什么要做計(jì)算機(jī)視覺
三維重建
人臉識(shí)別:計(jì)算機(jī)識(shí)別的第一個(gè)真正的應(yīng)用
虹膜識(shí)別
檢測(cè)與跟蹤:
VR:虛擬現(xiàn)實(shí)