《圖像時(shí)代的早期閱讀》書中主要介紹了兒童圖畫書的發(fā)展歷程,并介紹了圖像時(shí)代的各國著名的早期閱讀讀本,告訴我們怎樣的讀本才是理想的早期閱讀讀本;還講述了早期閱讀的一些活動(dòng)指導(dǎo)策略,并通過一些案例講述了整合教育理念下的早期閱讀,如 有讀本生成的課程、日常生活中的閱讀、親子閱讀、動(dòng)態(tài)圖像閱讀等等。幫助我們能科學(xué)地認(rèn)識(shí)不同年齡段孩子的閱讀需求特點(diǎn),并掌握有效的閱讀指導(dǎo)策略,開展有效的閱讀活動(dòng)。
在《圖像時(shí)代的早期閱讀》一書中,談到早期閱讀的指導(dǎo)方法時(shí),其中有一點(diǎn)給我的體會(huì)較深,就是體察童趣,感受童書的神奇魅力。書中介紹了故事《來不及了,來不及了,快要來不及了……》這本繪本充滿了童趣,小男孩急于想上衛(wèi)生間,從一樓跑到五樓,最終才找到適合自己的衛(wèi)生間的奇特經(jīng)歷。作者從孩子的眼光,用幽默的筆觸描寫了一位守規(guī)矩、對解手之事很頂真的小男孩,以十分快的熟讀跑到動(dòng)物展廳的一樓,看門的老伯伯對他說,樓下的衛(wèi)生間壞了,但從二樓到五樓都有衛(wèi)生間?僧(dāng)小男孩跑到二樓時(shí)發(fā)現(xiàn)是長頸鹿的衛(wèi)生間,長腿的它們用的小便池好高啊!小男孩只好再往三樓跑,推門進(jìn)去,發(fā)現(xiàn)那是蝙蝠的衛(wèi)生間,一只只蝙蝠用奇怪的姿勢倒掛著,小男孩一時(shí)懵住了,便槽到底在哪里?“來不及了,來不及了,快要來不及了……”小男孩邊叨念邊疾步網(wǎng)四樓跑去,推門進(jìn)去,哇!怎么是迷宮似的衛(wèi)生間啊?這究竟是怎回事?便槽到底在哪兒?小男孩顧不上細(xì)想,又一股勁兒地往五樓跑。“來不及了,來不及了,快要來不及了……”當(dāng)小男孩推門進(jìn)衛(wèi)生間,一個(gè)個(gè)明亮潔凈的便槽出現(xiàn)在眼前。哇——好痛快!小男孩似乎完成了一件大事,他為能堅(jiān)持找到真正適合自己的衛(wèi)生間感到滿意極了。該書從語言文字的傳遞到畫面人物動(dòng)態(tài)的刻畫都十分兒童化,情趣十足。笑足之余,你會(huì)為一個(gè)認(rèn)真、可愛的孩子所感動(dòng)。
圖畫書所散發(fā)的美麗除了畫面的精美,更重要的是書中的童趣。那種孩子身上特有的思想感情,那種單純、幼稚可笑的語言、行為和心理活動(dòng),實(shí)在鄰人著迷,忍俊不禁。
第二篇:《圖像時(shí)代的早期閱讀》讀書筆記《圖像時(shí)代的早期閱讀》讀書筆記
《圖像時(shí)代的早期閱讀》書中主要介紹了兒童圖畫書的發(fā)展歷程,并介紹了圖像時(shí)代的各國著名的早期閱讀讀本,告訴我們怎樣的讀本才是理想的早期閱讀讀本;還講述了早期閱讀的一些活動(dòng)指導(dǎo)策略,并通過一些案例講述了整合教育理念下的早期閱讀,如 有讀本生成的課程、日常生活中的閱讀、親子閱讀、動(dòng)態(tài)圖像閱讀等等。幫助我們能科學(xué)地認(rèn)識(shí)不同年齡段孩子的閱讀需求特點(diǎn),并掌握有效的閱讀指導(dǎo)策略,開展有效的閱讀活動(dòng)。
在《圖像時(shí)代的早期閱讀》一書中,談到早期閱讀的指導(dǎo)方法時(shí),其中有一點(diǎn)給我的體會(huì)較深,就是體察童趣,感受童書的神奇魅力。書中介紹了故事《來不及了,來不及了,快要來不及了??》這本繪本充滿了童趣,小男孩急于想上衛(wèi)生間,從一樓跑到五樓,最終才找到適合自己的衛(wèi)生間的奇特經(jīng)歷。作者從孩子的眼光,用幽默的筆觸描寫了一位守規(guī)矩、對解手之事很頂真的小男孩,以十分快的熟讀跑到動(dòng)物展廳的一樓,看門的老伯伯對他說,樓下的衛(wèi)生間壞了,但從二樓到五樓都有衛(wèi)生間?僧(dāng)小男孩跑到二樓時(shí)發(fā)現(xiàn)是長頸鹿的衛(wèi)生間,長腿的它們用的小便池好高啊!小男孩只好再往三樓跑,推門進(jìn)去,發(fā)現(xiàn)那是蝙蝠的衛(wèi)生間,一只只蝙蝠用奇怪的姿勢倒掛著,小男孩一時(shí)懵住了,便槽到底在哪里?“來不及了,來不及了,快要來不及了??”小男孩邊叨念邊疾步網(wǎng)四樓跑去,推門進(jìn)去,哇!怎么是迷宮似的衛(wèi)生間啊?這究竟是怎回事?便槽到底在哪兒?小男孩顧不上細(xì)想,又一股勁兒地往五樓跑!皝聿患傲耍瑏聿患傲,快要來不及了??”當(dāng)小男孩推門進(jìn)衛(wèi)生間,一個(gè)個(gè)明亮潔凈的便槽出現(xiàn)在眼前。哇——好痛快!小男孩似乎完成了一件大事,他為能堅(jiān)持找到真正適合自己的衛(wèi)生間感到滿意極了。該書從語言文字的傳遞到畫面人物動(dòng)態(tài)的刻畫都十分兒童化,情趣十足。笑足之余,你會(huì)為一個(gè)認(rèn)真、可愛的孩子所感動(dòng)。
圖畫書所散發(fā)的美麗除了畫面的精美,更重要的是書中的童趣。那種孩子身上特有的思想感情,那種單純、幼稚可笑的語言、行為和心理活動(dòng),實(shí)在鄰人著迷,忍俊不禁。
第三篇:數(shù)字圖像處理 讀書筆記《數(shù)字圖象處理》學(xué)士論文讀書筆記
運(yùn)動(dòng)對象檢測是數(shù)字圖像處理技術(shù)的一個(gè)重要部分,它是計(jì)算機(jī)視覺、目標(biāo)識(shí)別與跟蹤、運(yùn)動(dòng)圖像編碼、基于內(nèi)容的檢索、安全監(jiān)控等視頻分析和處理應(yīng)用的關(guān)鍵步驟。解決跟蹤算法的計(jì)算量與實(shí)時(shí)性這對矛盾,是提高系統(tǒng)跟蹤精度和跟蹤穩(wěn)定性的關(guān)鍵,此即為本文的關(guān)鍵所在。
對于變化很慢的背景圖像而言,可把動(dòng)目標(biāo)看作目標(biāo)對背景的擾亂,可以看作kalman濾波器在零均值白噪聲時(shí)的退化公式:
www.7334dd.combit數(shù)據(jù)量。因此對計(jì)算機(jī)的計(jì)算速度、存儲(chǔ)容量等要求較高。(2)數(shù)字圖像處理占用的頻帶較寬。與語言信息相比,占用的頻帶要大幾個(gè)數(shù)量級(jí)。如電視圖像的帶寬約5.6mhz,而語音帶寬僅為4khz左右。所以在成像、傳輸、存儲(chǔ)、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本亦高,這就對頻帶壓縮技術(shù)提出了更高的要求。 (3)數(shù)字圖像中各個(gè)像素是不獨(dú)立的,其相關(guān)性大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個(gè)像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達(dá)0.9以上,而相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。 (4)由于圖像是三維景物的二維投影,一幅圖象本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來
的。因此,要分析和理解三維景物必須作合適的假定或附加新的測量,例如雙目圖像或多視點(diǎn)圖像。在理解三維景物時(shí)需要知識(shí)導(dǎo)引,這也是人工智能中正在致力解決的知識(shí)工程問題。 (5)數(shù)字圖像處理后的圖像一般是給人觀察和評價(jià)的,因此受人的因素影響較大。由于人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、人的情緒愛好以及知識(shí)狀況影響很大,作為圖像質(zhì)量的評價(jià)還有待進(jìn)一步深入的研究。另一方面,計(jì)算機(jī)視覺是模仿人的視覺,人的感知機(jī)理必然影響著計(jì)算機(jī)視覺的研究。例如,什么是感知的初始基元,基元是如何組成的,局部與全局感知的關(guān)系,優(yōu)先敏感的結(jié)構(gòu)、屬性和時(shí)間特征等,這些都是心理學(xué)和神經(jīng)心理學(xué)正在著力研究的課題。
在數(shù)字圖像處理中圖像的數(shù)字化顯示是基礎(chǔ)。將模擬圖像轉(zhuǎn)化成數(shù)字圖像的過程就是圖形、圖像的數(shù)字化過程。這個(gè)過程主要包含采樣、量化和編碼三個(gè)步驟。
1.采樣 采樣的實(shí)質(zhì)就是要用多少點(diǎn)來描述一幅圖像,采樣結(jié)果質(zhì)量的高低就是用前面所說的圖像分辨率來衡量。簡單來講,對二維空間上連續(xù)的圖像在水平和垂直方向上等間距地分割成矩形網(wǎng)狀結(jié)構(gòu),所形成的微小方格稱為像素點(diǎn)。一副圖像就被采樣成有限個(gè)像素點(diǎn)構(gòu)成的集合。采樣頻率是指一秒鐘內(nèi)采樣的次數(shù),它反映了采樣點(diǎn)之間的間隔大小。采樣頻率越高,得到的圖像樣本越逼真,圖像的質(zhì)量越高,但要求的存儲(chǔ)量也越大。在進(jìn)行采樣時(shí),采樣點(diǎn)間隔大小的選取很重要,它決定了采樣后的圖像能真實(shí)地反映原圖像的程度。一般來說,原圖像中的畫面越復(fù)雜,色彩越豐富,則采樣間隔應(yīng)越小。
由于二維圖像的采樣是一維的推廣,根據(jù)信號(hào)的采樣定理,要從取樣樣本中精確地復(fù)原圖像,可得到圖像采樣的奈奎斯特(nyquist)定理:圖像采樣的頻率必須大于或等于源圖像最高頻率分量的兩倍。
2.量化 量化是指要使用多大范圍的數(shù)值來表示圖像采樣之后的每一個(gè)點(diǎn)。量化的結(jié)果是圖像能夠容納的顏色總數(shù),它反映了采樣的質(zhì)量。 例如:如果以4位存儲(chǔ)一個(gè)點(diǎn),就表示圖像只能有16種顏色;若采用16位存儲(chǔ)一個(gè)點(diǎn),則有216=65536種顏色。所以,量化位數(shù)越來越大,表示圖像可以擁有更多的顏色,自然可以產(chǎn)生更為細(xì)致的圖像效果。但是,也會(huì)占用更大的存儲(chǔ)空間。兩者的基本問題都是視覺效果和存儲(chǔ)空間的取舍。假設(shè)有一幅黑白灰度的照片,因?yàn)樗谒接诖怪狈较蛏系幕叶茸兓际沁B續(xù)的,都可認(rèn)為有無數(shù)個(gè)像素,而且任一點(diǎn)上灰度的取值都是從黑到白可以有無限個(gè)可能值。通過沿水平和垂直方向的等間隔采樣可將這幅模擬圖像分解為近似的有限個(gè)像素,每個(gè)像素的取值代表該像素的灰度(亮度)。對灰度進(jìn)行量化,使其取值變?yōu)橛邢迋(gè)可能值。 經(jīng)過這樣采樣和量化得到的一幅空間上表現(xiàn)為離散分布的有限個(gè)像素,灰度取值上表現(xiàn)為有限個(gè)離散的可能值的圖像稱為數(shù)字圖像。只要水平和垂直方向采樣點(diǎn)數(shù)足夠多,量化比特?cái)?shù)足夠大,數(shù)字圖像的質(zhì)量就比原始模擬圖像毫不遜色。在量化時(shí)所確定的離散取值個(gè)數(shù)稱為量化級(jí)數(shù)。為表示量化的色彩值(或亮度值)所需的二進(jìn)制位數(shù)稱為量化字長,一般可用8位、16位、24位或更高的量化字長來表示圖像的顏色;量化字長越大,則越能真實(shí)第反映原有的圖像的顏色,但得到的數(shù)字圖像的容量也越大。
3.壓縮編碼數(shù)字化后得到的圖像數(shù)據(jù)量十分巨大,必須采用編碼技術(shù)來壓縮其信息量。在一定意義上講,編碼壓縮技術(shù)是實(shí)現(xiàn)圖像傳輸與儲(chǔ)存的關(guān)鍵。
數(shù)學(xué)里的變換,指一個(gè)圖形(或表達(dá)式)到另一個(gè)圖形(或表達(dá)式)的演變。圖象變換是函數(shù)的一種作圖方法。已知一個(gè)函數(shù)的圖象,通過某種或多種連續(xù)方式變換,得到另一個(gè)與之相關(guān)的函數(shù)的圖象,這樣的作圖方法叫做圖象變換。
在圖像變換中傅立葉變換就是應(yīng)用最廣泛的一種變換。數(shù)字圖像經(jīng)二維離散傅立葉變換后,其空間域處理可變換為變換域處理,它具有很多明顯的優(yōu)點(diǎn),最突出的是算法運(yùn)算次數(shù)將大大減少,并可采用二維數(shù)字濾波技術(shù)進(jìn)行所需要的各種圖像處理。
二位離散余弦變換其去相關(guān)性近似于k-l(karhunen-loeve)最佳變換,算法復(fù)雜度適中,易于硬件實(shí)現(xiàn),且具有抗干擾能力強(qiáng)等優(yōu)點(diǎn),因此,dct及idct被廣泛應(yīng)用于h.261、h.263、h.264、jpeg、mpeg等視頻壓縮標(biāo)準(zhǔn)中。
小波分解可以覆蓋整個(gè)頻域(提供了一個(gè)數(shù)學(xué)上完備的描述) ;小波變換通過選取合適的濾波器,可以極大的減小或去除所提取得不同特征之間的相關(guān)性; 小波變換具有“變焦”特性,在低頻段可用高頻率分辨率和低時(shí)間分辨率(寬分析窗口),在高頻段,可用低頻率分辨率和高時(shí)間分辨率(窄分析窗口) ;小波變換實(shí)現(xiàn)上有快速算法(mallat小波分解算法)。小波變換是一種信號(hào)的時(shí)間——尺度分析方法,他具有多分辨率分析的特點(diǎn),而且在時(shí)頻兩域都具有表征信號(hào)
局部特征的能力,是一種窗口大小固定不變但其形狀可變,時(shí)間窗和頻率窗都可變的時(shí)頻局部化分析方法。即再低頻部分具有較高的頻率分辨率和時(shí)間分辨率,在高頻部分具有較高的時(shí)間分辨率和較低的頻率分辨率,很適合探測正常信號(hào)中夾帶的瞬態(tài)反常現(xiàn)象并展示其成分,所以被譽(yù)為分析信號(hào)的顯微鏡。
小波變換是一種新的變換分析方法,它繼承和發(fā)展了短時(shí)傅立葉變換局部化的思想,同時(shí)又克服了窗口大小不隨頻率變化等缺點(diǎn),能夠提供一個(gè)隨頻率改變的時(shí)間一頻率窗口,是進(jìn)行信號(hào)時(shí)頻分析和處理的理想工具。它的主要特點(diǎn)是通過變換能夠充分突出問題某些方面的特征,因此,小波變換在許多領(lǐng)域都得到了成功的應(yīng)用,特別是小波變換的離散數(shù)字算法已被廣泛用于許多問題的變換研究中。從此,小波變換越來越引起人們的重視,其應(yīng)用領(lǐng)域來越來越廣泛。
第五篇:讀書筆記(圖像和視頻中的不規(guī)則檢測)論文題目:detecting irregularities in images and in video 所載刊物:international journal of computer vision 74(1), 17–31, 201* 作者:oren boiman and michal irani
主要內(nèi)容和結(jié)論(觀點(diǎn)):
該文主要闡述了作者在檢測圖像和視頻等可視化數(shù)據(jù)中的不規(guī)則數(shù)據(jù)的研究成果。
文章中表明,圖像和視頻中不規(guī)則圖像模型的探測在各種各樣的任務(wù)中都是很有用的。對于監(jiān)視和監(jiān)測來說探測可疑行為或是異常目標(biāo)是重要的。
早先識(shí)別可疑行為或活動(dòng)的方法可以廣泛的被分成兩類:基于規(guī)則的方法和沒有預(yù)定義規(guī)則的統(tǒng)計(jì)方法。
而在該文中作者提出將探測規(guī)則和不規(guī)則的問題公式化成為用從先前可視樣本(數(shù)據(jù)庫)中提取出來的時(shí)空塊組成(解釋)新的觀察的可視數(shù)據(jù)(一個(gè)圖像或是一段視頻,在下面提到時(shí)用“查詢”表示)的問題。這些可以用從樣本數(shù)據(jù)庫中抽取的大的連續(xù)數(shù)據(jù)塊組成的查詢中的區(qū)域被認(rèn)為是相似的,這些區(qū)域越大,相似性就越強(qiáng)。在不能用樣本數(shù)據(jù)庫組成的查詢中的區(qū)域被認(rèn)為是不相似的或是可疑的。作者的方法因此可以從僅僅少量的幾個(gè)樣本就能推斷或是歸納出更大的上下文的圖像模式和行為,甚至那些從來都沒有見過的特別構(gòu)造。(這個(gè)過程被定義為“通過組合的推論”)
作者認(rèn)為該文作出了以下四個(gè)主要的貢獻(xiàn):
1、 提出了一個(gè)可以從僅有的幾個(gè)樣本中就可以推理和歸納的方法,這個(gè)方法是關(guān)于一個(gè)更大的上下文圖像模式和行為的合法性的,甚至是那些從來都沒有見過的特殊構(gòu)造的合法性。
2、 提出了一個(gè)基于圖表的貝葉斯定理的推論算法,它可以在成倍增加的時(shí)空范圍里有效探測大的整套的碎片塊(例如,數(shù)以百計(jì)的碎片塊)。同時(shí)它可以增強(qiáng)這些在整體以及單個(gè)的描述符上的碎片里的相關(guān)幾何方面的排列上的約束。
3、 提出了對圖像和視頻里術(shù)語中的“顯著”和“視覺注意”給出一個(gè)新的解釋。
4、 提出了一個(gè)單一的、統(tǒng)一的框架來處理計(jì)算機(jī)視覺里幾個(gè)的問題,這些問題在過去已經(jīng)被單獨(dú)地處理過。它們包括:圖像和視頻中值得注意的
地方,可疑行為的識(shí)別,異常物體的識(shí)別,自動(dòng)視頻檢查(例如,用于質(zhì)量保證)等等。
論文中的基本算法:
1、統(tǒng)計(jì)公式
用y來表示一個(gè)觀察到的查詢范圍內(nèi)的碎片組合。計(jì)算連接的可能性p(x,y),其中觀察到的查詢中的組合y與在數(shù)據(jù)庫(既在碎片的描述符值相似也在相對位置上相似)中的隱藏的組合x是相似的。我們可以把連接的可能性分解成:p(x, y) = p(y|x)p(x)。
令dy表示觀察到的碎片y中的第i個(gè)描述符向量,ly表示它的位置(在絕對坐標(biāo)里)。類似的,dx表示在碎片x中的第i個(gè)隱藏(數(shù)據(jù)庫)的描述符向量,lx表示它的位置。令cy和cx表示被觀察到的和隱藏的組合的“原始”點(diǎn)。任何這樣一對組合y和x的相似性被以下的可能性公式捕獲: iiii
p(x, y)= p(cx , d1x , . . . , l1x , . . . , cy , d1y , . . . , l1y, . . .)(公式1)
我們用一個(gè)高斯分布在描述符間建立相似性模型:
p(diy|dix) =α1 exp(?1/2(diy? dix)t s d?1(diy? dix))(公式2)
這里,α1是一個(gè)常量,s d是一個(gè)常量協(xié)方差矩陣,它決定描述符值的可允許的偏差。其它的分布可以根據(jù)其它描述符的相似性函數(shù)插入到模型中。給定一個(gè)隱藏?cái)?shù)據(jù)庫碎片的相對位置(lx? cx),觀察到的相應(yīng)碎片(ly? cy)的相對位置被假設(shè)成不依賴于所有其它碎片位置。這個(gè)假設(shè)使得有足夠靈活性去適應(yīng)在視線角度、范圍、位置和行為上的微小變化進(jìn)行比較兩個(gè)碎片組合的幾何排列,這樣: iip(liy | lix, cx , cy)= α2 · exp(? 1/2((liy? cy) ? (lix? cx))t× s?1l((liy? cy) ? (lix? cx))))(公式3)
到目前為止我們已經(jīng)建立了組合(描述符:dy, dx和相應(yīng)位置:ly? cy , lx? iiiicx)間屬性的關(guān)系模型,我們?nèi)匀恍枰㈦[藏組合內(nèi)的關(guān)系(也就是一個(gè)碎片描述符dx和它的位置間lx的關(guān)系)模型。利用數(shù)據(jù)庫中的樣本進(jìn)行非參數(shù)化的為它建模:
ii
1(dx , lx ) ∈ database
p (dx | lx ) =(公式4)
0otherwww.7334dd.comap(最大歸納的可能性)分配。這被通過上面統(tǒng)計(jì)模型來完成,這個(gè)模型具有一個(gè)簡單并且確切的信任傳播運(yùn)算法則。根據(jù)公式(5), map分配可以被寫成:
1111p(c , d , . . . , l , . . . , c , d , . . . , lxxxyyy) maxx
=α?iiiiiiip(l| l, c , c)p(d| d)p(d| ly xxyy xx x)(公式7) maxmaxlxidxi
首先我們?yōu)槊恳粋(gè)碎片計(jì)算從結(jié)點(diǎn)dx到結(jié)點(diǎn)lx關(guān)于它在位置lx的信任消息: iii
midl(lix) = iii ip(d| d)p(d| ly xx x)(公式8) maxdxi
也就是,對于每一個(gè)觀察到的碎片,用高描述符相似性計(jì)算每一個(gè)候選數(shù)據(jù)
庫位置lx。下一步,對這些候選數(shù)據(jù)庫的每一個(gè)位置,我們都傳遞一個(gè)包含在數(shù)據(jù)庫中可能原始位置cx: i
milc(cx) = iiip(l| l, c, c)m(ly xx ydlx)(公式9) maxlxi
在這一點(diǎn),我們有一個(gè)被每一個(gè)碎片暗示的候選原始列表。為了計(jì)算一個(gè)整體組合任務(wù)的可能性,我們從組合里的所有個(gè)體碎片中乘這信任:
mc (cx ) =?milc (cx )(公式10)
i
通過這個(gè)運(yùn)算法則處理的推論運(yùn)算量一個(gè)map推論。
3、估算查詢點(diǎn)的可能性
對于查詢中每一個(gè)點(diǎn),我們嘗試在它周圍組合一個(gè)大的區(qū)域。這可以通過檢查圍繞著每一個(gè)點(diǎn)的大區(qū)域的有效性,檢查時(shí)用上面的推論處理過程(通過計(jì)算一個(gè)查詢區(qū)域相似性)。這一點(diǎn)參與了很多查詢區(qū)域中。我們定義一個(gè)查詢點(diǎn)的相似性為包含那個(gè)點(diǎn)的最大區(qū)域可能性。因此,假如存在一個(gè)包含它的大區(qū)域,有相應(yīng)的相似性數(shù)據(jù)庫區(qū)域的話,在查詢中的一個(gè)點(diǎn)將有一個(gè)高可能性。這樣,我們可以利用部份的目標(biāo)遮擋組合成查詢,因?yàn)榭拷吔绲狞c(diǎn)被包含在目標(biāo)里的一個(gè)大的區(qū)域中。然而,部分遮擋可能生成小的鄰接的目標(biāo)區(qū)域,這些區(qū)域不能用我們當(dāng)前推論算法去組合。
在文章中,作者還提出了算法的性能改進(jìn),并介紹了一些基于該文中所述方法的探測圖像和視頻中不規(guī)則方面的應(yīng)用:包括探測異常圖像構(gòu)造、單一圖像的顯著空間、探測可疑行為以及自動(dòng)視頻檢查(質(zhì)量保證)等等。
最后,文章給出了結(jié)論:“通過組合的推論”,允許我們可以由少數(shù)幾個(gè)樣例就能在一個(gè)更大的上下文中去歸納什么是規(guī)則的,什么是不規(guī)則的。這個(gè)壓縮過程的實(shí)現(xiàn)是作為一個(gè)概率圖像模型里的高效推論算法來完成的,它適應(yīng)查詢與數(shù)據(jù)庫之間微小的時(shí)空變形。
“通過組合的推論”,也可以應(yīng)用在完全沒有任何早先樣本的情況下探測可視數(shù)據(jù)的顯著性。為了這個(gè)目的我們把每一個(gè)圖像區(qū)域稱作一個(gè)“查詢”,并且盡力利用剩下部分的圖像(數(shù)據(jù)庫)去組合它。這個(gè)過程依次重復(fù)所有的圖像區(qū)域。像這樣一些不能用圖像的其它部分“解釋”(組合)的區(qū)域?qū)⒆鳛轱@著區(qū)域
被探測出來。這導(dǎo)致了在可視數(shù)據(jù)上的一個(gè)新定義的術(shù)語:顯著。在視頻數(shù)據(jù)的案例中,這些區(qū)域是時(shí)空相關(guān)的,并且這些顯著的視頻區(qū)域是與顯著的行為相呼應(yīng)的。
“通過組合的推論”,這一方法是通用的并且因此能夠研究在一個(gè)單一的、統(tǒng)一的框架里的問題,它的一般性使得它不用采取任何基于分類模型的預(yù)學(xué)習(xí)的方法。我們通過探測可疑行為,顯著行為,顯著圖像區(qū)域,探測貨物或產(chǎn)品來證明這個(gè)方法的應(yīng)用。
文章中也提到,該文中的算法有兩個(gè)主要的局限性:(i)盡管遮擋可以處理某種程度的影響,它不能處理一些極端的遮擋(例如當(dāng)只有物體的小碎片部分是顯著時(shí))。(ii)時(shí)間和存儲(chǔ)的復(fù)雜度在該文的推論算法中是隨樣本數(shù)據(jù)庫的大小顯線性變化的。這對于大的數(shù)據(jù)庫來說顯然是有問題的。這兩個(gè)問題會(huì)是作者將來研究的一個(gè)主題。
相關(guān)研究介紹:
趙峰等人在《計(jì)算機(jī)研究與發(fā)展》中發(fā)表的《一種基于奇異值分解的圖像匹配算法》提出一種新的基于奇異值分解的圖像匹配算法。首先在待匹配圖像中分別提取帶主方向的角點(diǎn)作為特征點(diǎn),通過計(jì)算特征點(diǎn)間經(jīng)旋轉(zhuǎn)補(bǔ)償?shù)臍w一化互相關(guān)值建立特征點(diǎn)相似度矩陣,然后利用奇異值分解算法生成特征點(diǎn)匹配矩陣并獲得特征點(diǎn)間的--對應(yīng)關(guān)系。在復(fù)雜自然圖像上的實(shí)驗(yàn)結(jié)果表明,算法能夠匹配任意角度旋轉(zhuǎn)的圖像,對局部遮擋、光照變化、隨機(jī)噪聲等具有較強(qiáng)的健壯性,并具有較快的計(jì)算速度和較高的匹配精度。
張軍、劉志鏡在《模式識(shí)別與人工智能》發(fā)表的《基于模糊理論的行人異常動(dòng)作檢測》中根據(jù)行人軀干和四肢輪廓角度的變化,設(shè)計(jì)用于模糊化的函數(shù)式。提出利用軀干和四肢的模糊隸屬度通過計(jì)算來得到整個(gè)人異常度的一種基于模糊理論異常行為判別的算法。在系統(tǒng)實(shí)現(xiàn)中,提出利用質(zhì)心軌跡和模糊判別的聯(lián)合方法來甄別行人是否異常的方法。模糊判別可實(shí)現(xiàn)在視頻監(jiān)控范圍內(nèi)對行人行為的主動(dòng)分析,從而能夠?qū)π腥水惓5膭?dòng)作做出識(shí)別并進(jìn)行報(bào)警處理。
田永鴻等人申請的專利201*10568248.x,“圖像顯著對象提取方法、互補(bǔ)顯著度圖學(xué)習(xí)方法及系統(tǒng)”,通過給定任意圖像,自動(dòng)準(zhǔn)確地提取出圖像中的顯著物體,有效地解決了在復(fù)雜場景下一般顯著物體提取結(jié)果缺乏的準(zhǔn)確性和魯棒性問題。
sdong小編推薦更多文章:《獲利時(shí)代》讀書筆記
《小時(shí)代》讀書筆記
《鄧小平時(shí)代》讀書筆記
小時(shí)代讀書筆記
《時(shí)代》雜志閱讀筆記 (2)
來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請聯(lián)系我們及時(shí)刪除。