【TouchSky摩天·技術(shù)百科 作者:后裔】 轉(zhuǎn)自:www.wetouchsky.com
最近兩年無(wú)人機(jī)行業(yè)異常火爆,各路牛鬼蛇神都出來(lái)造飛機(jī),宣傳更是天花亂墜,各種牛掰功能一一面市,今天后裔就給大家說(shuō)說(shuō)一個(gè)看似簡(jiǎn)單,實(shí)際真牛掰的功能—手勢(shì)自拍。說(shuō)到手勢(shì)自拍,大家也許會(huì)想到各種茄子、比心~~~。不是這個(gè),今天后裔說(shuō)的無(wú)人機(jī)手勢(shì)自拍是指:僅通過(guò)特定的手勢(shì),無(wú)需用遙控器控制快門(mén),只要揮手示意,就能讓無(wú)人機(jī)給我們拍一張自然生動(dòng)的自拍。后裔覺(jué)得這是無(wú)人機(jī)智能化的開(kāi)端。
說(shuō)的有點(diǎn)玄乎,來(lái)兩張動(dòng)圖讓大家更直觀的了解。
無(wú)人機(jī)手勢(shì)自拍的原理并不深?yuàn)W,它是基于機(jī)器視覺(jué)的動(dòng)作捕捉技術(shù)。
機(jī)器視覺(jué)是指通過(guò)機(jī)器視覺(jué)產(chǎn)品將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專(zhuān)用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制設(shè)備動(dòng)作。
當(dāng)我們進(jìn)入無(wú)人機(jī)鏡頭的視野,無(wú)人機(jī)便會(huì)把我們和周?chē)h(huán)境區(qū)分開(kāi)來(lái),當(dāng)我們擺出特定的手勢(shì),被無(wú)人機(jī)捕捉到后,無(wú)人機(jī)會(huì)根據(jù)預(yù)先輸入的算法,來(lái)識(shí)別手勢(shì)或者軀體的動(dòng)作,與拍照的手勢(shì)或者軀體動(dòng)作是否吻合,進(jìn)而觸發(fā)拍照的邏輯。
機(jī)器視覺(jué)的研究是從20世紀(jì)60年代中期美國(guó)學(xué)者L.R.羅伯茲關(guān)于理解多面體組成的積木世界研究開(kāi)始的。當(dāng)時(shí)運(yùn)用的預(yù)處理、邊緣檢測(cè)、輪廓線構(gòu)成、對(duì)象建模、匹配等技術(shù),后來(lái)一直在機(jī)器視覺(jué)中應(yīng)用。
70年代,機(jī)器視覺(jué)形成幾個(gè)重要研究分支:
①目標(biāo)制導(dǎo)的圖像處理
②圖像處理和分析的并行算法
③從二維圖像提取三維信息
④序列圖像分析和運(yùn)動(dòng)參量求值
⑤視覺(jué)知識(shí)的表示
⑥視覺(jué)系統(tǒng)的知識(shí)庫(kù)等。
80年代開(kāi)始了全球性的研究熱潮,機(jī)器視覺(jué)獲得了蓬勃發(fā)展,其后20來(lái)年機(jī)器視覺(jué)技術(shù)的功能和應(yīng)用范圍隨著工業(yè)自動(dòng)化的發(fā)展逐漸完善和推廣。
現(xiàn)如今機(jī)器視覺(jué)的主要應(yīng)用分類(lèi)分成四大塊:
測(cè)量(長(zhǎng)度,角度,半徑…)
檢測(cè)(殘次品檢測(cè),瑕疵檢測(cè),數(shù)量統(tǒng)計(jì)),
定位
識(shí)別(讀碼,識(shí)別顏色,人物)
無(wú)人機(jī)的手勢(shì)自拍主要應(yīng)用的就是機(jī)器視覺(jué)的識(shí)別功能,其次還有定位功能。
而動(dòng)作捕捉技術(shù)技術(shù)涉及尺寸測(cè)量、物理空間里物體的定位及方位測(cè)定等方面可以由計(jì)算機(jī)直接理解處理的數(shù)據(jù),隨著電影和游戲不斷發(fā)展,動(dòng)作捕捉技術(shù)的應(yīng)用也越發(fā)成熟。
電影方面:
《終結(jié)者》的機(jī)械模型,這種技術(shù)的代表作便是《終結(jié)者》,拍攝時(shí)特效師使用了全尺寸的機(jī)器人模型,通過(guò)遙控、機(jī)械操作等方式使其運(yùn)動(dòng)起來(lái)。但這種技術(shù)的缺點(diǎn)是角色的動(dòng)作不是特別流暢,設(shè)計(jì)制作難度大,操控復(fù)雜。
《指環(huán)王》的咕嚕,動(dòng)畫(huà)師們將安迪·瑟金斯在動(dòng)作捕捉棚一個(gè)人演咕嚕的動(dòng)作數(shù)據(jù)記錄下來(lái),經(jīng)過(guò)處理便制作出了那個(gè)神神叨叨、精神分裂的咕嚕。
游戲方面:
VR(虛擬現(xiàn)實(shí):利用電腦模擬產(chǎn)生一個(gè)三維空間的虛擬世界,提供使用者關(guān)于視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感官的模擬,讓使用者如同身歷其境一般,可以及時(shí)、沒(méi)有限制地觀察三度空間內(nèi)的事物。)
AR(增強(qiáng)現(xiàn)實(shí):通過(guò)電腦技術(shù),將虛擬的信息應(yīng)用到真實(shí)世界,真實(shí)的環(huán)境和虛擬的物體實(shí)時(shí)地疊加到了同一個(gè)畫(huà)面或空間同時(shí)存在。)
動(dòng)作捕捉技術(shù)是AR/VR的基石,這兩種類(lèi)型的游戲都運(yùn)用了動(dòng)作捕捉技術(shù),游戲的制作以及玩家在游戲中的任何操作與互動(dòng)都需要?jiǎng)幼鞑蹲郊夹g(shù),可以說(shuō)沒(méi)有動(dòng)作捕捉技術(shù),也就沒(méi)有VR/AR.
以上示例證明我們對(duì)動(dòng)作捕捉技術(shù)的認(rèn)知及掌握都處于了較為成熟的階段。而后裔認(rèn)為機(jī)器視覺(jué)與動(dòng)作捕捉技術(shù)相當(dāng)于賦予機(jī)器以人類(lèi)的視覺(jué)系統(tǒng),無(wú)人機(jī)手勢(shì)自拍只是機(jī)器視覺(jué)和動(dòng)作捕捉技術(shù)的一個(gè)極小的應(yīng)用,目前掌握這項(xiàng)技術(shù)的無(wú)人機(jī)公司和產(chǎn)品并不多,較為典型的是大疆,他們的精靈Phantom 4系列以及御mavic都具備手勢(shì)自拍這個(gè)功能,最新發(fā)布的P4A也具備手勢(shì)自拍這個(gè)功能,看來(lái)大疆已經(jīng)完全掌握了這項(xiàng)技術(shù),并且用的爐火純青。
而最近曝光的大疆新品Spark這樣的小型無(wú)人機(jī)是否也會(huì)給我們帶來(lái)驚喜呢?會(huì)不會(huì)有更多的突破呢?比如和VR結(jié)合起來(lái),讓我們能通過(guò)Spark的視角觀察整個(gè)世界,讓我們的意識(shí)跟著Spark翱翔天空。
后裔認(rèn)為未來(lái)推出的無(wú)人機(jī)應(yīng)該都會(huì)具備手勢(shì)自拍這個(gè)功能,無(wú)人機(jī)智能化的趨勢(shì)是大勢(shì)所趨。雖然無(wú)人機(jī)手勢(shì)自拍只是一個(gè)自拍的小功能,對(duì)大部分飛友而言也只是一個(gè)一時(shí)興起才會(huì)嘗試的新玩法,但它是無(wú)人機(jī)智能化的開(kāi)端,現(xiàn)在也許只是簡(jiǎn)單的拍照,慢慢可以升級(jí)到手勢(shì)控制無(wú)人機(jī)的方向,起飛降落等簡(jiǎn)單操作,更進(jìn)一步可以像汽車(chē)的輔助駕駛功能一般,不斷升級(jí)最終擺脫遙控器,擺脫遙感,也許我們飛無(wú)人機(jī)就如同小說(shuō)中的釋放法術(shù)一般,只需要各種手勢(shì)即可,再高級(jí)一點(diǎn)就是用腦電波去控制了無(wú)人機(jī)了,通過(guò)VR來(lái)共享無(wú)人機(jī)視覺(jué),無(wú)人機(jī)也許就成了我們第二雙眼睛。誰(shuí)知道這不會(huì)成真呢?