英梅吉CEO朱郁叢:為用戶提供“零成本”移動VR手勢交互方案
由于缺少交互,從設(shè)備到內(nèi)容上移動VR所帶給我們的體驗并不是很好,單一頭控的交互,或者說借助觸控面板完成的交互并沒有將虛擬現(xiàn)實的沉浸感、存在感特點表達的淋漓盡致,我們在進行VR游戲體驗,觀看VR視頻時不由自主的還是想用雙手觸摸、控制場景內(nèi)的事物。
由于缺少交互,從設(shè)備到內(nèi)容上移動VR所帶給我們的體驗并不是很好,單一頭控的交互,或者說借助觸控面板完成的交互并沒有將虛擬現(xiàn)實的沉浸感、存在感特點表達的淋漓盡致,我們在進行VR游戲體驗,觀看VR視頻時不由自主的還是想用雙手觸摸、控制場景內(nèi)的事物。
手勢識別技術(shù)是目前移動VR發(fā)展的一個出破口,如何將這項技術(shù)植入到移動VR設(shè)備中是很多硬件廠商在探索的。不過,在此之前有廠商已經(jīng)推出相關(guān)外設(shè)手勢交互模組,借助這些外設(shè)用戶可以使用主流移動VR頭顯獲得手勢交互體驗,但相應(yīng)的用戶除了購買VR眼鏡還需要單獨購買一個外設(shè),而購買外設(shè)所需投入的成本或許要遠高于買一個VR眼鏡的成本,對于VR深度愛好者或許是值得的,但對于VR入門級消費者這顯然并不是最佳解決方案。
移動VR的一大特點就是必須使用智能手機,如果借用手機攝像頭讓用戶獲得手勢交互,那這部分的成本幾乎為零,這正是英梅吉CEO朱郁叢帶領(lǐng)團隊在做的事情,而且現(xiàn)在HandCV手勢識別系統(tǒng)與SDK已經(jīng)開發(fā)完成。
HandCV是什么?
HandCV是一款基于單目攝像頭的手勢交互系統(tǒng)及手勢識別SDK。它基于普通單目攝像頭,通過軟件算法來實現(xiàn)手勢識別,不需要額外購買新的體感設(shè)備即可完成手勢交互操作。Hand CV主要面向基于智能機的移動VR/AR,深度適配VR/AR環(huán)境。
HandCV能實現(xiàn)哪些手勢交互?
Hand CV主要滿足用戶的輕交互需求,基于手機的攝像頭,實現(xiàn)食指單擊、彎曲、捏合拖動、握拳等基本手勢識別。滿足用戶在移動VR/AR設(shè)備上的菜單點選、音樂及視頻播放、小游戲等輕度交互需求。
關(guān)于Hand CV手勢交互系統(tǒng)的更多信息VR.cn對北京英梅吉科技有限公司CEO朱郁叢先生進行了專訪,以下是VR菌整理的采訪文字。
介紹一下HandCV手勢交互系統(tǒng)
朱郁叢:Hand CV是我們推出的一項解決移動AR和VR交互上產(chǎn)品,因為目前在移動AR和VR上交互已經(jīng)變成了一個門檻,也是內(nèi)容創(chuàng)作上的門檻。因為現(xiàn)在在整個交互條件下,整個產(chǎn)業(yè)當(dāng)中,在基于現(xiàn)有的主流交互方式,通過陀螺儀去控制頭部的轉(zhuǎn)動,然后懸停,三秒你能完成的一個觸發(fā),在這種交互方式上是沒辦法做到更多的豐富的內(nèi)容創(chuàng)作,像什么連連看這種簡單的游戲都做不到,因為太慢了,它破壞了整個體驗的連貫性。還有就是觀看VR視頻,以現(xiàn)有的交互方式連一個拖拽這種簡單的動作都做不到,更不要去談其他的交互方式。
所以現(xiàn)在無論是國內(nèi)廠商還是國外廠商大家都在努力做一些交互方式上的新定義,像谷歌今年五月份也推出了daydream這一套標(biāo)準,雖然最終沒有拿出來,但它也說可以用手柄、控制器的這種方式來進行交互,但控制器其實是有局限性的,首先它在移動AR上是沒辦法實現(xiàn)的,那在移動VR上,首先它會增加成本,那對于用戶來說,增加一塊錢的成本,這都是一個很大的門檻,用戶為什么要去買呢?對于廠商來說,也是增加了銷售上的一個門檻,同時從使用上來講,用戶不會一天到晚把控制器放在身上,而且還是放倆個,還有供電問題,所以它能解決一部分交互上的問題,但是同時它又引申出新的問題出來,所以它不是一個非常完美的方案。
我們需要的是能夠隨時隨地、隨身進行操作的交互方式,比如說用手這是一種很好的方案。所以,現(xiàn)在很多國際國內(nèi)同期的一些廠商像Leap Motion,大家都在做手勢識別交互。但可以看到,這些廠商在做手勢識別時都有一個前提條件,都需要外置攝像頭,對于移動VR來講,這就是個門檻,用戶需要花好幾百塊錢去買一個外置攝像頭,像一些國際廠商的這些外置攝像頭可能還更貴,最貴的可能要一千多美金。那對于一個主流的移動VR來講,平均售價百十來塊錢,再讓用戶花幾百塊或者幾千塊額外購買外設(shè),我覺得這種可能性不是很大。所以,如果在加上一個定義的話,希望有一種能隨時隨地隨身進行手勢交互的方式,并且以最便宜,甚至是免費的方案去做,所以我們當(dāng)時就選擇了做單目攝像頭,手機自帶的攝像頭就能去做這種手勢交互的產(chǎn)品。
這也是我們推出HandCV的一個初衷,目前我們在跟廠商接觸,其實一個產(chǎn)品它能夠推廣,一方面是有用戶上的基礎(chǔ),用戶不需要購買外設(shè),只需要有手機你就能體驗HandCV提供的手勢交互,用戶基礎(chǔ)有了,所以廠商就不用去擔(dān)心。如果用像類似Leap Motion這種開發(fā)來說的話,它要考慮這種外置攝像頭有多少用戶呢?它沒有用戶,我認為以這種交互方式去開發(fā)一種產(chǎn)品風(fēng)險會很大。而HandCV基于單目攝像頭,天然的只要是移動用戶都可以來使用,這一點的市場空間是非常龐大的,它繼承了的是原來移動互聯(lián)網(wǎng)這部分用戶,市場基礎(chǔ)或者說是用戶基礎(chǔ)優(yōu)勢非常明顯。
這套系統(tǒng)最大的優(yōu)勢是什么?
朱郁叢:因為基于手機自帶的攝像頭是免費的,用戶就可以天然的來使用,不需要購買外設(shè)。那另外從產(chǎn)品性能上來說,我們在極暗環(huán)境下也可以做到識別,這是我們在算法上面上的一個優(yōu)勢。從功耗上來說,拿我們測試的機器,A8,1.4這種處理器,我們系統(tǒng)的占有率只有百分之八到百分之十,這個是比較低的。
為什么選擇做移動VR?
朱郁叢:因為其實從市場的調(diào)研報告可以能看出VR是未來,vive很好,我們樓上就有vive,但問題是它的用戶體驗成本太高,平均要去體驗vive至少要花一萬五以上。而對于大部分用戶來說,它本質(zhì)上還是一個娛樂工具,花巨資買一套娛樂系統(tǒng)的話,其實對很多人來說的話還是比較高昂的代價,而且它對場地還有要求。
所以從這個角度來,就與此前我看到一份來自HTC的調(diào)研報告一樣,vive跟rift的整個市場占有率也就是百分之三點幾,其余大部分都是移動VR。在我們看來,移動VR包括了基于手機的這種VR產(chǎn)品,同時一體機也是屬于移動VR這部分。那對于一體機我們覺得市場是很有限的,它是一個比價尷尬的定位,與移動VR有很多沖突的點,因為他的計算性能是一樣的,只是做了一些優(yōu)化。
單目跟深度攝像頭的區(qū)別在哪里?
朱郁叢:我覺得最大的區(qū)別就是用戶,用戶不需要去購買一個額外的外置攝像頭,我覺得這是一個最大的區(qū)別,而這個區(qū)別其實也是一個門檻,一個極高無比的門檻。用戶不需要花錢去購買,就天然的具備了我們現(xiàn)有用戶的市場在這邊。如果用戶需要去購買攝像頭的,那相信也會是一些開發(fā)者去買,只有形成一定規(guī)模的消費者需求這個攝像頭才能形成它這一個細分市場,那對于開發(fā)者來說,他不會去針對一個還沒有形成規(guī)模的市場去開發(fā)產(chǎn)品,也就是說它缺乏內(nèi)容的支撐。
從產(chǎn)品定位上來講,我覺得深度攝像頭其實是有點尷尬的,因為什么?我們先將VR分開定義,一個是移動VR一個是重度VR。重度VR我們理解成主機型的這種VR的體驗,對于輕度VR主要是日常的基礎(chǔ)交互,還有小游戲。
輕度VR其實我們現(xiàn)在用單目就能夠解決,解決所有的訴求。那重度VR,比如將自己的手映射到游戲里面進行交互,我們可以將其定義為重度交互。那么,如果都使用基于計算機視覺的方案是不適合的,因為計算機視覺有局限性,必須捕捉到手才行,但在實際的操作當(dāng)中有些動作是超出你的FOV范圍的,比方說我的手高舉時,你都看不到我的手,還有一些動作幅度對速度要求比較大的。所以,這些手勢交互不管你是用任何CV產(chǎn)品都是沒辦法做到的,或者說做到很好的體驗。但是,如果你是用體感,用手柄或是用控制器來去做,就可以花很少的代價來實現(xiàn)我剛剛說的那些重度VR交互。所以,我覺得深度攝像頭的定位,它的市場是比較尷尬的。做輕度,其實用單目攝像頭就可以解決,那做重度的,我感覺可以用控制器、手柄,市場成本更低,市場更好,做的更穩(wěn)定。
這套系統(tǒng)什么時候能應(yīng)用到手機上?
朱郁叢:我們現(xiàn)在跟各個細分領(lǐng)域比較知名的企業(yè)都已經(jīng)簽完了戰(zhàn)略合作協(xié)議,像優(yōu)酷VR,UTOVR,VR熱播都已經(jīng)簽完協(xié)議,我們SDK一出來就會在他們上進行植入。其實按照我們現(xiàn)在的迭代,大概在9月20號我們IOS版本的SDK先會出來,在國慶之后會出安卓版的SDK。SDK是原生的,包括對Unity的支持,因為大部分游戲都是用Unity來開發(fā)的,大部分內(nèi)容也都可以去使用。而9月初的測試版我們不會向所有市場開放,只提供給行業(yè)知名客戶去使用,因為我們還要去做修正和迭代,自己還要去做一個手勢庫,做一些優(yōu)化,做一些深度學(xué)習(xí)來去優(yōu)化我們得算法,真正應(yīng)用到手機上應(yīng)該會在12月份。
未來如何升級迭代?
朱郁叢:分成兩塊,一塊是從技術(shù)層面上,我們九月份SDK會推出來,這是一個測試版,我們會讓行業(yè)的一些知名的廠商讓他們幫我們?nèi)プ鰷y試,先去使用,然后我們會根據(jù)他的反饋結(jié)果來做一些調(diào)整。調(diào)整也是在兩個層面,一個是在收集了數(shù)據(jù)以后,我們優(yōu)化算法,優(yōu)化我們對于一些環(huán)境的留檔性的一些提升。還有一個就是對于手勢優(yōu)化,因為我們現(xiàn)在支撐點、觸、按等這些手勢,在游戲當(dāng)中如何更好的融合這些手勢交互,交互的這種體驗,我們要重新去設(shè)計,重新去優(yōu)化。這個是我們很重要一點。另外一個,在優(yōu)化層面,我們在建一套十萬張手勢圖片庫這個規(guī)模的庫,來去做深度學(xué)習(xí)的算法訓(xùn)練,這個也是在年底去完成,現(xiàn)在也正在做這個工作。所以今年年底我們的手勢交互會達到一個比較穩(wěn)定的狀態(tài)。
交互技術(shù)對內(nèi)容創(chuàng)作的影響
朱郁叢:現(xiàn)在交互本身已經(jīng)變成了一個內(nèi)容創(chuàng)作上的瓶頸,所以說我們單目攝像頭的手勢識別和交互一定能驅(qū)動整個行業(yè)內(nèi)容創(chuàng)作,變的更豐富。游戲就是一個典型,最近有很多的開發(fā)商來找過我們。因為現(xiàn)在交互方式上的匱乏已經(jīng)影響到他們內(nèi)容上的創(chuàng)作,他不知道該怎么辦,有一些好的創(chuàng)意都沒辦法去實現(xiàn),做不了。所以我們的手勢交互系統(tǒng)對他們有很大的意義,這個意義不僅局限于國內(nèi),對海外市場也是一樣,我們在下半年包括明年年初主攻國內(nèi)市場與北美市場。
未經(jīng)授權(quán),禁止轉(zhuǎn)載,違者必將追究法律責(zé)任。
文章點評
相關(guān)閱讀
-
VR小說改編電影了!《游戲戰(zhàn)爭》公開頭顯設(shè)計
一部以VR為主題、名叫《戰(zhàn)爭游戲》的小說被大監(jiān)督斯皮爾伯格拍攝成電影,并且將在明年上映。原作小說在美國亞馬遜上獲得了4.6分的高評分,它將被改編成怎樣激動人心的電影呢?讓我們拭目以待吧!...
- 解壓利器!卡普空讓我們在VR中化身怪獸
- 不用攝像頭,這個VR頭盔如何追蹤面部表情
- 用腳玩VR! 腳用VR控制器將出展東京電玩展
- 全景 Waiting for Love
- 誤入“仙境” 景觀變幻無窮