99色在线视频-99色综合-99视频精品全国免费-99视频全部免费-能在线观看的一区二区三区-嗯!啊!使劲用力在线观看

谷歌新研究:讓失語者在視頻會議中自然使用手語

VR/AR
2020
10/10
14:34
新浪VR
分享
評論

來源:新浪VR

視頻會議對所有人開放,那也應(yīng)該包括使用手語進(jìn)行交流的用戶,但由于大多數(shù)視頻會議系統(tǒng)會自動(dòng)跟蹤講話人提示窗口,對于手語交流者而言,他們卻很難輕松有效地進(jìn)行溝通。

因此,在視頻會議中采用實(shí)時(shí)手語檢測的場景變得十分有挑戰(zhàn)性,系統(tǒng)需要使用大量視頻反饋?zhàn)鳛檩斎脒M(jìn)行分類,這使得任務(wù)計(jì)算變得十分繁重。某種程度上,這些挑戰(zhàn)的存在也導(dǎo)致有關(guān)手語檢測的研究很少。

近日在ECCV 2020和SLRTP 2020全球頂會上,谷歌的研究團(tuán)隊(duì)提出了一個(gè)實(shí)時(shí)手語檢測模型,并詳述了該模型將如何用于視頻會議系統(tǒng)中識別“發(fā)言人”的過程。

1、設(shè)計(jì)思路

為了主動(dòng)適配主流視頻會議系統(tǒng)所提供的會議解決方案,研究團(tuán)隊(duì)采取了一種輕量型、即插即用的模型。該模型占用CPU小,以最大程度降低對客戶端通話質(zhì)量的影響。為了減少輸入的維度,采用從視頻中分離所需信息,對每個(gè)幀進(jìn)行分類。

“由于手語涉及用戶的身體和手兩部分,我們先運(yùn)行了人體姿態(tài)估計(jì)模型PoseNet,這樣可將輸入從整個(gè)高清圖像大幅分減到用戶身體上的一小部分,如眼睛、鼻子、肩膀、手等關(guān)鍵特征點(diǎn)(landmarks)。然后,我們再將這些關(guān)鍵特征點(diǎn)用于計(jì)算每一幀光流(Optical Flow),從而在不保留用戶特定信息的前提下就能量化用戶的姿態(tài)特征。每個(gè)姿態(tài)都通過人肩膀?qū)挾冗M(jìn)行歸一化,以確保模型在距離攝像頭一定距離內(nèi)注意到用戶的手勢。最后,將光流通過視頻的幀速率進(jìn)行歸一化,再傳遞給該模型。”

為了測試這種方法的有效性,研究團(tuán)隊(duì)采用了德語手語語料庫(DGS),該語料庫包含人體手勢的長視頻(含跨度注釋)。基于訓(xùn)練好的線性回歸模型基線,使用光流數(shù)預(yù)測人體手勢何時(shí)發(fā)出。該模型基線可達(dá)到80%的準(zhǔn)確度,每一幀僅需要約3μs(0.000003秒)的處理時(shí)間即可完成。通過將前50個(gè)幀的光流作為該模型的上下文,最終達(dá)到83.4%的準(zhǔn)確度。

團(tuán)隊(duì)使用了長短期記憶網(wǎng)絡(luò)(LSTM)架構(gòu),該模型可實(shí)現(xiàn)的91.5%的準(zhǔn)確度,每一幀的處理時(shí)間約為3.5毫秒(0.0035秒)。

2、概念驗(yàn)證

在實(shí)際的場景中,有了運(yùn)行完備的手語檢測模型僅是第一步,團(tuán)隊(duì)還需要設(shè)計(jì)一種方法來出發(fā)視頻會議系統(tǒng)的主動(dòng)式揚(yáng)聲器功能。團(tuán)隊(duì)開發(fā)了一款輕量級的在線手語檢測演示demo,可以連接到任何視頻會議系統(tǒng)上,并將手語交流者設(shè)置為“發(fā)言人”。

當(dāng)手勢檢測模型確定用戶正在進(jìn)行手語交流時(shí),它會通過虛擬音頻電纜傳遞超聲音頻,任何視頻會議系統(tǒng)都可檢測到該音頻,就好像手語交流者正在“講話”一樣。音頻以20kHz傳輸,通常在人類聽覺范圍之外。因?yàn)橐曨l會議系統(tǒng)通常將音頻的音量作為檢測是否正在講話的標(biāo)準(zhǔn),而不是檢測語音,所以應(yīng)用程序會誤以為手語交流者正在講話。

目前這款模型的在線視頻演示源代碼已經(jīng)公布在GitHub上。

3、演示過程

在視頻中,研究團(tuán)隊(duì)演示了如何使用該模型。視頻中的黃色圖表反映了模型在檢測到手語交流時(shí)的確認(rèn)值。當(dāng)用戶使用手語時(shí),圖表值將增加到接近100,當(dāng)用戶停止使用手語時(shí),圖表值將降低至0。

為了進(jìn)一步驗(yàn)證該模型效果,團(tuán)隊(duì)還進(jìn)行了一項(xiàng)用戶體驗(yàn)反饋調(diào)查。調(diào)研要求參與者在視頻會議期間使用該模型,并像往常一樣進(jìn)行手語交流。他們還被要求互相使用手語,以檢測對說話人的切換功能。反饋結(jié)果是,該模型檢測到了手語,將其識別為可聽見的語音,并成功識別了手勢參與人。

THE END
廣告、內(nèi)容合作請點(diǎn)擊這里 尋求合作
VR
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點(diǎn)和立場。

相關(guān)熱點(diǎn)

本月,微軟發(fā)布Surface的新品(全新配置Surface Pro X、全新的Surface Laptop Go)后,偷偷做了一個(gè)小調(diào)整,直接從官網(wǎng)上刪除了Surface Neo字樣,這也意味著這款產(chǎn)品被無限推遲。
VR
快充協(xié)議是充電器與設(shè)備溝通握手所需的“語言”,只有正確“對話”后,才可以“握手”成功,進(jìn)行快速充電。我們一步一步來看不同的快充協(xié)議是怎樣工作的。
VR
近日,浙江省杭州市公安局反欺詐中心最新預(yù)警,“安全防護(hù)” APP 不安全。
VR
終于,有使用者正式在 Apple TV 4K 里看到 YouTube 4K 內(nèi)容播放的選項(xiàng),讓這款機(jī)頂盒變得更名符其實(shí)。
VR
對于自家的原生 Android 系統(tǒng),Google 一直有利用快速更新、抓 bug 獎(jiǎng)勵(lì)等手段來持續(xù)提升其安全性。
VR

相關(guān)推薦

1
3
主站蜘蛛池模板: 亚洲日本一区二区三区在线 | 日韩精品在线观看免费 | 亚洲伦理网站 | 插菊花综合 | 成人在线视频免费观看 | 黑人videovideosex 黑人操日本人视频 | 国产高清精品自在久久 | 精品导航第一导航 | 免费看黄的视频网站 | 最近更新2019中文国语字幕 | 日韩不卡一区二区 | 欧美人与牲动交xxxxbbbb | 九九自拍视频 | 色老头在线观看精品 | www我要色综合com | 亚洲精品成人网久久久久久 | 999影院成 人在线影院 | 在线观看黄色一级片 | 免费黄色网址在线观看 | 免费观看黄a一级视频 | 欧美另类第一页 | 在线观看精品视频网站www | 久久精品国产曰本波多野结衣 | 日韩中文字幕高清在线专区 | 本道在线观看 | 国产123区在线视频观看 | 日日噜噜夜夜狠狠视频欧美人 | 欧美一级黄色片免费看 | 琪琪午夜伦埋影院77 | 成人在线免费看片 | 欧美一区二区免费 | 欧美在线播放成人免费 | 久操社区 | 欧美五月 | 欧美伊人久久综合网 | 大黄网站在线观看 | 欧美va亚洲va国产综合 | 精品成人免费一区二区在线播放 | 日本中文字幕在线视频 | 天天看片天天爽_免费播放 天天看片夜夜爽 | 午夜刺激视频 |