今天是“國(guó)際盲人節(jié)”,自1984年設(shè)立至今,包括我國(guó)在內(nèi)的世界各國(guó)都會(huì)為盲人群體舉辦各種活動(dòng),以體現(xiàn)對(duì)他們的關(guān)懷。今年的盲人日前夕,百度推出的DuLight(百度小明)展示了用科技改變盲人生活的創(chuàng)想:在一片黑暗中,只有靠觸摸才能感知世界的日子或?qū)⑦^(guò)去,“一個(gè)24歲面帶微笑的女性”“一把漂亮的紅色椅子”“100%純果汁”……借助這雙科技的眼睛,生活中的物品、場(chǎng)景從圖像轉(zhuǎn)變?yōu)檎Z(yǔ)音,幫助盲人朋友越來(lái)越清晰地“看見(jiàn)”這個(gè)世界。
背景 將盲人生活需求轉(zhuǎn)化為推動(dòng)力
早在2007年,百度公司便推出百度盲道:一個(gè)為方便視障人士上網(wǎng)閱讀信息、參與社區(qū)互動(dòng)、聽(tīng)歌、訪問(wèn)互聯(lián)網(wǎng)上其他相關(guān)網(wǎng)站的特殊入口。在這項(xiàng)功能中,百度新聞搜索、百度網(wǎng)頁(yè)搜索、百度MP3搜索、百度貼吧、百度知道、百度百科、Hao123網(wǎng)址導(dǎo)航這7項(xiàng)主要搜索服務(wù)升級(jí)為盲道版,在頁(yè)面設(shè)計(jì)等方面充分考慮視障人士的需求,方便他們使用。
2013年,盲人開(kāi)發(fā)團(tuán)隊(duì)的負(fù)責(zé)人曹軍致信百度CEO李彥宏,希望得到百度的資金和技術(shù)支持,開(kāi)發(fā)一款盲人讀屏軟件。在百度團(tuán)隊(duì)的幫助下,曹軍的公司成功研發(fā)出了幫助盲人使用手機(jī)的讀屏軟件。
在和盲人的接觸中,百度公益的工作人員發(fā)現(xiàn)了譬如人民幣不容易通過(guò)盲文識(shí)別、不能分辨包裝大小相似的藥盒等更多的制約盲人日常生活的問(wèn)題,希望通過(guò)科技和人工智能得以解決。因此百度公益聯(lián)合百度研究院、IDL深度學(xué)習(xí)實(shí)驗(yàn)室,將這些盲人實(shí)實(shí)在在的生活需求轉(zhuǎn)化為推動(dòng)力,試圖通過(guò)圖像識(shí)別、大數(shù)據(jù)等技術(shù),打造出一款專門(mén)服務(wù)于盲人的硬件。
努力沒(méi)有白費(fèi),今年9月8日,百度推出了DuLight,展示了百度用科技改變盲人生活的創(chuàng)想。技術(shù)的進(jìn)步為DuLight的誕生提供了基礎(chǔ),除了原有的獨(dú)立手機(jī)端應(yīng)用,DuLight加入了輕量級(jí)的新型硬件,成功完成向全系列盲人個(gè)人助理操作系統(tǒng)的轉(zhuǎn)變。至此,它將作為盲人新的生活助理和新的搜索服務(wù)的發(fā)起入口。
功能 打造盲人的日常生活私人助理
依托“百度大腦”的圖像識(shí)別、人臉識(shí)別、語(yǔ)音識(shí)別以及深度學(xué)習(xí)等相關(guān)核心技術(shù),DuLight被打造成盲人的日常生活私人助理,幫助盲人朋友了解身邊的環(huán)境、進(jìn)行物品識(shí)別、人物辨別,以及錢(qián)幣識(shí)別等。除此之外,它還可以協(xié)助盲人在緊急或特殊情況下發(fā)起實(shí)時(shí)的遠(yuǎn)程視頻協(xié)助。
面對(duì)純牛奶和果汁等無(wú)法通過(guò)觸摸辨別的商品,通過(guò)DuLight的圖像識(shí)別功能,只需對(duì)準(zhǔn)物品、進(jìn)行拍照操作,DuLight便能夠準(zhǔn)確快速地將物品信息傳遞給盲人;紙幣大小差別不大,盲文又不夠清晰,弄不清手里到底是多少錢(qián),通過(guò)圖像識(shí)別功能,即使只掃到錢(qián)幣的一角,DuLight也能準(zhǔn)確地報(bào)出錢(qián)幣的面值,幫助盲人朋友購(gòu)物付款;老朋友已經(jīng)走到面前卻不知道是誰(shuí),很難通過(guò)聲音辨別對(duì)面的陌生人的大致年齡和身份,這些困擾在DuLight的幫助下都可以順利解決。
而在一些復(fù)雜的場(chǎng)景中,例如獨(dú)自在家時(shí)需要找到特定的藥品或需要在路況復(fù)雜的地段過(guò)馬路時(shí),盲人朋友總是無(wú)所適從,而今,通過(guò)DuLight,可以一鍵發(fā)起遠(yuǎn)程視頻協(xié)助,尋求朋友的幫助,提供幫助者在接受求助后,將獲得盲人朋友同樣的視角,實(shí)時(shí)語(yǔ)音協(xié)助解決問(wèn)題。
除此之外,在產(chǎn)品設(shè)計(jì)上,通用型界面設(shè)計(jì)與界面輔助工具相互配合,便于視弱群體更好地辨識(shí)屏幕上的文字與圖像。DuLight還實(shí)現(xiàn)了盲人友好性語(yǔ)音的交互命令與對(duì)話,根據(jù)用戶需求和語(yǔ)言命令執(zhí)行對(duì)應(yīng)的功能,為用戶提供可調(diào)節(jié)的語(yǔ)音播報(bào)速度,人性化十足。觸摸式硬件功能識(shí)別的工業(yè)設(shè)計(jì)也使得硬件外觀的紋理設(shè)計(jì)更加合理,便于盲人通過(guò)觸摸調(diào)整取景角度。
據(jù)百度企業(yè)社會(huì)責(zé)任經(jīng)理盧健介紹稱,DuLight目前仍處于初期研發(fā)階段,后期將通過(guò)不斷的迭代加入更多先進(jìn)的技術(shù)和功能,以便更好地為盲人群體服務(wù)。
1.圖像識(shí)別
圖像識(shí)別技術(shù)是指,通過(guò)電腦辨識(shí)圖像內(nèi)容并提取語(yǔ)義信息的過(guò)程,典型的任務(wù)包括物體識(shí)別、物體檢測(cè)、圖像分類標(biāo)注等。它在圖像類數(shù)據(jù)的智能化分析管理中扮演著至關(guān)重要的角色。
百度通過(guò)長(zhǎng)期的努力,已經(jīng)構(gòu)筑了一套比較完整的圖像識(shí)別系統(tǒng),除了能夠有效地處理特定物體的檢測(cè)識(shí)別(如人臉、文字或是商品),還實(shí)現(xiàn)了圖像的分類標(biāo)注、圖文綜合理解的對(duì)話型識(shí)別,以及主觀圖像質(zhì)量評(píng)估等應(yīng)用。
2.人臉識(shí)別
人與人之間大量的互動(dòng)讓人臉識(shí)別成了最為實(shí)用的圖像識(shí)別細(xì)分領(lǐng)域。相比于無(wú)領(lǐng)域限制的圖像識(shí)別,聚焦在人臉上的識(shí)別技術(shù)顯然能夠做到更加精準(zhǔn)與高效。
百度現(xiàn)有的人臉識(shí)別技術(shù)已經(jīng)具備了很強(qiáng)的識(shí)別用戶的能力,這項(xiàng)技術(shù)可以對(duì)用戶的性別、年齡、面部表情等特征進(jìn)行辨識(shí),還可以區(qū)分不同的用戶。
3.語(yǔ)音識(shí)別
Dulight采用領(lǐng)先的DNN聲學(xué)模型,使得語(yǔ)音識(shí)別更加精準(zhǔn)。基于大量語(yǔ)言模型建立起來(lái)的語(yǔ)音識(shí)別系統(tǒng),能夠?qū)崿F(xiàn)更好的人機(jī)互動(dòng)。海量文本語(yǔ)料做基礎(chǔ),同時(shí)對(duì)文本庫(kù)進(jìn)行實(shí)時(shí)更新,提升語(yǔ)音識(shí)別的效率和質(zhì)量。






