百度DuLight 盲人的科技之眼
時間:2015-10-15 來源:m.alazami.com.cn 作者:T恤衫定做
點(diǎn)擊:次
今天是“國際盲人節(jié)”,自1984年設(shè)立至今,包括我國在內(nèi)的世界各國都會為盲人群體舉辦各種活動,以體現(xiàn)對他們的關(guān)懷。今年的盲人日前夕,百度推出的DuLight(百度小明)展示了用科技改變盲人生活的創(chuàng)想:在一片黑暗中,只有靠觸摸才能感知世界的日子或?qū)⑦^去,“一個24歲面帶微笑的女性”“一把漂亮的紅色椅子”“100%純果汁”……借助這雙科技的眼睛,生活中的物品、場景從圖像轉(zhuǎn)變?yōu)檎Z音,幫助盲人朋友越來越清晰地“看見”這個世界。
背景 將盲人生活需求轉(zhuǎn)化為推動力
早在2007年,百度公司便推出百度盲道:一個為方便視障人士上網(wǎng)閱讀信息、參與社區(qū)互動、聽歌、訪問互聯(lián)網(wǎng)上其他相關(guān)網(wǎng)站的特殊入口。在這項(xiàng)功能中,百度新聞搜索、百度網(wǎng)頁搜索、百度MP3搜索、百度貼吧、百度知道、百度百科、Hao123網(wǎng)址導(dǎo)航這7項(xiàng)主要搜索服務(wù)升級為盲道版,在頁面設(shè)計(jì)等方面充分考慮視障人士的需求,方便他們使用。
2013年,盲人開發(fā)團(tuán)隊(duì)的負(fù)責(zé)人曹軍致信百度CEO李彥宏,希望得到百度的資金和技術(shù)支持,開發(fā)一款盲人讀屏軟件。在百度團(tuán)隊(duì)的幫助下,曹軍的公司成功研發(fā)出了幫助盲人使用手機(jī)的讀屏軟件。
在和盲人的接觸中,百度公益的工作人員發(fā)現(xiàn)了譬如人民幣不容易通過盲文識別、不能分辨包裝大小相似的藥盒等更多的制約盲人日常生活的問題,希望通過科技和人工智能得以解決。因此百度公益聯(lián)合百度研究院、IDL深度學(xué)習(xí)實(shí)驗(yàn)室,將這些盲人實(shí)實(shí)在在的生活需求轉(zhuǎn)化為推動力,試圖通過圖像識別、大數(shù)據(jù)等技術(shù),打造出一款專門服務(wù)于盲人的硬件。
努力沒有白費(fèi),今年9月8日,百度推出了DuLight,展示了百度用科技改變盲人生活的創(chuàng)想。技術(shù)的進(jìn)步為DuLight的誕生提供了基礎(chǔ),除了原有的獨(dú)立手機(jī)端應(yīng)用,DuLight加入了輕量級的新型硬件,成功完成向全系列盲人個人助理操作系統(tǒng)的轉(zhuǎn)變。至此,它將作為盲人新的生活助理和新的搜索服務(wù)的發(fā)起入口。
功能 打造盲人的日常生活私人助理
依托“百度大腦”的圖像識別、人臉識別、語音識別以及深度學(xué)習(xí)等相關(guān)核心技術(shù),DuLight被打造成盲人的日常生活私人助理,幫助盲人朋友了解身邊的環(huán)境、進(jìn)行物品識別、人物辨別,以及錢幣識別等。除此之外,它還可以協(xié)助盲人在緊急或特殊情況下發(fā)起實(shí)時的遠(yuǎn)程視頻協(xié)助。
面對純牛奶和果汁等無法通過觸摸辨別的商品,通過DuLight的圖像識別功能,只需對準(zhǔn)物品、進(jìn)行拍照操作,DuLight便能夠準(zhǔn)確快速地將物品信息傳遞給盲人;紙幣大小差別不大,盲文又不夠清晰,弄不清手里到底是多少錢,通過圖像識別功能,即使只掃到錢幣的一角,DuLight也能準(zhǔn)確地報出錢幣的面值,幫助盲人朋友購物付款;老朋友已經(jīng)走到面前卻不知道是誰,很難通過聲音辨別對面的陌生人的大致年齡和身份,這些困擾在DuLight的幫助下都可以順利解決。
而在一些復(fù)雜的場景中,例如獨(dú)自在家時需要找到特定的藥品或需要在路況復(fù)雜的地段過馬路時,盲人朋友總是無所適從,而今,通過DuLight,可以一鍵發(fā)起遠(yuǎn)程視頻協(xié)助,尋求朋友的幫助,提供幫助者在接受求助后,將獲得盲人朋友同樣的視角,實(shí)時語音協(xié)助解決問題。
除此之外,在產(chǎn)品設(shè)計(jì)上,通用型界面設(shè)計(jì)與界面輔助工具相互配合,便于視弱群體更好地辨識屏幕上的文字與圖像。DuLight還實(shí)現(xiàn)了盲人友好性語音的交互命令與對話,根據(jù)用戶需求和語言命令執(zhí)行對應(yīng)的功能,為用戶提供可調(diào)節(jié)的語音播報速度,人性化十足。觸摸式硬件功能識別的工業(yè)設(shè)計(jì)也使得硬件外觀的紋理設(shè)計(jì)更加合理,便于盲人通過觸摸調(diào)整取景角度。
據(jù)百度企業(yè)社會責(zé)任經(jīng)理盧健介紹稱,DuLight目前仍處于初期研發(fā)階段,后期將通過不斷的迭代加入更多先進(jìn)的技術(shù)和功能,以便更好地為盲人群體服務(wù)。
1.圖像識別
圖像識別技術(shù)是指,通過電腦辨識圖像內(nèi)容并提取語義信息的過程,典型的任務(wù)包括物體識別、物體檢測、圖像分類標(biāo)注等。它在圖像類數(shù)據(jù)的智能化分析管理中扮演著至關(guān)重要的角色。
百度通過長期的努力,已經(jīng)構(gòu)筑了一套比較完整的圖像識別系統(tǒng),除了能夠有效地處理特定物體的檢測識別(如人臉、文字或是商品),還實(shí)現(xiàn)了圖像的分類標(biāo)注、圖文綜合理解的對話型識別,以及主觀圖像質(zhì)量評估等應(yīng)用。
2.人臉識別
人與人之間大量的互動讓人臉識別成了最為實(shí)用的圖像識別細(xì)分領(lǐng)域。相比于無領(lǐng)域限制的圖像識別,聚焦在人臉上的識別技術(shù)顯然能夠做到更加精準(zhǔn)與高效。
百度現(xiàn)有的人臉識別技術(shù)已經(jīng)具備了很強(qiáng)的識別用戶的能力,這項(xiàng)技術(shù)可以對用戶的性別、年齡、面部表情等特征進(jìn)行辨識,還可以區(qū)分不同的用戶。
3.語音識別
Dulight采用領(lǐng)先的DNN聲學(xué)模型,使得語音識別更加精準(zhǔn)。基于大量語言模型建立起來的語音識別系統(tǒng),能夠?qū)崿F(xiàn)更好的人機(jī)互動。海量文本語料做基礎(chǔ),同時對文本庫進(jìn)行實(shí)時更新,提升語音識別的效率和質(zhì)量。
本頁關(guān)鍵詞:百度,DuLight,盲人的科技之眼