上世紀(jì)八十年代,蘋果公司推出了世界上第一臺(tái)將用戶界面與鼠標(biāo)結(jié)合起來(lái)的個(gè)人電腦,隨后微軟發(fā)布Windows 1.0操作系統(tǒng),由于非專業(yè)用戶不再需要使用代碼和指令與機(jī)器交互,從而極大降低了使用門檻,促使個(gè)人電腦業(yè)務(wù)在全球迅速得到普及。上世紀(jì)九十年代,以雅虎、谷歌等為代表的互聯(lián)網(wǎng)企業(yè)走向舞臺(tái)中央,其開發(fā)的搜索引擎技術(shù)打破信息孤島,成為用戶使用電腦的全新接口,使得個(gè)體非常便捷地觸達(dá)全球各類資源,極大拓展了交互的邊界。本世紀(jì)初,智能手機(jī)的普及開啟移動(dòng)互聯(lián)時(shí)代的到來(lái),讓人機(jī)交互進(jìn)一步突破了物理空間的限制,交互質(zhì)量和體驗(yàn)得到極大改善。以上三次交互方式的變革,每次都觸發(fā)了萬(wàn)億的市場(chǎng)規(guī)模和全新用戶需求,成為智能科技推動(dòng)經(jīng)濟(jì)進(jìn)步的重要浪潮。
面向更加擬人化、自然化、數(shù)字化的人機(jī)交互需求,跨媒體共情智能人機(jī)對(duì)話系統(tǒng)正在引發(fā)新一輪的交互方式變革。提起人機(jī)對(duì)話這個(gè)詞,可能稍顯陌生,但說(shuō)起人機(jī)對(duì)話技術(shù)的應(yīng)用,其實(shí)已經(jīng)走進(jìn)我們的生活。比如手機(jī)語(yǔ)音助手、車載對(duì)話機(jī)器人、對(duì)話導(dǎo)覽機(jī)器人、智能語(yǔ)音音響、智慧客服等,在使得用戶交互更加便捷的同時(shí),也為企業(yè)節(jié)約了大量的人工成本。國(guó)務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》中指出,面向國(guó)家重大戰(zhàn)略需求,多媒體信息理解的人機(jī)對(duì)話系統(tǒng)是需要突破的關(guān)鍵共性技術(shù)。中國(guó)人工智能學(xué)會(huì)發(fā)布的《中國(guó)自然語(yǔ)言處理白皮書》中指出,人機(jī)對(duì)話是自然語(yǔ)言處理技術(shù)最為典型的應(yīng)用之一。中國(guó)工程院院士李德毅認(rèn)為,機(jī)器人具備語(yǔ)音交互的能力是行業(yè)高質(zhì)量發(fā)展的關(guān)鍵。作為業(yè)界的代表,科大訊飛董事長(zhǎng)劉慶峰認(rèn)為,語(yǔ)音將成為最重要的人機(jī)交互方式。
訓(xùn)練一個(gè)能與個(gè)體進(jìn)行自然交互的對(duì)話系統(tǒng)絕非易事,因?yàn)閷?duì)話場(chǎng)景的類別無(wú)法窮盡,對(duì)話生成的可能性也是無(wú)限的,對(duì)話系統(tǒng)面對(duì)的用戶口音、背景都不盡相同,這種巨大的不確定性以及如何讓機(jī)器擁有常識(shí),都為技術(shù)的泛化能力帶來(lái)了巨大的挑戰(zhàn),之江實(shí)驗(yàn)室的科研人員和工程師正在嘗試攻克這些難題。
大規(guī)模數(shù)據(jù)集是深度學(xué)習(xí)模型訓(xùn)練的基礎(chǔ),中國(guó)科學(xué)院院士張鈸指出,大數(shù)據(jù)對(duì)人機(jī)對(duì)話模型水平提升有重要意義。目前之江實(shí)驗(yàn)室探索構(gòu)建了世界上規(guī)模最大的多模態(tài)對(duì)話數(shù)據(jù)集,以及1800分鐘面向中文安撫對(duì)話的語(yǔ)音合成數(shù)據(jù)集,2000分鐘針對(duì)“語(yǔ)音-文本-圖像”三個(gè)模態(tài)的情感識(shí)別數(shù)據(jù)集,數(shù)據(jù)的絕對(duì)量增長(zhǎng)有力地促進(jìn)了深度學(xué)習(xí)工具和技術(shù)的發(fā)展。在多輪對(duì)話生成方面,之江實(shí)驗(yàn)室攻克了多輪情感對(duì)話難題,基于預(yù)訓(xùn)練語(yǔ)言模型、主題自適應(yīng)增強(qiáng)模型、檢索與生成雙驅(qū)動(dòng)策略,使長(zhǎng)時(shí)間對(duì)話情況下主題識(shí)別率達(dá)到85%以上、回復(fù)滿意度達(dá)到75%以上,使用測(cè)試集數(shù)據(jù)平均對(duì)話輪次達(dá)到10輪,使用實(shí)際場(chǎng)景的廣泛主題測(cè)試數(shù)據(jù)的平均對(duì)話輪次達(dá)到5輪以上。
與此同時(shí),為了實(shí)現(xiàn)更有溫度的人機(jī)交互,之江實(shí)驗(yàn)室針對(duì)擬人化對(duì)話生成中的共情交互瓶頸,自主研發(fā)了深度語(yǔ)境理解的擬人化對(duì)話生成技術(shù)。該技術(shù)基于個(gè)性化的多維對(duì)話情境表征輸入,結(jié)合對(duì)話主題內(nèi)容、用戶情感狀態(tài)等多維信息進(jìn)行深度對(duì)話語(yǔ)境理解,同時(shí)突破基于情感交互策略的多模型回復(fù)生成、回復(fù)文本排序及情感語(yǔ)音合成等技術(shù),使得機(jī)器與人的交互不再冰冷,更加友好而智慧。
在疫情期間,對(duì)話交互這種無(wú)接觸的交互方式得到了較大的推廣,除了在市長(zhǎng)熱線與防疫咨詢平臺(tái)的應(yīng)用以外,其在電梯操控、無(wú)人超市等公共場(chǎng)所的應(yīng)用,在一定程度上減少了傳染病接觸帶來(lái)的交叉感染,有助于提升公共衛(wèi)生防護(hù)水平。同時(shí),智能人機(jī)交互系統(tǒng)還可以廣泛應(yīng)用于城市大腦統(tǒng)一服務(wù)平臺(tái)、AI心理醫(yī)生、老年陪護(hù)、智能家居、智能車載、智慧高鐵、隨身設(shè)備等領(lǐng)域,有助于顯著提升智慧城市、智慧交通、智慧公共服務(wù)等領(lǐng)域的運(yùn)行效率和管理水平,對(duì)降低對(duì)外依存度、提升自主可控能力,以及對(duì)培育未來(lái)產(chǎn)業(yè)和孕育新經(jīng)濟(jì)增長(zhǎng)點(diǎn)具有重要意義。(文/李太豪 裴冠雄)
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,宣傳國(guó)家科技政策,展示國(guó)家科技形象,增強(qiáng)國(guó)家科技軟實(shí)力,參與國(guó)際科技輿論競(jìng)爭(zhēng),提高國(guó)際科技話語(yǔ)權(quán),并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本網(wǎng)文章及圖片侵犯了您的版權(quán),請(qǐng)與我們聯(lián)系,我們將第一時(shí)間刪除。