最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁 >> 精選經(jīng)驗 >

一個可以提高家庭助理社交智能的框架

2023-02-01 17:54:31 來源: 用戶: 

現(xiàn)有的人工智能代理和機器人只有在被明確指示時才幫助人類。換句話說,他們不會直觀地確定在特定時刻如何提供幫助,而是等待人類告訴他們需要什么幫助。

麻省理工學院(MIT)的研究人員最近開發(fā)了NOPA(神經(jīng)引導的在線概率援助),這是一個框架,可以讓人工代理自主確定如何在不同時間最好地幫助人類用戶。該框架在arXiv上預先發(fā)表的一篇論文中介紹,并計劃在ICRA 2023上發(fā)表,可以使機器人和家庭助理的開發(fā)更具響應性和社交智能性。

“我們有興趣研究可以幫助人類在模擬家庭環(huán)境中完成任務的代理,以便最終這些代理可以成為幫助人們在家中的機器人,”進行這項研究的研究人員之一Xavier Puig告訴Tech Xplore。“為了實現(xiàn)這一目標,一個大問題是如何向這些代理指定我們希望他們幫助我們完成的任務。一種選擇是通過語言描述或演示來指定此任務,但這需要人類用戶進行額外的工作。

普伊格和他的同事最近工作的過度目標是構建人工智能驅(qū)動的代理,可以同時推斷人類用戶試圖解決的任務并適當?shù)貛椭麄?。他們將這個問題稱為“在線觀察和幫助”。

可靠地解決這個問題可能很困難。造成這種情況的主要原因是,如果機器人過早開始幫助人類,它可能無法認識到人類總體上想要實現(xiàn)的目標,因此它對任務的貢獻可能會適得其反。

“例如,如果人類用戶在廚房里,機器人可能會試圖幫助他們將餐具存放在櫥柜中,而人類想要擺桌子,”普伊格解釋說。“但是,如果代理人等待太久才能了解人類的意圖是什么,那么他們可能為時已晚。在上面概述的情況下,我們的框架將允許機器人代理通過遞上盤子來幫助人類,無論這些盤子是做什么用的。

從本質(zhì)上講,研究人員創(chuàng)建的框架不是預測人類用戶試圖解決的單個目標,而是允許代理預測一系列目標。這反過來又允許機器人或人工智能助手以符合這些目標的方式提供幫助,而無需等待太長時間。

“像Alexa這樣的普通家庭助理只有在被要求時才會提供幫助,”進行這項研究的另一位研究員舒天民告訴Tech Xplore。“然而,人類可以以更復雜的方式互相幫助。例如,當你看到你的伴侶帶著沉重的袋子從雜貨店回家時,你可以直接幫助他們拿這些袋子。如果你等到你的伴侶要求你幫忙,那么你的伴侶可能不會高興。

大約二十年前,馬克斯·普朗克進化人類學研究所的研究人員表明,人類幫助有需要的人的天生傾向很早就發(fā)展起來了。在一系列實驗中,年僅18個月大的孩子可以準確地推斷出他人的簡單意圖,并幫助他們實現(xiàn)目標。

利用他們的框架,Puig,Shu和他們的同事希望為家庭助理配備這些相同的“幫助能力”,使他們能夠通過觀察它們來自動推斷人類試圖做什么,然后以適當?shù)姆绞讲扇⌒袆?。這樣,人類將不再需要不斷地向機器人發(fā)出指令,而可以簡單地專注于手頭的任務。

“NOPA是一種同時推斷人類目標并幫助他們實現(xiàn)這些目標的方法,”Puig和Shu解釋說。“為了推斷目標,我們首先使用一個神經(jīng)網(wǎng)絡,根據(jù)人類所做的事情提出多個目標。然后,我們使用一種稱為逆向規(guī)劃的推理方法來評估這些目標。這個想法是,對于每個目標,我們可以想象人類為實現(xiàn)該目標而采取的理性行動是什么;如果想象的行動與觀察到的行動不一致,我們拒絕該目標提案。

從本質(zhì)上講,NOPA框架不斷維護一組人類可能試圖解決的可能目標,隨著新的人類行為的觀察,不斷更新這一集。在不同的時間點,幫助計劃者會搜索一個共同的子目標,這將是解決所有當前可能目標集的一步。最后,它尋找有助于實現(xiàn)這一次級目標的具體行動。

“例如,目標可能是把蘋果放在冰箱里,或者把蘋果放在桌子上,”普伊格和舒說。“我們的人工智能助手不會隨機猜測目標位置并在那里放蘋果,而是會撿起蘋果并將它們交付給人類。通過這種方式,我們可以避免因幫助實現(xiàn)錯誤的目標而破壞環(huán)境,同時仍然為人類節(jié)省時間和精力。

到目前為止,Puig,Shu和他們的同事在模擬環(huán)境中評估了他們的框架。雖然他們期望它允許代理在目標不明確的情況下幫助人類用戶,但他們沒有預料到他們在模擬中觀察到的一些有趣的行為。

“首先,我們發(fā)現(xiàn)代理商能夠糾正他們的行為,以盡量減少對房屋的干擾,”普伊格解釋說。“例如,如果他們挑選了一個物體,后來發(fā)現(xiàn)該物體與任務無關,他們會將物體放回原來的地方以保持房屋整潔。其次,當不確定目標時,智能體會選擇通常有用的行動,而不管人類的目標如何,例如將盤子交給人類,而不是承諾將其帶到桌子或儲物柜中。

在模擬中,Puig,Shu及其同事創(chuàng)建的框架取得了非常有希望的結(jié)果。即使團隊最初調(diào)整了輔助代理以協(xié)助代表人類用戶的模型(以節(jié)省實際測試的時間和成本),也發(fā)現(xiàn)代理在與真實人類交互時實現(xiàn)了類似的性能。

未來,NOPA框架可以幫助提高現(xiàn)有和新開發(fā)的家庭助理的能力。此外,它可能會激發(fā)創(chuàng)建類似的方法,以創(chuàng)建更直觀和社會協(xié)調(diào)的AI。

“到目前為止,我們只在具體模擬中評估了該方法,”Shu補充道。“我們現(xiàn)在想將這種方法應用于真實家庭中的真實機器人。此外,我們希望將口頭交流納入框架,以便AI助手可以更好地幫助人類。

  免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!

 
分享:
最新文章