亚洲爆乳成AV人在线视菜奈实_欧美一进一出抽搐大尺度视频 _日本十八禁免费看污网站_国产一区二区怡红院_6080YY新视觉影院_蜜臀AV无码人妻精品_成人影院YY111111在线_成人欧美一区二区三区1314_少妇饥渴偷公乱A级无码

中國自動化學會專家咨詢工作委員會指定宣傳媒體
新聞詳情

直接用GPT-4控制空調,微軟免訓練方法讓LLM邁向工業控制

http://www.debgrams.com 2023-08-14 15:21 來源:機器之心報道

隨著大型語言模型(LLM)技術的日漸成熟,其應用范圍正在不斷擴大。從智能寫作到搜索引擎,LLM 的應用潛力正在一點點被挖掘。

最近,微軟亞洲研究院提出可以將 LLM 用于工業控制,而且僅需少量示例樣本就能達成優于傳統強化學習方法的效果。該研究嘗試使用 GPT-4 來控制空氣調節系統(HVAC),得到了相當積極的結果。

論文地址:http://export.arxiv.org/abs/2308.03028

在智能控制領域,強化學習(RL)是最流行的決策方法之一,但卻存在樣本低效問題以及由此導致的訓練成本高問題。當智能體從頭開始學習一個任務時。傳統的強化學習范式從根本上講就難以解決這些問題。畢竟就算是人類,通常也需要數千小時的學習才能成為領域專家,這大概對應于數百萬次交互。

但是,對于工業場景的許多控制任務,比如庫存管理、量化交易和 HVAC 控制,人們更傾向于使用高性能控制器來低成本地處理不同任務,這對傳統控制方法而言是巨大的挑戰。

舉個例子,我們可能希望只需極少量的微調和有限數量的參考演示就能控制不同建筑的 HVAC。HVAC 控制可能在不同任務上的基本原理都類似,但是場景遷移的動態情況甚至狀態 / 動作空間可能會不一樣。

不僅如此,用于從頭開始訓練強化學習智能體的演示通常也不夠多。因此,我們很難使用強化學習或其它傳統控制方法訓練出普遍適用于這類場景的智能體。

使用基礎模型的先驗知識是一種頗具潛力的方法。這些基礎模型使用了互聯網規模的多樣化數據集進行預訓練,因此可作為豐富先驗知識的來源而被用于各種工業控制任務。基礎模型已經展現出了強大的涌現能力以及對多種下游任務的快速適應能力,具體的案例包括 GPT-4、Bard、DALL-E、CLIP。其中前兩者是大型語言模型(LLM)的代表,后兩者則能處理文本和圖像。

基礎模型近來取得的巨大成功已經催生出了一些利用 LLM 執行決策的方法。這些方法大致上可分為三類:針對具體下游任務對 LLM 進行微調、將 LLM 與可訓練組件組合使用、直接使用預訓練的 LLM。

之前的研究在使用基礎模型進行控制實驗時,通常選用的任務是機器人操控、家庭助理或游戲環境,而微軟亞洲研究院的這個團隊則專注于工業控制任務。對傳統強化學習方法而言,該任務有三大難點:

1) 決策智能體通常面對的是一系列異構的任務,比如具有不同的狀態和動作空間或遷移動態情況。強化學習方法需要為異構的任務訓練不同的模型,這樣做的成本很高。

2) 決策智能體的開發過程需要很低的技術債(technical debt),這說明所提供的樣本數量不夠(甚至可能沒有),而傳統的強化學習算法需要大數據才能訓練,因此可能無法設計針對特定任務的模型。

3) 決策智能體需要以在線方式快速適應新場景或不斷變化的動態情況,比如完全依靠新的在線交互經驗而無需訓練。

為了解決這些難題,微軟亞洲研究院的 Lei Song 等研究者提出直接使用預訓練 LLM 來控制 HVAC。該方法只需少量樣本就能解決異構的任務,其過程不涉及到任何訓練,僅使用樣本作為少樣本學習的示例來進行上下文學習。

據介紹,這項研究的目標是探索直接使用預訓練 LLM 來執行工業控制任務的潛力。具體來說,他們設計了一種機制來從專家演示和歷史交互挑選示例,還設計了一種可將目標、指示、演示和當前狀態轉換為 prompt 的 prompt 生成器。然后,再使用生成的 prompt,通過 LLM 來給出控制。

研究者表示,其目的是探究不同的設計方式會如何影響 LLM 在工業控制任務上的表現,而該方法的很多方面都難以把控。

  • 第一,盡管該方法的概念很簡單,但相比于傳統的決策方法,其性能表現還不明朗。
  • 第二,基礎模型向不同任務的泛化能力(比如對于不同的上下文、動作空間等)仍然有待研究。
  • 第三,該方法對語言包裝器不同設計的敏感性也值得研究(例如,prompt 中哪一部分對性能影響最大)。

研究者希望通過解答這些問題凸顯出這些方法的潛力以及展現可以如何為技術債較低的工業控制任務設計解決方法。

這篇論文的主要貢獻包括:

  • 開發了一種可將基礎模型用于工業控制但無需訓練的方法,其能以較低的技術債用于多種異構的任務。
  • 研究者通過 GPT-4 控制 HVAC 進行了實驗,得到了積極的實驗結果,展現了這些方法的潛力。
  • 研究者進行了廣泛的消融研究(涉及泛化能力、示例選取和 prompt 設計),闡明了該方向的未來發展。

方法

該研究使用 GPT-4 來優化對 HVAC 設備的控制,工作流程如下圖 1 所示:

圖 1:使用 GPT-4 控制 HVAC 的工作流程示意圖

該工作流程中的 LLM 和環境組件如下:

LLM:一個預訓練大型語言模型,用作決策器。它會根據給出的 prompt 生成對應的響應。其 prompt 中應包含對當前狀態的描述、簡單的 HVAC 控制指令、相關狀態的演示等。

環境:一個交互式環境或模擬器,可以執行 LLM 建議的動作并提供反饋。實驗中所使用的具體評估環境為 BEAR (Zhang et al., 2022a)。為了在 BEAR 中創建環境,必須提供兩個參數:建筑類型(如大型辦公室、小型辦公室、醫院等)和天氣條件(如炎熱干燥、炎熱潮濕、溫暖干燥等)。此外,值得注意的是,每種天氣狀況都對應于特定的城市。例如,炎熱干燥的天氣狀況與水牛城有關。

在 BEAR 中,每個狀態都由一個數值向量表示,其中除了最后四個維度外,每個維度都對應于建筑物中一個房間的當前溫度。最后四個維度分別代表室外溫度、全局水平輻射(GHI)、地面溫度和居住者功率。在所有環境中,首要目標是保持室溫在 22 ℃ 附近,同時盡可能減少能耗。

BEAR 中的操作被編碼為范圍從 -1 到 1 的實數。負值表示制冷模式,正值表示加熱模式。這些動作的絕對值對應于閥門打開程度,這能說明能耗情況。如果絕對值更大,那么能耗也就更大。在兼顧舒適度和能耗的條件下,研究者在實驗中使用了以下獎勵函數:

其中 n 表示房間數,T=22℃ 是目標溫度,t_i 表示第 i 個房間的溫度。超參數 α 用于實現能耗和舒適度的平衡。

此外,該工作流程中還包含在線緩沖器、轉譯器、嵌入模型、專家演示數據集、KNN 模型、聚類模型、prompt 生成器等組件。其中 prompt 生成器的執行過程如圖 2 所示,其中紫色的文本僅用于說明,而非 prompt 的一部分。

圖 2:新方法是如何生成 prompt 的

實驗

該研究通過實驗展示了 GPT-4 控制 HVAC 設備的效果,其中涉及不同的建筑物和天氣條件。只要能提供適當的指示和演示(不一定與目標建筑和天氣條件相關),GPT-4 的表現就能超過專門為特定建筑和天氣條件精心訓練的強化學習策略。此外,研究者還進行了全面的消融研究,以確定 prompt 中每個部分的貢獻。

表 1:GPT-4 使用不同專家演示時的表現

表 2:GPT-4 使用不同類型和數量的演示時的表現

圖 3:在相同天氣條件下,不同建筑對應不同的專家策略的情況

圖 4:在不同天氣條件下,同一建筑使用不同專家策略的情況

表 3:GPT-4 使用不同類型的注釋時的表現

表 4:GPT-4 使用不同類型的描述和指示時的表現

表 5:在 prompt 中實數是否進行舍入的不同情況下,GPT-4 的性能

表 6:PPO 和 GPT 在天氣擾動下的表現

版權所有 工控網 Copyright?2025 Gkong.com, All Rights Reserved
狠狠色丁香九九婷婷综合| 亚洲最大AV无码网站| 亚洲男人综合久久综合天堂| 亚洲天堂无码高清高潮| 玉蒲团之玉女心经| AE射频电源成色| 波多野结衣在线观看av| 伽罗ちゃんが腿法| 国产乱色国产精品免费视频| 极品性荡少妇一区二区色欲| 久久无码专区国产精品S| 男女嘿咻激烈爱爱动态图| 人妻丰满熟妇AⅤ无码区在线电影| 搡老女人老妇老熟女HHD| 无码精品人妻一区二区三区免费看| 亚洲AV无码一区二区三区性色| 亚洲熟妇无码V在线观看| 中文在线天堂А√在线| ZOOM与人性ZOOM我放弃播放器| 床震吃胸膜奶免费视频| 国产精品久久久久久无遮挡| 黑人上司与人妻激烈中文字幕| 久久久亚洲熟妇熟一区二区| 欧美成人精品三级网站| 日韩一卡2卡3卡4卡| 无码人妻一区二区三区免费手机| 亚洲精品TV久久久久久久久 | AA区一区二区三无码精片| 不卡高清AV手机在线观看| 国产精华AV午夜在线观看| 怀孕挺大肚子疯狂高潮AV毛片| 久久欧美极品少妇XXXXⅩ| 欧美成人精品三级又大又粗| 色AV永久无码AV影院| 午夜精品久久久久久久99热| 亚洲国产精品无码中文字| 一本色道久久88综合日韩精品 | 亚洲色欲一区二区三区在线观看 | 亚洲欧美日韩综合在线一| 中文中文字幕成人无码AⅤ| AV无码免费一区二区三区| 成人精品一区二区久久久| 国产精品久久久久精品三级APP | 日本国产一区二区三区在线观看 | 好硬好大好爽18禁免费看男男| 久久亚洲AV成人无码国产| 欧亚成年男女深夜百度网盘| 天堂…中文在线最新版在线| 亚洲国产AV一区二区三区| 中文字幕人妻不在线无码视频| 菠萝菠萝蜜免费播放视频| 国产老妇伦国产熟女老妇高清97| 精品一区二区三区在线观看视频| 男生坤坤放在女生坤坤里开元棋| 搡BBBB搡BBBB搡BBBB| 亚洲AV无码一区二区三区在线观 | 亚洲色成人网站WWW永久下载| 99久热RE在线精品视频| 国产边做饭边被躁在线播放91| 护士趴下光屁股翘臀被打的作文| 免费乱理伦片在线观看八戒| 色欲狠狠躁天天躁无码中文字幕 | 久久精品无码一区二区三区| 欧美综合在线激情专区| 无码精品国产一区二区免费| 亚洲香蕉成人AAAV在线网站 | 精品久久久久久中文字幕无码软件 | 色老头BGMBGMBGM| 亚洲AV无码成人精品区狼人影院| 中美日韩精品激情无码AV| 成人爽A毛片在线视频淮北| 国内精品久久久久久久久齐齐| 乱中年女人伦AV二区| 日韩精品一区二区亚洲AV| 亚洲AV一本岛在线播放| 18禁无遮拦无码国产在线播放| 干的你走不了路SB| 久久A级毛片免费观看| 强被迫伦姧惨叫VIDEO| 无人区一线二线三线乱码| 泳池里强摁做开腿呻吟| 厨房玩丰满人妻HD完整版视频| 和岳每晚弄的高潮嗷嗷叫视频 | 凹凸国产熟女精品视频APP| 国产人成精品香港三级在线| 美女张开腿黄网站免费| 色综合久久无码五十路人妻| 亚洲乱码国产乱码精品精姦| GAY国产GV又粗又长又大| 国产乱亲BBBB| 麻豆三级电影无码| 熟妇人妻系列Av无码一区=区| 亚洲全部无码中文字幕| 啊轻点灬大巴太粗太长视频| 国产又大又粗又黄又爽白丝| 男生晚上睡不着想看B站| 偷拍 拍自 欧美色区| 伊在人亚洲香蕉精品区麻豆| 大号BBVVBBW高潮| 精品一区二区三区国产在线观看| 琴乳液狂飙却被空吸入口中 | 99RE6热这里只精品首页| 国产精品看高国产精品不卡| 老男人把舌头伸进我下面| 山东中年夫妇大白天露脸自拍| 亚洲线精品一区二区三区影音先锋| 成 人 黄 色 网站 小说 免| 精品国产乱码久久久久久浪潮| 欧美人妖XXXX做受| 学生妹亚洲一区二区| 777米奇色888狠狠俺去啦| 国产精品人人妻人色五月| 蜜桃中文字日产乱幕4区| 天堂资源在线官网| 中国熟妇色XXXXX中国老妇| 国产成人亚洲精品无码MP4| 老湿机香蕉久久久久久| 四虎国产精品永久入口| 在线观看免费视频| 国产成人乱码一二三区18| 另类小说激情婷婷久久| 婷婷五月综合色视频| 正在播放熟妇群老熟妇456| 国产精品 精品国内自产拍| 乱人伦中文视频在线观看| 无码国产偷倩在线播放| 2021韩剧在线观看韩剧网| 国产男男GAY做受ⅩXX高潮| 欧美FREESEX黑人又粗又大| 亚洲AV成本人无码网站| OLDMACDONALD老人大包| 精品国产乱码久久久久久人妻| 日本免费一区二区三区| 亚洲日韩AA特黄毛片试看| 反差婊吃瓜爆料黑料免费| 久久亚洲日韩成人无码| 天天摸夜夜添夜夜无码| 14表妺好紧没带套18分钟| 国产午夜亚洲精品国产成人| 强插女教师AV在线| 亚洲欧美另类在线| 丰满人妻跪趴高撅肥臀| 麻花传媒网站永久入口视频| 无人区码一码二码三码四码| 99无人区码一码二码三码四| 黑人双人RAPPER的特点| 日本人做暖免费高清视频| 亚洲一区二区三区自拍公司| 国产99久60在线视频 | 传 | WWW国产亚洲精品久久麻豆| 精品久久久无码人妻中文字幕| 色爱无码AⅤ综合区| 婬乱丰满熟妇XXXXX性| 国产精品乱子乱XXXX| 欧美疯狂做受XXXX| 亚洲乱码精品久久久久| 公么大龟弄得我好舒服秀婷视频 | 羞羞在线版免费阅读入口| 爆乳邻居肉欲中文字幕| 久久久久99精品成人片试看| 挽起裙子跨开双腿坐下去| 99视频国产精品免费观看| 精产国品一二二线三线区别| 色欲色香天天天综合网WWW| 中文字幕久久波多野结衣AV| 国产亚洲美女精品久久久久| 人与动人物XXXX毛片在线播放| 夜夜躁狠狠躁日日躁2022| 国产精品免费AV片在线观看| 漂亮人妻被黑人久久精品| 亚洲色自偷自拍另类小说 | 波多野结衣AV一区二区无码| 久久亚洲熟妇熟女ⅩXXX| 亚洲AV成人片无码www妖精| 成人精品无码一区二区三区| 美女图片禁欲系高级感| 亚洲AV图片一亚洲AV| 厨房玩丰满人妻HD完整版视频| 蜜桃国产乱码精品一区二区三区w| 亚洲AV无码不卡一区二区三区| 成人夜间av大片免费观看| 美女大BXXXXN内射| 亚洲成AV人片天堂网无码| 国产AV丝袜熟女AV一区| 欧美另类精品黑人巨大| 亚洲一区二区三区在线观看网站| 国产精品无码一区二区三区不卡| 热99RE久久精品这里都是精品| 一本久道久久综合狠狠爱| 国产午夜无码福利在线看网站| 日韩国产欧美亚洲V片| √BT天堂网WWW中文在线| 精品久久久BBBB人妻| 玩弄丰满熟妇XXXXX性60| 把舌头伸进她腿间花缝| 两根硕大一起挤进小紧H共妻| 亚洲AV无码专区青青草原| 国产99久久九九精品无码| 欧美最猛黑人AAAAAXXX片| 用嘴巴吃鸡的好处|