无码中文字幕色专区_91av俱乐部_无码人妻h动漫_26uuu成人_91九色丨porny丨国产jk_青青视频在线播放_国内自拍第二页_国产又粗又长又爽又黄的视频_色哟哟免费网站_久久出品必属精品_a级黄色一级片_99日在线视频

中國自動化學會專家咨詢工作委員會指定宣傳媒體
新聞詳情

直接用GPT-4控制空調,微軟免訓練方法讓LLM邁向工業控制

http://m.moduwu.com 2023-08-14 15:21 來源:機器之心報道

隨著大型語言模型(LLM)技術的日漸成熟,其應用范圍正在不斷擴大。從智能寫作到搜索引擎,LLM 的應用潛力正在一點點被挖掘。

最近,微軟亞洲研究院提出可以將 LLM 用于工業控制,而且僅需少量示例樣本就能達成優于傳統強化學習方法的效果。該研究嘗試使用 GPT-4 來控制空氣調節系統(HVAC),得到了相當積極的結果。

論文地址:http://export.arxiv.org/abs/2308.03028

在智能控制領域,強化學習(RL)是最流行的決策方法之一,但卻存在樣本低效問題以及由此導致的訓練成本高問題。當智能體從頭開始學習一個任務時。傳統的強化學習范式從根本上講就難以解決這些問題。畢竟就算是人類,通常也需要數千小時的學習才能成為領域專家,這大概對應于數百萬次交互。

但是,對于工業場景的許多控制任務,比如庫存管理、量化交易和 HVAC 控制,人們更傾向于使用高性能控制器來低成本地處理不同任務,這對傳統控制方法而言是巨大的挑戰。

舉個例子,我們可能希望只需極少量的微調和有限數量的參考演示就能控制不同建筑的 HVAC。HVAC 控制可能在不同任務上的基本原理都類似,但是場景遷移的動態情況甚至狀態 / 動作空間可能會不一樣。

不僅如此,用于從頭開始訓練強化學習智能體的演示通常也不夠多。因此,我們很難使用強化學習或其它傳統控制方法訓練出普遍適用于這類場景的智能體。

使用基礎模型的先驗知識是一種頗具潛力的方法。這些基礎模型使用了互聯網規模的多樣化數據集進行預訓練,因此可作為豐富先驗知識的來源而被用于各種工業控制任務。基礎模型已經展現出了強大的涌現能力以及對多種下游任務的快速適應能力,具體的案例包括 GPT-4、Bard、DALL-E、CLIP。其中前兩者是大型語言模型(LLM)的代表,后兩者則能處理文本和圖像。

基礎模型近來取得的巨大成功已經催生出了一些利用 LLM 執行決策的方法。這些方法大致上可分為三類:針對具體下游任務對 LLM 進行微調、將 LLM 與可訓練組件組合使用、直接使用預訓練的 LLM。

之前的研究在使用基礎模型進行控制實驗時,通常選用的任務是機器人操控、家庭助理或游戲環境,而微軟亞洲研究院的這個團隊則專注于工業控制任務。對傳統強化學習方法而言,該任務有三大難點:

1) 決策智能體通常面對的是一系列異構的任務,比如具有不同的狀態和動作空間或遷移動態情況。強化學習方法需要為異構的任務訓練不同的模型,這樣做的成本很高。

2) 決策智能體的開發過程需要很低的技術債(technical debt),這說明所提供的樣本數量不夠(甚至可能沒有),而傳統的強化學習算法需要大數據才能訓練,因此可能無法設計針對特定任務的模型。

3) 決策智能體需要以在線方式快速適應新場景或不斷變化的動態情況,比如完全依靠新的在線交互經驗而無需訓練。

為了解決這些難題,微軟亞洲研究院的 Lei Song 等研究者提出直接使用預訓練 LLM 來控制 HVAC。該方法只需少量樣本就能解決異構的任務,其過程不涉及到任何訓練,僅使用樣本作為少樣本學習的示例來進行上下文學習。

據介紹,這項研究的目標是探索直接使用預訓練 LLM 來執行工業控制任務的潛力。具體來說,他們設計了一種機制來從專家演示和歷史交互挑選示例,還設計了一種可將目標、指示、演示和當前狀態轉換為 prompt 的 prompt 生成器。然后,再使用生成的 prompt,通過 LLM 來給出控制。

研究者表示,其目的是探究不同的設計方式會如何影響 LLM 在工業控制任務上的表現,而該方法的很多方面都難以把控。

  • 第一,盡管該方法的概念很簡單,但相比于傳統的決策方法,其性能表現還不明朗。
  • 第二,基礎模型向不同任務的泛化能力(比如對于不同的上下文、動作空間等)仍然有待研究。
  • 第三,該方法對語言包裝器不同設計的敏感性也值得研究(例如,prompt 中哪一部分對性能影響最大)。

研究者希望通過解答這些問題凸顯出這些方法的潛力以及展現可以如何為技術債較低的工業控制任務設計解決方法。

這篇論文的主要貢獻包括:

  • 開發了一種可將基礎模型用于工業控制但無需訓練的方法,其能以較低的技術債用于多種異構的任務。
  • 研究者通過 GPT-4 控制 HVAC 進行了實驗,得到了積極的實驗結果,展現了這些方法的潛力。
  • 研究者進行了廣泛的消融研究(涉及泛化能力、示例選取和 prompt 設計),闡明了該方向的未來發展。

方法

該研究使用 GPT-4 來優化對 HVAC 設備的控制,工作流程如下圖 1 所示:

圖 1:使用 GPT-4 控制 HVAC 的工作流程示意圖

該工作流程中的 LLM 和環境組件如下:

LLM:一個預訓練大型語言模型,用作決策器。它會根據給出的 prompt 生成對應的響應。其 prompt 中應包含對當前狀態的描述、簡單的 HVAC 控制指令、相關狀態的演示等。

環境:一個交互式環境或模擬器,可以執行 LLM 建議的動作并提供反饋。實驗中所使用的具體評估環境為 BEAR (Zhang et al., 2022a)。為了在 BEAR 中創建環境,必須提供兩個參數:建筑類型(如大型辦公室、小型辦公室、醫院等)和天氣條件(如炎熱干燥、炎熱潮濕、溫暖干燥等)。此外,值得注意的是,每種天氣狀況都對應于特定的城市。例如,炎熱干燥的天氣狀況與水牛城有關。

在 BEAR 中,每個狀態都由一個數值向量表示,其中除了最后四個維度外,每個維度都對應于建筑物中一個房間的當前溫度。最后四個維度分別代表室外溫度、全局水平輻射(GHI)、地面溫度和居住者功率。在所有環境中,首要目標是保持室溫在 22 ℃ 附近,同時盡可能減少能耗。

BEAR 中的操作被編碼為范圍從 -1 到 1 的實數。負值表示制冷模式,正值表示加熱模式。這些動作的絕對值對應于閥門打開程度,這能說明能耗情況。如果絕對值更大,那么能耗也就更大。在兼顧舒適度和能耗的條件下,研究者在實驗中使用了以下獎勵函數:

其中 n 表示房間數,T=22℃ 是目標溫度,t_i 表示第 i 個房間的溫度。超參數 α 用于實現能耗和舒適度的平衡。

此外,該工作流程中還包含在線緩沖器、轉譯器、嵌入模型、專家演示數據集、KNN 模型、聚類模型、prompt 生成器等組件。其中 prompt 生成器的執行過程如圖 2 所示,其中紫色的文本僅用于說明,而非 prompt 的一部分。

圖 2:新方法是如何生成 prompt 的

實驗

該研究通過實驗展示了 GPT-4 控制 HVAC 設備的效果,其中涉及不同的建筑物和天氣條件。只要能提供適當的指示和演示(不一定與目標建筑和天氣條件相關),GPT-4 的表現就能超過專門為特定建筑和天氣條件精心訓練的強化學習策略。此外,研究者還進行了全面的消融研究,以確定 prompt 中每個部分的貢獻。

表 1:GPT-4 使用不同專家演示時的表現

表 2:GPT-4 使用不同類型和數量的演示時的表現

圖 3:在相同天氣條件下,不同建筑對應不同的專家策略的情況

圖 4:在不同天氣條件下,同一建筑使用不同專家策略的情況

表 3:GPT-4 使用不同類型的注釋時的表現

表 4:GPT-4 使用不同類型的描述和指示時的表現

表 5:在 prompt 中實數是否進行舍入的不同情況下,GPT-4 的性能

表 6:PPO 和 GPT 在天氣擾動下的表現

版權所有 工控網 Copyright?2025 Gkong.com, All Rights Reserved
无码中文字幕色专区_91av俱乐部_无码人妻h动漫_26uuu成人_91九色丨porny丨国产jk_青青视频在线播放_国内自拍第二页_国产又粗又长又爽又黄的视频_色哟哟免费网站_久久出品必属精品_a级黄色一级片_99日在线视频
www.久久com| 久久撸在线视频| 欧美日韩怡红院| 国产精品又粗又长| 四虎免费在线观看视频| 手机视频在线观看| 国产情侣av自拍| 午夜精品久久久内射近拍高清| 日韩极品视频在线观看| 特级黄色录像片| 天堂v在线视频| 在线观看av免费观看| 污污动漫在线观看| 日韩一级免费片| 免费av不卡在线| 三区视频在线观看| 亚洲黄色片免费看| xxx中文字幕| 青青草原国产免费| 国产精品88久久久久久妇女| 特色特色大片在线| 51xx午夜影福利| 成人在线视频一区二区三区| 日韩精品一区二区在线视频| 国产精品久久久久久久久电影网| 国产女教师bbwbbwbbw| 亚洲色婷婷久久精品av蜜桃| 欧美少妇一区二区三区| av一区二区三区免费观看| 男女激情免费视频| 日本韩国欧美在线观看| 亚洲国产精品久久久久婷蜜芽| 熟女少妇在线视频播放| 亚洲 高清 成人 动漫| 日本黄色三级大片| 999精彩视频| 18禁免费观看网站| 一二三四视频社区在线| 噜噜噜久久亚洲精品国产品麻豆| www黄色日本| 男女无套免费视频网站动漫| 中文字幕66页| 最新av在线免费观看| 国产美女作爱全过程免费视频| 精品无码一区二区三区爱欲| 免费在线激情视频| 99热这里只有精品在线播放| 色网站在线视频| 国产小视频免费| 欧美 激情 在线| 制服丝袜中文字幕第一页| 特色特色大片在线| 国产精品沙发午睡系列| 久久久国产欧美| 日本三日本三级少妇三级66| 成年人网站免费视频| 亚洲精品一二三四五区| 超碰中文字幕在线观看| 日韩精品视频在线观看视频 | 欧美久久久久久久久久久久久久| 97视频久久久| 91插插插插插插插插| 400部精品国偷自产在线观看| 国产午夜伦鲁鲁| 午夜视频在线网站| 国产免费黄色一级片| 色噜噜狠狠永久免费| 黄色激情在线视频| 日韩欧美国产片| 99热亚洲精品| 五月六月丁香婷婷| 日韩人妻精品无码一区二区三区| 黄色片免费网址| 激情六月丁香婷婷| www国产免费| 国产精品区在线| 免费看黄在线看| 中文字幕亚洲影院| 成人毛片视频网站| 强开小嫩苞一区二区三区网站| 日韩视频免费在线播放| 99热久久这里只有精品| 久久国产激情视频| 久久久久久久久久久福利| 樱空桃在线播放| 欧美精品性生活| 狠狠干 狠狠操| 美女黄色片网站| 人人爽人人av| 国产精品又粗又长| 99久久久无码国产精品性色戒| 无码内射中文字幕岛国片| www.国产二区| 九九九久久久久久久| 亚洲高清在线免费观看| 日日摸日日碰夜夜爽无码| 一本—道久久a久久精品蜜桃| 天天爱天天操天天干| 国产精品999视频| 日韩有码免费视频| 激情深爱综合网| www.一区二区.com| 偷拍盗摄高潮叫床对白清晰| 男女男精品视频站| 黄在线观看网站| 成人午夜精品久久久久久久蜜臀| youjizz.com亚洲| 亚洲一区精品视频在线观看| 久久久久国产精品熟女影院| 美女av免费在线观看| 成人免费毛片在线观看| 粉嫩av一区二区三区天美传媒| 日韩av影视大全| 日韩av片专区| mm131国产精品| 亚洲国产精品三区| 黄色一级二级三级| 北条麻妃在线一区| 狠狠爱免费视频| 成年人网站大全| 久久无码高潮喷水| 精品视频一区二区在线| 日批视频在线免费看| 91av资源网| 免费观看精品视频| 欧美变态另类刺激| www.亚洲天堂网| 国产情侣av自拍| 五月婷婷丁香综合网| 国产又大又黄又猛| 亚洲午夜激情影院| 色偷偷中文字幕| 中国女人做爰视频| 久青草视频在线播放| 隔壁人妻偷人bd中字| 美脚丝袜脚交一区二区| 精品无码一区二区三区在线| 国产91在线免费| 国产一级不卡毛片| 污视频网站观看| 日韩精品aaa| 日本精品福利视频| 少妇人妻无码专区视频| 国产二区视频在线播放| 久久久久国产精品熟女影院| 男操女免费网站| 99re99热| 日韩国产一级片| 日韩av在线综合| 亚洲欧美偷拍另类| 可以在线看黄的网站| 日韩小视频在线播放| 国产成人精品无码播放| 午夜一区二区视频| 欧美日韩激情四射| 男人天堂网视频| 中文字幕视频三区| 99热这里只有精品免费| 成人免费毛片网| 亚洲va在线va天堂va偷拍| 400部精品国偷自产在线观看| 成人在线观看你懂的| 一区二区xxx| 人妻无码一区二区三区四区| 国产a级一级片| 三区视频在线观看| 日本aa在线观看| 久久久久久久久久久福利| 国产永久免费网站| 久无码久无码av无码| 热久久精品免费视频| 日本xxxx黄色| 日本aa在线观看| 天堂社区在线视频| 黄网站色视频免费观看| 国产熟人av一二三区| 一本二本三本亚洲码| 日韩人妻精品无码一区二区三区| 午夜视频在线网站| 精品视频免费在线播放| 亚洲一区日韩精品| 乱人伦xxxx国语对白| www.超碰97.com| 欧美激情视频免费看| 日本中文字幕观看| 美女日批免费视频| www亚洲国产| www.超碰com| 日韩国产一级片| 91网址在线观看精品| 岳毛多又紧做起爽| 91精品国产毛片武则天| 国产精品久久久毛片| 久艹视频在线免费观看| 欧美视频亚洲图片| aaaaaa亚洲| 91黄色在线看| 先锋影音男人资源| 天天爽人人爽夜夜爽| 91视频 -- 69xx|