亚洲爆乳成AV人在线视菜奈实_欧美一进一出抽搐大尺度视频 _日本十八禁免费看污网站_国产一区二区怡红院_6080YY新视觉影院_蜜臀AV无码人妻精品_成人影院YY111111在线_成人欧美一区二区三区1314_少妇饥渴偷公乱A级无码

中國自動化學會專家咨詢工作委員會指定宣傳媒體
新聞詳情

6TOPS算力驅動30億參數LLM,米爾RK3576部署端側多模態多輪對話

http://www.debgrams.com 2025-09-04 13:37 來源:米爾電子

GPT-4o 用毫秒級響應處理圖文混合指令、Gemini-1.5-Pro 以百萬 token 上下文 “消化” 長文檔時,行業的目光正從云端算力競賽轉向一個更實際的命題:如何讓智能 “落地”?—— 擺脫網絡依賴、保護本地隱私、控制硬件成本,讓設備真正具備 “看見并對話” 的離線智能,成為邊緣 AI 突破的核心卡點。

2024 年,隨著邊緣 SoC 算力正式邁入 6 TOPS 門檻,瑞芯微 RK3576 給出了首個可量產的答案:一套完整的多模態交互對話解決方案。

RK3576 多模態純文字:自我介紹

如今,“端側能否獨立運行圖文多輪對話” 已不再是技術疑問,而是工程實現問題。RK3576 通過硬件算力優化與軟件棧協同,將視覺編碼、語言推理、對話管理三大核心能力封裝為可落地的工程方案,而本文將聚焦其多輪對話的部署全流程,拆解從模型加載到交互推理的每一個關鍵環節。

RK3576 多輪對話:基于歷史回答圖中女孩頭發和衣服分別是什么顏色

上一次我們詳細講解RK3576上部署多模態模型的案例,這次將繼續講解多輪對話的部署流程。整體流程基于 rknn-llm 里的多輪對話案例[1]。

RK3576 工作狀態

unsetunset本文目錄unsetunset

一、引言

1.1 什么是多輪對話?

1.2 多輪對話系統鳥瞰:三顆核心協同驅動

1.3 核心邏輯:多輪對話的處理流程

二、工程化落地:從源碼到部署的全流程

2.1 依賴環境

2.2 一鍵編譯

2.3 端側部署步驟

三、效果展示:圖文多輪問答

四、二次開發與拓展方向

五、結論與未來發展方向

unsetunset一、引言unsetunset

1.1 什么是多輪對話?

多輪對話(Multi-Turn Dialogue)是指用戶與智能系統通過多輪交互逐步明確需求、解決問題的對話形式。這種交互依賴對話歷史的上下文連貫性,要求系統能夠動態理解用戶意圖、維護對話狀態并生成符合語境的回應。

本質是動態語境下的交互推理,其核心在于通過多輪信息交換逐步明確用戶需求。例如,用戶可能先詢問 “附近有餐廳嗎?”,系統回應后用戶補充 “要適合家庭聚餐的”,系統需結合歷史對話調整推薦策略。

這種交互模式與單輪問答的區別在于:

  • 上下文依賴性:每輪對話需關聯歷史信息(如用戶偏好、已確認的細節)。
  • 狀態維護:系統需跟蹤對話狀態(如未完成的信息補全),避免重復詢問或信息遺漏。
  • 動態意圖調整:用戶可能在對話中修正或細化需求,系統需實時調整響應策略

1.2 多輪對話系統鳥瞰:三顆核心協同驅動

RK3576 多模態交互對話方案基于 RKLLM 的核心運作,依賴于圖像視覺編碼器、大語言模型與對話管家這三大模塊的協同配合,三者各司其職、無縫銜接,共同構建起完整的多模態對話能力。

多輪對話系統架構

1. 圖像視覺編碼器(Vision Encoder

  • 模型選擇:采用 qwen2_5_vl_3b_vision_rk3576.rknn 模型(本文)。
  • 核心作用:將輸入圖像壓縮為視覺 token 256 個視覺 token,直接輸入至大語言模型中,實現圖像信息向語言模型可理解格式的轉換。

2. 大語言模型(LLM Core

  • 模型選擇:搭載 qwen2.5-vl-3b-w4a16_level1_rk3576.rkllm 模型,采用 W4A16 量化方案(本文)。
  • 模型規模:參數規模達 30 億,KV-Cache,為對話推理提供核心的語言理解與生成能力。

3. 對話管家(Dialogue Manager

基于純 C++實現,采用單線程事件循環機制,承擔著對話流程的統籌調度工作,具體職責包括:

  • 多輪對話的 KV-Cache 維護與手動清除;
  • Prompt 模板的動態渲染;
  • 用戶輸入的解析處理與推理結果的回顯展示。

1.3 核心邏輯:多輪對話的處理流程

該方案的多模態多輪對話 demo,整體遵循“模型加載 → 圖片預處理 → 用戶交互 → 推理輸出”的核心流程,支持圖文一體的多模態對話,適配多輪問答、視覺問答等典型場景。

具體運行機制可拆解為以下步驟:

1. 模型初始化

首先加載大語言模型(LLM),并配置模型路徑、max_new_tokens(生成內容最大 token 數)、max_context_len(最大上下文長度)、top_k、特殊 token 等關鍵參數;隨后加載視覺編碼模型(imgenc),為后續圖片處理做好準備。

RK3576 平臺運行多模態對話 Demo 的終端日志,顯示視覺與語言模型成功加載,包含模型版本、硬件配置及張量信息,完成多模態交互前的初始化。

2. 圖片處理與特征提取

讀取輸入圖片后,先將其擴展為正方形并填充背景色以統一尺寸,再調整至模型要求的 392x392 分辨率,最后送入視覺編碼模型進行處理,生成圖片的 embedding 向量,完成圖像特征的提取。

3. 多輪交互機制

程序會提供預設問題供用戶選擇(官方案例中也有輸入序號,可以快速提問),同時支持用戶自定義輸入,核心交互邏輯通過以下機制實現:

  • 上下文記憶
    • 通過設置rkllm_infer_params.keep_history = 1,開啟上下文記憶功能,KV-Cache 在顯存中持續追加存儲,每輪對話僅計算新增 token,大幅提升推理效率。使模型能關聯多輪對話內容;
    • 若設為 0,則每輪對話獨立,不保留歷史信息,詳見src/main.cpp
  • 歷史緩存清空:當用戶輸入“clear”時,系統調用rkllm_clear_kv_cache(llmHandle, 1, nullptr, nullptr),清空模型的 KV 緩存,重置對話上下文。
  • Prompt 工程:動態定義模型人設:采用三段式 Prompt 模板,通過rkllm_set_chat_template()動態注入模型,無需重新訓練即可切換人設,支持中英文雙語系統提示。

模板示例如下:

<|im_start|>system
You are a helpful assistant.<|im_end|>
<|im_start|>user
{用戶輸入}<|im_end|>
<|im_start|>assistant

4. 推理與輸出

用戶輸入后,系統先判斷輸入中是否包含<image>標簽:若包含,則將文本與圖片 embedding 結合,啟動多模態推理;若不包含,則進行純文本推理。組裝輸入結構體并傳遞給模型后,推理結果將實時打印輸出。

5. 退出與資源釋放

支持用戶輸入“exit”退出程序,此時系統會自動銷毀已加載的模型,并釋放占用的硬件資源,確保運行環境的整潔。

unsetunset二、工程化落地:從源碼到部署的全流程unsetunset

由于先前我們已經講過環境的部署,如刷機、文件準備等,這里步驟只提出比較關鍵的。工程位于:rknn-llm/examples/Multimodal_Interactive_Dialogue_Demo,下面我們來逐步看下操作步驟。

2.1 依賴環境

方案的編譯與運行需滿足以下依賴條件

  • 圖像處理:OpenCV ≥ 4.5
  • 視覺模型運行:RKNNRT ≥ 1.6
  • 語言模型運行:RKLLMRT ≥ 0.9

2.2 一鍵編譯

針對不同操作系統提供便捷的編譯腳本,我們是 Linux 系統執行./build-linux.sh,編譯結果如下:

產物目錄為:

install/demo_Linux_aarch64/
├─ demo        # 主程序可執行文件
└─ lib         # 依賴動態庫

2.3 端側部署步驟

通過 U 盤或者手機將編譯好的產物文件、模型、圖片上傳到開發板上,然后在多輪對話的實例的目錄下,執行以下命令:

cd /data/demo_Linux_aarch64
export LD_LIBRARY_PATH=./lib
./demo demo.jpg vision.rknn llm.rkllm 128 512

其中,部署命令需傳入 5 個核心參數,分別對應:

  • image_path:輸入圖片路徑
  • encoder_model_path:視覺編碼模型路徑
  • llm_model_path:大語言模型路徑
  • max_new_tokens:每輪生成的最大 token 數(控制回答長度,避免溢出)
  • max_context_len:最大上下文長度(限制歷史對話+當前輸入總長度,防止顯存占用過高)

unsetunset三、效果展示:圖文多輪問答unsetunset

以下面這張圖片作為測試圖片,選擇下面這張圖是因為,有人物、文字、物體、背景等。

測試圖片2:圖片背景是賽博風格

我們依次準備的問題如下:

  1. 這張圖片上有哪些文字信息
  2. 圖中電路板上的字是什么顏色
  3. 圖中女孩頭發和衣服分別是什么顏色
  4. 圖中動漫角色看起來多大年齡
  5. 圖中背景顏色和女孩眼睛顏色一樣嘛

每輪對話我都有截動態圖,可以感受下體感速度。

rkllm 模型加載 6.7

視覺編碼 rknn 模型進行處理,生成圖片的 embedding 向量,完成圖像特征的提取,4.5

可以明顯感受到這兩個過程是串行的,如果異步處理可以更快。

多輪對話1:這張圖片上有哪些文字信息

感受一下第一次出詞的耗時

多輪對話1:這張圖片上有哪些文字信息

多輪對話2:圖中電路板上的字是什么顏色

第二次回答就非??欤幸粋€很短暫的等待時間

多輪對話2:圖中電路板上的字是什么顏色

多輪對話3:圖中女孩頭發和衣服分別是什么顏色

多輪對話3:圖中女孩頭發和衣服分別是什么顏色,問題基本回答正確,速度和正常閱讀速度差不多

多輪對話3:圖中女孩頭發和衣服分別是什么顏色

多輪對話4:圖中動漫角色看起來多大年齡

多輪對話4:圖中動漫角色看起來多大年齡

多輪對話4:圖中動漫角色看起來多大年齡

多輪對話5:圖中背景顏色和女孩眼睛顏色一樣嘛

記不住了,因為我們設置的rkllm_infer_params.keep_history = 1

代碼中keep_history = 1是開啟上下文記憶功能,即模型應記住前序對話中的關鍵信息,如 “女孩眼睛顏色”“背景顏色”,而 “記不住” 是記憶功能未生效的表現,原因可能除了超過歷史上下文預設的閾值,有時還有可能是因為上下文長度超限(max_context_len=512),或者KV-Cache 清理機制誤觸發等。

多輪對話5:圖中背景顏色和女孩眼睛顏色一樣嘛

unsetunset四、二次開發與拓展方向unsetunset

方案具備良好的可擴展性,便于開發者根據需求進行二次開發:

  1. 替換視覺骨干:修改image_enc.cc文件,將輸入分辨率調整為與模型匹配的大小,原因是這些參數與模型的固有結構設計和輸入處理邏輯強綁定,直接影響特征提取的正確性和數據傳遞的一致性。不同的 Qwen2-VL 模型(2B 7B)需要代碼中指定IMAGE_HEIGHT、IMAGE_WIDTHEMBED_SIZE;
  2. 微調 LLM 模型:借助 RKLLM 工具鏈的 LoRA-INT4 量化支持,在 24 GB 顯存的 PC 上,30 分鐘內可完成 2 億參數模型的增量訓練;
  3. 接入語音能力:在main.cpp中集成 VAD(語音活動檢測)+ ASR(語音識別,如 Whisper-Tiny INT8)模塊,將語音轉換為文本后接入現有推理流水線,實現看圖說話+語音問答的融合交互。

unsetunset五、結論與未來發展方向unsetunset

如果說 “大模型上云” 是 AI 的 “星辰大海”,那么 “多模態落地端側” 就是 AI 的 “柴米油鹽”—— 后者決定了智能技術能否真正滲透到智能家居、工業質檢、穿戴設備等千萬級場景中。RK3576 的多模態交互對話方案,其價值遠不止 “實現了一項技術”,更在于提供了一套 “算力適配 - 工程封裝 - 二次拓展” 的端側 AI 落地范式。

從技術內核看,它通過 “視覺編碼器 + LLM + 對話管家” 的模塊化設計,平衡了推理性能與開發靈活性W4A16 量化方案讓 30 億參數模型適配 6 TOPS 算力,KV-Cache 動態維護實現多輪對話效率躍升,單線程事件循環降低了資源占用 —— 這些細節不是技術炫技,而是直擊端側 “算力有限、場景碎片化” 的痛點。從工程落地看,一鍵編譯腳本、清晰的參數配置、可復現的部署流程,讓開發者無需深耕底層優化即可快速驗證場景,大幅縮短了從技術原型到產品的周期。

展望未來,這套方案的演進將圍繞三個方向深化:

  • 其一,算力效率再突破—— 通過異步模型加載、NPU CPU 協同調度,進一步壓縮首輪推理延遲,適配對響應速度敏感的車載、醫療等場景;
  • 其二,多模態融合再升級—— 在圖文基礎上集成語音、傳感器數據,實現 + + 感知的跨模態對話;
  • 其三,生態適配再拓展—— 支持更多開源多模態模型的快速移植,形成 芯片 - 工具鏈 - 模型的協同生態。

RK3576 證明 “端側能跑好轉好多模態對話” 時,邊緣 AI 的競爭已從 “能否實現” 轉向 “如何更優”。而這套方案的真正意義,在于為行業提供了一塊 “可復用的基石”—— 讓更多開發者無需重復造輪子,只需聚焦場景創新,就能讓 “離線智能” 從實驗室走向量產貨架,最終讓 “AI 就在身邊” 成為無需網絡支撐的常態。

版權所有 工控網 Copyright?2025 Gkong.com, All Rights Reserved
亚洲AV成人无码久久WWW| 久久久99精品成人片| 久久99精品久久久久久久清纯| 久久精品这里热有精品| 麻豆果冻视频传媒APP下载| 女人18毛片A级毛片视频| 人妻熟妇av又粗又爽| 少妇被又粗又硬猛烈进出小说| 无码国产69精品久久久久APP| 亚洲AV无码精品色午夜蛋壳| 亚洲色精品88色婷婷七月丁香| 泳池里强摁做开腿呻吟| AV无码专区亚洲AVL在线观看| 成人免费无遮挡无码黄漫视频 | 果冻传媒AⅤ毛片无码| 久久99精品国产麻豆婷婷| 每晚都被他添的流好多水| 欧洲人激情毛片无码视频| 色噜噜噜狠狠色一色伊人蜜桃| 无人区码一码二码三码网页| 亚洲国产欧洲综合997久久| 永久免费观看国产裸体美女| BGMBGMBGM日本XX| 俄罗斯卖CSGO的网站免费进入| 国产男男激情VIDEOSGAY| 精品无码日韩国产不卡AV| 美女裸体无遮拦国产兔费网站| 欧美亚洲色综久久精品国产| 少妇粉嫩小泬喷水视频WWW| 亚洲AV成人午夜电影在线观看| 亚洲尤码不卡AV麻豆| 99RE久久精品国产| 丁香花在线影院观看在线播放| 国产麻豆精品精东影业AV网站| 精品亚洲国产成人AV不卡| 免费无遮挡毛片中文字幕| 日产无人区一线二线三线最新版| 无码专区 人妻系列 在线| 亚洲人ⅤSAⅤ国产精品| 97久久香蕉国产线看观看| 第二书包网高H肉辣文| 国产性猛交╳XXX乱大交| 久久青青草原精品国产| 欧美最猛黑人XXXX黑人猛交3p| 双乳被一左一右吃着的感觉| 亚洲第一无码XXXXXX| 在线观看视频一区二区三区| 锕锕锕锕锕~好深啊免费软件 | 蜜臀AV在线无码国产| 日本适合十八岁以下的护肤 | 香蕉直播永久免费版APP| 亚洲永久无码7777KKK| S货叫大点声C烂你的SB| 国产精华AV午夜在线观看| 精品伊人久久大线蕉色首页| 欧美高清性色生活片免费观看| 贪婪洞窟H5双修流攻略小说| 亚洲国产精品悠悠久久琪琪| 2023国精产品一二三四区| 饭桌上故意张开腿让公H| 黑人大雞巴ⅩⅩⅩ| 免费中文熟妇在线影片密芽| 少妇激情AV一区二区三区| 亚洲爆乳少妇无码激情| 51爆料网每日爆料黑料| 国产99久久亚洲综合精品| 精品人妻无码专区中文字幕| 欧美丰满少妇人妻精品| 玩丰满少妇XXXXXⅩ性麻| 亚洲一级 片内射欧美乱强| 啊轻点灬大JI巴太粗太长了网站| 国产欧美日韩综合精品二区| 老太奶性BBWBBW| 色偷偷亚洲女人的天堂| 亚洲精品成人在线| BGMBGMBGM老太太俄罗斯| 国产精品久久久久久免费软件| 久久久综合九色综合鬼色| 日本大学SGU大二大三| 亚洲AV中文乱码一区二| 4虎CVT4WD| 国产成人涩涩涩视频在线观看| 久久久久久国产精品无码下载 | 高潮到不停喷水的免费视频| 精品久久一区二区乱码| 欧美性猛交╳XXX乱大交视频| 无码人妻AⅤ一区二区三区夏目| 一夲道中文字幕AV高清片| 成人亚洲欧美成ΑⅤ人在线观看| 加比勒色综合久久| 强壮公把我一次次弄上高潮| 性做久久久久久久久| 2019NV天堂香蕉在线观看| 国产精品导航一区二区| 久久久亚洲欧洲日产无码AV| 日韩人妻无码精品免费SHIPI| 亚洲国产成在人网站天堂 | 国产桃色无码视频在线观看| 免费无码观看的AV在线播放| 图片区小说区AV区| 玉米地诱子偷伦初尝云雨孽欲| 饭桌上故意张开腿让公在线看| 精品一区二区三区无码视频| 日本55丰满熟妇厨房伦| 亚洲国产成人片在线观看无码| YY8840私人影院的在线| 孩教小UXXXⅩ精品| 欧美最猛性XXX| 亚洲—本道 在线无码AV发| FREEFORNVIDEOS性| 国内美女推油按摩在线播放| 欧美成人高清WW| 亚洲AV成人片色在线观看| AV电影在线观看| 国产在线观看无码免费视频| 欧美黑人性爱视频| 亚洲AV理论在线电影网| FREEⅩ性CHINESE中国| 国内精品自产拍在线观看| 欧美视频一区二区图文| 亚洲AV无码秘 蜜桃牛牛| JESSICAJAMES护士性| 国外亚洲成AV人片在线观看| 欧洲无人区码SUV| 亚洲精品97久久中文字幕无码 | 饥渴少妇AV无码影片| 人妻少妇aB又紧又爽精品视频| 亚洲精品成人网站在线播放| 波多野结衣一区二区免费视频| 精选AV种子无码专区| 色婷婷综合激情综在线播放| 一区二区三区欧美| 国产国产精品人在线观看| 妺妺窝人体色WWW在线下载| 香蕉久久夜色精品升级完成| BT天堂在线观看WWW| 后入骚妇内射AV| 日韩欧美操逼视频| 一面膜上边一面膜下边53分钟| 公侵犯玩弄熟睡人妻电影| 免费观看添你到高潮视频| 西西人体艺术图片| WWW爱射网站AVCOM| 九月婷婷人人澡人人添人人爽| 少妇被躁爽到呻吟全过的小说| 在卫生间被教官做好爽| 国产乱色精品成人免费视频| 欧美最猛性XXXXX黑人巨| 亚洲精品性爱av| 高潮大叫喷水发抖抽搐| 妺妺窝人体色WWW聚色窝丿| 亚洲AⅤ永久无码无人区电影| 凹凸视频免费在线| 久久精品无码免费不卡| 天天躁日日躁狠狠躁欧美老妇 | 一边喘气一边说疼的视频| 国产精品久久久久精品麻豆| 欧美黑人ⅩXXX猛交| 亚洲精品第一国产综合精品99| 丰满老熟好大BBBBBB| 免费无码AV电影在线观看| 亚洲AV无码乱码精品观看| 成人4399看片HD免费| 两个男用舌头到我的蕊花| 羞羞漫画_成人漫画_成人专用| 白嫩无码人妻丰满熟妇啪啪区百度| 久久久久蜜桃精品成人片公司| 无码国产色欲XXXX视频| JIZZJIZZJIZZ亚洲熟| 久久久久成人精品无码| 无码人妻丰满熟妇| А√天堂8资源官网在线BT种子| 久久久久久久久久久大尺度免费视| 无码人妻啪啪一区二区| 啊灬啊灬啊灬啊灬高潮了| 久久人人97超碰精品| 新区乱码无人区二精东| 白嫩少妇BBW撒尿视频| 麻豆丰满少妇CHINESE| 亚洲AV无码AV制服丝袜在线 | 无码人妻一区二区三区免费N鬼沢| ワンピースのエロ.WWW在线| 久久亚洲精品无码AV| 亚洲AⅤ中文无码字幕色 | 久久人搡人人玩人妻精品首页| 午夜一区欧美二区高清三区| 成 人 黄 色 网站 69| 蜜桃人妻无码AⅤ中文字幕| 亚洲AV无码专区在线电影APP| 恶毒美人长批后被宿敌爆炒了| 女教师的凌脣教室在线| 亚洲色欲综合一区二区三区小说| 国产精品美女一区二区视频| 人善之交Z0OZO0D0G人善| 中文字幕大香视频蕉| 精品第一国产综合精品AⅤ| 污污污污污污网站| 插花弄玉小说荔枝很甜| 男男激情H视频Gay片GV| 亚洲日韩AV无码一区二区三区人|