數位醫學部 > 最新消息
大型語言模型越獄與醫學影像智慧防護:從對抗生成到自適應融合 U-Net 的跨域探索
引用(3)
2025/10/20 9:11:27
100
隨著大型語言模型(Large Language Models, LLMs)在醫學資訊處理、臨床輔助決策與資料生成中的應用日益廣泛,其安全性與穩定性問題逐漸浮現。越獄(Jailbreak)行為透過對抗式提示(Adversarial Prompts)繞過模型防護,可能導致錯誤資訊生成、隱私洩漏與倫理風險。另一方面,在醫學影像領域,深度學習模型如 U-Net 仍面臨組織邊界模糊與灰質分界困難等挑戰。本研究從「模型安全」與「模型精度」兩個維度切入,探討 LLM 越獄過程與防禦策略,並以腦部 CT 影像分割為例,提出一種自適應融合(Adaptive Fusion)U-Net 架構,透過多尺度特徵調整提升組織辨識精度。研究結果顯示,強化式對抗防禦可顯著降低越獄成功率,而自適應融合機制則能在腦組織分割任務中提升 Dice 係數達 4.8%。本研究示範了跨領域 AI 模型在「安全性」與「精準性」之間的互補性設計思維,為醫療 AI 系統的安全應用提供新視角。
