分類
AI

LLM Security Leaderboard大語言資安排行榜

從這裡看來的: https://blogs.cisco.com/ai/llm-security-leaderboard

Cisco 透過技術方法來分析與檢討目前坊間的LLM大語言模型的資安能力, 希望透過這樣的方式來評估現有的LLM於應用時應該要補強或留意之處.

排行榜在這裡: https://leaderboard.aidefense.cisco.com/rankings

看起來 Anthropic 的 Opus, Sonnet, Haiku 都有不錯的表現, 其他大廠的LLM也都不惶多讓, 透過右上角的 All Models 的切換, 我們可以看到所有被測試的 LLM 表現.

測試的方法在這裡可以看到: https://leaderboard.aidefense.cisco.com/methodology