全国无码视频中文字幕,中文无码精品a∨在线

作者 / 技術與社會部 Anoop Sinha 以及 Google Research、Responsible AI 和以人為本技術團隊 Marian Croak

標準基準是衡量重要產品質量的公認方法，存在于許多領域。一些標準基準用于衡量安全性:例如，當汽車制造商宣傳 "整體安全評分五星" 時，會引用某項基準。機器學習 (ML) 和 AI 技術領域已經存在標準基準:例如，MLCommons Association 運用 MLPerf 基準，來衡量如 Google 的 TPU 等尖端 AI 硬件的速度。然而，盡管圍繞 AI 安全已經做了大量工作，目前仍然沒有類似的 AI 安全標準基準。

MLCommons
https://mlcommons.org/en/
MLPerf
https://mlcommons.org/en/news/mlperf-inference-storage-q323/
AI 安全
https://blog.google/technology/ai/our-responsible-approach-to-building-guardrails-for-generative-ai/

我們很高興能夠為非營利組織 MLCommons Association 開展標準 AI 安全基準制定的工作提供支持。制定有效且值得信賴的基準，不僅要有先進的 AI 安全測試技術，還需要綜合廣泛的觀點。MLCommons 的工作旨在匯集學術界和業(yè)界的專家研究人員來制定衡量 AI 系統(tǒng)安全性的標準基準，并以每個人都能理解的分數呈現。我們鼓勵社區(qū)的所有成員 (從 AI 研究人員到政策專家)加入我們，為這項工作奉獻自己的力量。

加入我們
https://mlcommons.org/ai-safety

為什么要制定 AI 安全基準？

像大多數先進技術一樣，AI 具有帶來巨大好處的潛力，但是如果缺乏適當的約束，也可能會導致負面結果。例如，AI 技術可以在各種活動中輔助人類提高生產力 (如提高健康診斷的準確性和研究疾病、分析能源使用情況等)。然而，如果沒有足夠的預防措施，AI 也可能被用來支持有害或惡意活動，并導致存在偏見或令人反感的響應。

改善健康診斷
https://blog.google/technology/health/how-ai-can-improve-health-for-everyone-everywhere/
能源使用情況
https://blog.google/outreach-initiatives/sustainability/google-transportation-energy-emissions-reduction/

通過為不同類別提供標準的安全措施，如有害使用、超范圍響應、AI 控制風險等，標準的 AI 安全基準可以幫助社會從 AI 中獲益，同時確保采取足夠的預防措施來減輕這些風險。最初，新興的安全基準有助于推動 AI 安全研究，并為負責任的 AI 開發(fā)提供信息。隨著時間推移和技術成熟，這些基準也可以為 AI 系統(tǒng)的用戶和購買者提供信息，最終，可能成為政策制定者的寶貴工具。

在計算機硬件領域，基準 (如 SPEC、TPC) 現已展現出驚人的能力，讓整個行業(yè)能夠在追求進步的過程中，保持研究、工程甚至營銷部門的步調一致。我們相信，標準 AI 安全基準有助于在這一重要領域實現同樣的目標。

SPEC
https://en.wikipedia.org/wiki/Standard_Performance_Evaluation_Corporation
TPC
https://en.wikipedia.org/wiki/Transaction_Processing_Performance_Council

標準 AI 安全基準是什么？

在學術研究和企業(yè)工作中，人們開展了一系列 AI 安全測試 (如 RealToxicityPrompts、Stanford HELM 公平性、偏差、毒性測量以及 Google 的生成式 AI 指引)。但是，大多數測試都側重于為 AI 系統(tǒng)提供提示，并對輸出進行算法評分，雖然這是一個有用的開端，但僅限于測試提示的范圍。此外，他們通常使用開放數據集進行提示和響應，而這些提示和響應可能已被 (通常是無意中) 納入訓練數據中。

RealToxicityPrompts
https://arxiv.org/abs/2009.11462
Stanford HELM
https://crfm.stanford.edu/2022/11/17/helm.html
Google 的生成式 AI 指引
https://blog.google/technology/ai/our-responsible-approach-to-building-guardrails-for-generative-ai/

MLCommons 提議，按多方利益相關者流程選擇測試，并按子集分組，以衡量特定 AI 用例的安全性，并將這些需要有專業(yè)技術背景才能理解的測試結果轉化為每個人都能理解的分數。MLCommons 建議打造一個集中現有測試的平臺，并鼓勵開展更嚴格的測試，以推動先進技術的發(fā)展。用戶既可以通過在線測試生成和查看分數，也可以借助私人測試引擎的離線測試來訪問這些測試。

共同努力下的 AI 安全基準

負責任的 AI 開發(fā)者使用多種安全措施，包括自動測試、手動測試、紅隊測試 (red teaming，其中人類測試人員試圖產生對抗性結果)、軟件方面的限制、數據和模型最佳實踐以及審計。但是，確定是否已采取足夠的預防措施可能具有挑戰(zhàn)性，尤其是在開發(fā) AI 系統(tǒng)的公司群體不斷發(fā)展且具有多元化特點的情況下。標準 AI 基準能夠提供強大的工具，幫助供應商和用戶衡量 AI 安全性，以及鼓勵資源生態(tài)系統(tǒng)和專注于提高 AI 安全性的專業(yè)提供商，推進社區(qū)以負責任的方式發(fā)展。

同時，如果沒有社區(qū)參與，就無法制定成熟、有效且值得信賴的 AI 安全基準。這項工作需要研究人員和工程師齊心協(xié)力，為安全測試技術提供創(chuàng)新且實用的改進，使測試更加嚴格高效。同樣，企業(yè)也需要團結一致，提供測試數據、工程支持和經濟支持。AI 安全的某些方面可能具有主觀性，要建立得到廣泛共識支持的可信基準需要考慮多方觀點，包括公眾代言人、政策制定者、學者、工程師、數據工作者、商界領袖和企業(yè)家的觀點。

Google 對 MLCommons 的支持

Google 以 2018 年宣布的 AI 準則為基礎，致力于以安全、可靠和值得信賴的特定標準開發(fā)和使用 AI (您可以參閱我們 2019 年、2020 年、2021 年、2022 年的更新)。我們還在關鍵承諾方面取得了重大進展，這將幫助您大膽且負責任地開發(fā) AI，從而造福所有人。

宣布
https://blog.google/technology/ai/ai-principles/
AI 準則
https://ai.google/responsibility/principles/
2019 年
https://ai.google/static/documents/ai-principles-2019-progress-update.pdf
2020 年
https://ai.google/static/documents/ai-principles-2020-progress-update.pdf
2021 年
https://ai.google/static/documents/ai-principles-2021-progress-update.pdf
2022 年
https://ai.google/static/documents/ai-principles-2022-progress-update.pdf
進展
https://static.googleusercontent.com/media/publicpolicy.google/en//resources/whcommitments.pdf

Google 正在以多種方式支持 MLCommons Association 在制定 AI 安全基準方面所作的工作。

測試平臺:我們聯合其他公司提供資金，支持測試平臺的開發(fā)。
技術專長和資源:我們不斷提供技術專長和資源，例如 Monk 膚色示例數據集，以幫助確?；鶞试O計優(yōu)良且有效。
數據集:我們正在為多語言表征偏差以及針對刻板印象危害 (如 SeeGULL 和 SPICE) 的外部測試提供內部數據集。此外，我們還共享以負責任和包容性的方式收集人工注釋為重點的數據集，如 DICES 和 SRP。

Monk 膚色量表示例數據集
https://skintone.google/mste-dataset
SPICE
https://github.com/google-research-datasets/SPICE/tree/main
DICES
https://arxiv.org/abs/2306.11247
SRP
https://www.kaggle.com/datasets/google/jigsaw-specialized-rater-pools-dataset

未來方向

我們相信，這些基準有助于推進 AI 安全研究，確保以負責任的方式開發(fā)和部署 AI 系統(tǒng)。AI 安全屬于集體行動問題。前沿模型論壇 (Frontier Model Forum) 和 AI 伙伴關系 (Partnership on AI) 等團體也在重要的標準化舉措方面發(fā)揮著領導作用。我們很高興從一開始便與這些團體和 MLCommons 一起開展這項工作，也期待通過更多的共同努力，來促進以負責任的方式開發(fā)新的生成式 AI 工具。歡迎您持續(xù)關注我們，及時獲悉更多資訊。

集體行動問題
https://blog.google/technology/ai/a-shared-agenda-for-responsible-ai-progress/
前沿模型論壇
https://blog.google/outreach-initiatives/public-policy/google-microsoft-openai-anthropic-frontier-model-forum/
AI 伙伴關系
https://partnershiponai.org/

致謝

非常感謝為這項工作做出貢獻的 Google 團隊成員: Peter Mattson、Lora Aroyo、Chris Welty、Kathy Meier-Hellstern、Parker Barnes、Tulsee Doshi、Manvinder Singh、Brian Goldman、Nitesh Goyal、Alice Friend、Nicole Delange、Kerry Barker、Madeleine Elish、Shruti Sheth、Dawn Bloxwich、William Isaac、Christina Butterfield。

原文標題：攜手 MLCommons，制定有效且值得信賴的 AI 安全基準

文章出處：【微信公眾號：谷歌開發(fā)者】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6080

瀏覽量
104349

原文標題：攜手 MLCommons，制定有效且值得信賴的 AI 安全基準

文章出處：【微信號：Google_Developers，微信公眾號：谷歌開發(fā)者】歡迎添加關注！文章轉載請注明出處。

TDA4 Edge AI處理器的性能和效率基準測試

電子發(fā)燒友網站提供《TDA4 Edge AI處理器的性能和效率基準測試.pdf》資料免費下載

發(fā)表于 09-11 09:21 ?0次下載

TDA4 Edge <b class='flag-5'>AI</b>處理器的性能和效率<b class='flag-5'>基準</b>測試

Freepik攜手Magnific AI推出AI圖像生成器

近日，設計資源巨頭Freepik攜手Magnific AI，共同推出了革命性的AI圖像生成器——Freepik Mystic，這一里程碑式的發(fā)布標志著AI圖像創(chuàng)作領域邁入了一個全新的高

發(fā)表于 08-30 16:23 ?947次閱讀

甲骨文攜手Rai Way，強化AI應用與數據安全

近日，全球領先的軟件巨頭甲骨文與意大利基礎設施服務提供商Rai Way宣布達成重要合作。雙方將攜手在Rai Way分布廣泛的數據中心部署甲骨文的人工智能應用系統(tǒng)，為企業(yè)客戶帶來前所未有的服務體驗與安全保障。

發(fā)表于 07-27 17:19 ?2026次閱讀

Claude安卓版發(fā)布,旨在為用戶提供信賴的AI助手

　7月17日最新資訊，繼今年5月成功推出iOS版本后，Anthropic公司今日正式發(fā)布了Claude應用的安卓版本，該應用專為安卓8.0及以上版本設備設計，旨在為用戶提供一款高效且值得信賴的

發(fā)表于 07-17 16:56 ?421次閱讀

平衡創(chuàng)新與倫理：AI時代的隱私保護和算法公平

成了一把雙刃劍，其銳利的一面正逐漸指向我們的核心價值。面對這些挑戰(zhàn)，制定一套有效的AI治理框架和隱私保護機制變得迫在眉睫。確保AI決策的透明度是解決這些問題的關鍵一步。透明度不僅

發(fā)表于 07-16 15:07

英國AI安全研究所推出AI模型安全評估平臺

據報道，英國人工智能安全研究院近日發(fā)布了名為“Inspect”的AI模型安全評估平臺，此平臺采用開源技術且對全球AI工程師免費開放，旨在提升

發(fā)表于 05-13 15:20 ?276次閱讀

值得信賴的工業(yè)主板制造商

朗銳智科是一家值得信賴的工業(yè)主板制造商，為工業(yè)領域提供可靠的主板解決方案。我們的工業(yè)主板經過嚴格的行業(yè)標準測試和驗證，以確保其在惡劣環(huán)境下的穩(wěn)定性和耐用性。我們的產品具有廣泛的兼容性和可擴展性，適合

發(fā)表于 04-24 11:21 ?330次閱讀

AI安全基準測試 v0.5: 聚焦通用聊天文本模型安全性

隨著AI技術的快速發(fā)展，相關安全問題也日益凸顯。僅過去數周內，便有LastPass公司遭遇音頻深度偽造攻擊等案例浮出水面。為了應對這一挑戰(zhàn)，新推出的AI Safety基準測試將成為模型

發(fā)表于 04-19 11:12 ?281次閱讀

世界數字技術院發(fā)布：生成式AI安全測試標準及大語言模型

據悉，上述兩款標準主要針對大型模型與生成式AI應用領域的安全檢測設定了新基準。參與制定工作的單位有OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等多家知名企業(yè)，其中，

發(fā)表于 04-17 16:51 ?840次閱讀

聯想攜手京東，緊扣大模型和生成式AI技術

聯想與京東攜手，緊扣大模型和生成式AI技術帶來的產業(yè)機遇，在多個領域展開深入合作。

發(fā)表于 04-12 10:27 ?521次閱讀

UL Procyon AI 發(fā)布圖像生成基準測試，基于Stable Diffusion

UL去年發(fā)布的首個Windows版Procyon AI推理基準測試，以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統(tǒng)一、精確且易于理解的工作負載，用以保證各支持硬件間

發(fā)表于 03-25 16:16 ?706次閱讀

AI智能網關如何助力危化品安全監(jiān)測

得益于AI技術的蓬勃發(fā)展，當前人們可以充分利用AI技術，實現對各類危化品的高敏感、高精度、實時可靠監(jiān)測管控，有效防范減少安全事故發(fā)生。

發(fā)表于 11-23 17:30 ?302次閱讀

值得信賴的搭檔：AI 軟件可確保駕駛員安全并專注于前方路況

值得信賴的搭檔：AI 軟件可確保駕駛員安全并專注于前方路況

發(fā)表于 10-27 15:49 ?345次閱讀

中偉視界&amp;礦山安全生產：露天煤礦智慧礦山ai建設，AI能解決哪些安全隱患？

智慧礦山AI技術在露天煤礦中的應用能夠有效解決多項安全隱患，從而提升礦山的安全性和生產效率。

發(fā)表于 09-26 18:34 ?359次閱讀

2023英特爾on技術創(chuàng)新大會：加速AI創(chuàng)新

英特爾為先進科技注入AI動力，提供開放、可擴展和值得信賴的解決方案，幫助客戶贏在AI時代

發(fā)表于 09-22 17:32 ?428次閱讀

搜索歷史

攜手 MLCommons，制定有效且值得信賴的 AI 安全基準

評論

TDA4 Edge AI處理器的性能和效率基準測試

Freepik攜手Magnific AI推出AI圖像生成器

甲骨文攜手Rai Way，強化AI應用與數據安全

Claude安卓版發(fā)布,旨在為用戶提供信賴的AI助手

平衡創(chuàng)新與倫理：AI時代的隱私保護和算法公平

英國AI安全研究所推出AI模型安全評估平臺

值得信賴的工業(yè)主板制造商

AI安全基準測試 v0.5: 聚焦通用聊天文本模型安全性

世界數字技術院發(fā)布：生成式AI安全測試標準及大語言模型

聯想攜手京東，緊扣大模型和生成式AI技術

UL Procyon AI 發(fā)布圖像生成基準測試，基于Stable Diffusion

AI智能網關如何助力危化品安全監(jiān)測

值得信賴的搭檔：AI 軟件可確保駕駛員安全并專注于前方路況

中偉視界&amp;礦山安全生產：露天煤礦智慧礦山ai建設，AI能解決哪些安全隱患？

2023英特爾on技術創(chuàng)新大會：加速AI創(chuàng)新

搜索歷史

攜手 MLCommons，制定有效且值得信賴的 AI 安全基準

評論

攜手 MLCommons，制定有效且值得信賴的 AI 安全基準