人妻精品久久无码专区涩涩,免费AV无码无在线观看,无码人妻AⅤ一区二区三区水密桃

機器學習 (ML) 模型的性能既取決于學習算法，也取決于用于訓練和評估的數(shù)據。算法的作用已經得到充分研究，也是眾多挑戰(zhàn)（如 SQuAD、GLUE、ImageNet 等）的焦點。此外，數(shù)據也已經過改進，包括一系列應對 ML 評估問題的研討會。相比之下，專注于 - 用于評估 ML 模型的數(shù)據的研究和挑戰(zhàn)并不常見。

此外，許多評估數(shù)據集包含容易評估的項目，例如帶有易于識別的主題的照片，因此錯過了真實世界環(huán)境的自然歧義。評估中缺少模糊的真實世界樣本，削弱了可靠地測試機器學習性能的能力，這使 ML 模型容易形成“弱點”，即模型難以或無法準確評估的樣本的類別，因為評估集中缺少這一類樣本。

SQuAD

https://rajpurkar.github.io/SQuAD-explorer/

GLUE

https://gluebenchmark.com/leaderboard

ImageNet

https://kobiso.github.io/Computer-Vision-Leaderboard/imagenet

為了解決識別 ML 模型中這些弱點的問題，我們最近在 HCOMP 2020 上發(fā)起了眾包機器學習不良測試集 (CATS4ML) 數(shù)據挑戰(zhàn)賽（面向全球研究人員和開發(fā)者開放至 2021 年 4 月 30 日）。挑戰(zhàn)的目標是提高 ML 評估集的標準，并盡可能多地找到使算法處理起來會有困惑或其他問題的樣本。CATS4ML 依靠人們的能力和直覺來發(fā)現(xiàn)機器學習具有信心但實際上卻分類錯誤的新數(shù)據樣本。

眾包機器學習不良測試集

https://cats4ml.humancomputation.com/

什么是 ML 的“弱點”？

弱點有兩類：已知的未知(Known Unknowns)和未知的未知(Unknown Unknowns)。已知的未知是指模型對正確分類沒有把握的樣本。研究界在被稱為主動學習的領域研究這一問題，并發(fā)現(xiàn)了解決方法，用很籠統(tǒng)的話來說就是，在不確定的樣本上向人們交互式地征集新的標簽。例如，如果模型不確定一張照片的主題是否是貓，會要求人員進行驗證；但如果系統(tǒng)確定，則不會要求人員驗證。雖然這方面還有改進的空間，但令人欣慰的是，模型的置信度與其性能相關，也就是說，人們可以看到模型不知道的東西。

主動學習

http://digital.library.wisc.edu/1793/60660

另一方面，未知的未知是指模型對其答案充滿信心，但實際上是錯誤的樣本。主動發(fā)現(xiàn)未知的未知的研究（例如，Attenberg 2015 和 Crawford 2019）已經幫助發(fā)現(xiàn)了大量的非預期機器行為。與這類發(fā)現(xiàn)未知的未知方法相比，生成對抗網絡 (GAN) 以計算機光學錯覺的形式為圖像識別模型生成未知的未知，導致深度學習模型犯下人類無法感知的錯誤。雖然 GAN 在有意操縱的情況下會發(fā)現(xiàn)模型漏洞，但真實世界樣本可以更好地突出模型在日常性能中的失敗。這些真實世界樣本是 CATS4ML 感興趣的未知的未知 - 挑戰(zhàn)的目的是收集人類可以可靠地解釋但許多 ML 模型會自信地不同意的未經操作的樣本。

Attenberg 2015

https://dl.acm.org/doi/10.1145/2700832

Crawford 2019

https://excavating.ai

示例說明由對抗噪聲引起的計算機視覺錯覺如何幫助發(fā)現(xiàn) ML 模型的機器操作未知的未知（基于 Brown 2018）

Brown 2018

https://ai.googleblog.com/2018/09/introducing-unrestricted-adversarial.html

CATS4ML 數(shù)據挑戰(zhàn)賽第一版：

Open Images 數(shù)據集

CATS4ML 數(shù)據挑戰(zhàn)賽側重于視覺識別，使用Open Images 數(shù)據集的圖像和標簽。挑戰(zhàn)賽的目標圖像選自 Open Images 數(shù)據集，以及來自同一數(shù)據集的一組 24 個目標標簽。挑戰(zhàn)賽的參與者被邀請發(fā)明新的創(chuàng)造性方法探索這個現(xiàn)有的公開可用數(shù)據集，并以預先選擇的目標標簽列表為中心，為 ML 模型發(fā)現(xiàn)未知的未知樣本。

CATS4ML 數(shù)據挑戰(zhàn)賽

https://cats4ml.humancomputation.com/

CATS4ML 是對 FAIR 最近推出的 DynaBench 動態(tài)數(shù)據收集研究平臺的補充。DynaBench 使用 ML 模型在人類參與下解決靜態(tài)基準問題，而 CATS4ML 則專注于通過鼓勵探索現(xiàn)有 ML 基準有無可能屬于未知的未知不利樣本改善 ML 評估數(shù)據集。結果將有助于檢測和避免未來的錯誤，也將對模型的可解釋性提供見解。

FAIR

https://ai.facebook.com/tools/dynabench/

DynaBench

https://dynabench.org/

CATS4ML 旨在由此通過提供數(shù)據集資源來提高人們對這個問題的認識，開發(fā)者可以利用這些資源發(fā)現(xiàn)算法弱點。這也將讓研究人員了解如何為機器學習創(chuàng)建更平衡、更多樣化、更具有社會意識的基準數(shù)據集。

編輯：jq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

數(shù)據

數(shù)據

+關注

關注
8

文章
6795

瀏覽量
88730
GLUE

GLUE

+關注

關注
0

文章
5

瀏覽量
7339
機器學習

機器學習

+關注

關注
66

文章
8344

瀏覽量
132288

原文標題：探索機器學習中的未解之謎

文章出處：【微信號：tensorflowers，微信公眾號：Tensorflowers】歡迎添加關注！文章轉載請注明出處。

AI大模型與深度學習的關系

AI大模型與深度學習之間存在著密不可分的關系，它們互為促進，相輔相成。以下是對兩者關系的介紹：一、深度學習是AI大模型的基礎技術支撐：深度學習

發(fā)表于 10-23 15:25 ?291次閱讀

AI大模型與傳統(tǒng)機器學習的區(qū)別

AI大模型與傳統(tǒng)機器學習在多個方面存在顯著的區(qū)別。以下是對這些區(qū)別的介紹：一、模型規(guī)模與復雜度 AI大模型：通常包含數(shù)十億甚至數(shù)萬億的參

發(fā)表于 10-23 15:01 ?281次閱讀

為AI、ML和數(shù)字孿生模型建立可信數(shù)據

在當今數(shù)據驅動的世界中，人工智能（AI）、機器學習（ML）和數(shù)字孿生技術正在深刻改變行業(yè)、流程和企業(yè)運營環(huán)境。每天產生的超過3.28億TB數(shù)據已成為新“石油”——為下一代數(shù)字系統(tǒng)提供所需的能源。

發(fā)表于 09-30 10:23 ?233次閱讀

AI引擎機器學習陣列指南

云端動態(tài)工作負載以及超高帶寬網絡，同時還可提供高級安全性功能。AI 和數(shù)據科學家以及軟硬件開發(fā)者均可充分利用高計算密度的優(yōu)勢來加速提升任何應用的性能。AI 引擎機器學習擁有先進的張量計算能力，非常適合用于高度優(yōu)化的 AI 和

發(fā)表于 09-18 09:16 ?281次閱讀

【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

提高機器學習模型效果與性能的過程。而我對特征工程的理解就是從一堆數(shù)據里找出能表示這堆數(shù)據的最小數(shù)據集，而這個找出特征數(shù)據的過程就是信息提取。隨后給出了一系列定義，包括特征的最小最大

發(fā)表于 08-14 18:00

如何訓練一個有效的eIQ基本分類模型

處理單元(NPU)，用于機器學習(ML)加速。相比單獨的CPU核，eIQ Neutron NPU能夠提供高達42倍的機器學習推理

發(fā)表于 08-01 09:29 ?1680次閱讀

機器學習中的數(shù)據分割方法

在機器學習中，數(shù)據分割是一項至關重要的任務，它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器

發(fā)表于 07-10 16:10 ?1149次閱讀

如何理解機器學習中的訓練集、驗證集和測試集

理解機器學習中的訓練集、驗證集和測試集，是掌握機器學習核心概念和流程的重要一步。這三者不僅構成了模型學習

發(fā)表于 07-10 15:45 ?2771次閱讀

Al大模型機器人

和迭代來不斷改進自身性能。它們可以從用戶交互中學習并根據反饋進行調整，以提高對話質量和準確性?？啥ㄖ菩耘c整合性: AI大模型機器人可以根據特定需求進行定制和整合，以滿足不同場景和應用的

發(fā)表于 07-05 08:52

人工智能、機器學習和深度學習是什么

在科技日新月異的今天，人工智能（Artificial Intelligence, AI）、機器學習（Machine Learning, ML）和深度學習（Deep Learning,

發(fā)表于 07-03 18:22 ?994次閱讀

深入探討機器學習的可視化技術

機器學習可視化（簡稱ML可視化）一般是指通過圖形或交互方式表示機器學習模型、數(shù)據及其關系的過程。

發(fā)表于 04-25 11:17 ?349次閱讀

機器學習（ML）推理主要計算之存內計算芯片

機器學習（ML）應用已經在汽車、醫(yī)療保健、金融和技術等各個領域變得無處不在。這導致對高性能、高能效 ML 硬件解決方案的需求不斷增加。

發(fā)表于 04-07 10:48 ?996次閱讀

Achronix新推出一款用于AI/ML計算或者大模型的B200芯片

近日舉辦的GTC大會把人工智能/機器學習（AI/ML）領域中的算力比拼又帶到了一個新的高度，這不只是說明了通用圖形處理器（GPGPU）時代的來臨

發(fā)表于 03-28 15:48 ?712次閱讀

使用ml configurator進行tflite網絡模型的轉換不成功怎么解決？

使用ml configurator進行tflite網絡模型的轉換不成功，提示錯誤，請幫忙協(xié)助謝謝 [ERROR] Failed to run QEMU

發(fā)表于 01-31 06:56

如何使用TensorFlow構建機器學習模型

在這篇文章中，我將逐步講解如何使用 TensorFlow 創(chuàng)建一個簡單的機器學習模型。

發(fā)表于 01-08 09:25 ?891次閱讀