新時代高科技不計其數越來越發達,小伙伴們看過不少科技新聞吧,在我們生活中應該也用到很多這些高科技東西,有哪些小伙伴值的關注的呢,今天就跟大家分享一篇有關科技方面知識,希望大家會喜歡。
Google發起了面向機器學習的眾包不良測試集(CATS4ML)挑戰。它要求挑戰者使用創新方法在機器學習模型中查找未知未知物的示例。不久,當這項技術變得更加成熟時,Google的對象識別技術將表現得更好。
CATS4ML將能夠在對象識別任務中挑戰機器學習的能力。測試集包含許多難以使用算法處理的示例。并且這將發現機器學習具有高度的置信度,但是存在分類錯誤。CATS4ML的目的是為開發人員提供一個數據集,以探索算法的弱點,同時也使研究人員可以更好地創建基準測試數據集,并使這些數據集更加平衡和多樣化。
谷歌提到,機器學習模型的有效性取決于算法以及訓練和評估數據。盡管研究人員過去在改善算法和訓練數據方面做了很多工作,但是用于專門評估模型的數據和挑戰并不普遍。現有的評估數據集太簡單,并且識別不容易出現差異。當缺少模棱兩可的示例時,無法真正測試機器學習模型的有效性,并且該模型可能存在弱點。
所謂的弱點是由于評估數據集缺少此類示例,因此模型難以準確評估示例分類的情況。有兩個缺點。它們分為已知未知數和未知未知數。所謂的已知未知數是指模型無法確定分類正確性的示例。例如,不可能確定照片中的物體是否是貓。這些是未知的未知數。該模型可以肯定答案,但這實際上是分類錯誤的一個示例。