AI性別歧視有救,MIT研究人員給出減少AI預測偏差新方法
在社交媒體的應用場景中,人工智能算法模型的偏差導致搜索結果或用戶體驗不佳常常出現(xiàn),甚至可以說是無法規(guī)避,如人們熟知的大數(shù)據(jù)殺熟等。可以預見,當AI應用到醫(yī)療保健、自動駕駛汽車、刑事司法或刑事處理等場景中時,更多關乎生命、公平、道德等的問題將會出現(xiàn)。此前,亞馬遜用AI招聘出現(xiàn)了性別歧視問題就是有力的證明。
在世界每一個角落部署AI,這可能導致持續(xù)的系統(tǒng)性歧視,為此MIT計算機科學人工智能實驗室(CSAIL)研究人員創(chuàng)造了一種減少AI偏差,同時又不降低預測結果準確性的方法。
據(jù)麻省理工學院教授DavidSontag所言,傳統(tǒng)方法可能建議將與多數(shù)人群相關的數(shù)據(jù)集隨機化,作為解決不同人群不平等結果的一種方法,但這種方會權衡較低的預測準確性,以實現(xiàn)所有人群的公平性,關鍵是從代表性不足的群體中挖掘更多數(shù)據(jù)。例如,研究人員發(fā)現(xiàn),在一個案例中,AI模型將女性標記為低收入,男性標記為高收入,這是有失客觀性的,因此他們通過將數(shù)據(jù)集中女性的代表性提高10倍,達到了將不準確結果的數(shù)量減少了40%的效果。
Sontag在一份聲明中給出這一設計的簡單解釋:“我們認為這是一個工具箱,可幫助機器學習工程師弄清楚他們的數(shù)據(jù)要問什么問題,以便診斷他們的系統(tǒng)為什么會做出不公平的預測。”
他進一步解釋說:“在這項工作中,我們認為預測的公平性應該在數(shù)據(jù)的背景下進行評估,并且樣本量不足或未測量的預測變量引起的不公平性應該通過數(shù)據(jù)收集來解決,而不是通過約束模型來解決!
誠然,預測準確性的差異往往歸因于數(shù)據(jù)缺乏或不可測量的變量因素,因此該研究團隊建議在進行公平標準評論之前,對模型偏差,模型方差和結果噪聲進行AI模型分析。
對于這一研究的成本,Sontag表示,“這揭示并分離了數(shù)據(jù)收集不足和模型選擇對公平性的不利影響。為了追求公平,其成本也要納入到數(shù)據(jù)收集和模型開發(fā)的投資。但在某些十分重要的應用程序中,其好處往往超過成本!
在Sontag與其博士團隊一起撰寫的論文中,有這一方法的詳細解釋。據(jù)悉,該成果將于下個月在蒙特利爾的神經(jīng)信息處理系統(tǒng)(NIPS)上公布。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 2 黃仁勛:與雷軍長期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化
- 5 六大國產(chǎn)大模型,誰是最強“金融分析師”?|錦緞評測
- 6 2025年第一支10倍股,來了!
- 7 募資39.85億元!寒武紀押注大模型芯片與軟件平臺
- 8 國內(nèi)免費版Deep Research上線,秘塔AI深度研究嘗試重塑知識工作范式
- 9 清庫存?曝英偉達H20供應有限,且沒有復產(chǎn)計劃
- 10 具身智能機器人量產(chǎn)前夜,標準機腦正在成型