AI與偏見:從當代新“相面術(shù)”說起
圖片來自“123rf.com.cn”
相面術(shù),無疑是一門古老而又生命力旺盛的學問。
說它古老,是因為其歷史悠久、源遠流長。中國相面術(shù)的起源,最早可以上溯至氏族社會時期,到了春秋戰(zhàn)國時期就已十分流行,《麻衣神相》是相面術(shù)的集大成之作,擁有深廣的群眾基礎(chǔ)。大家耳熟能詳?shù)奈膶W作品中經(jīng)常能看到相面術(shù)的身影:大富大貴之人一般都相貌不凡,如《三國演義》中劉備的“雙耳垂肩、雙手過膝”、關(guān)羽的“丹鳳眼、臥蠶眉”等;而奸惡之人也都天生異相,如《史記》里秦始皇的“蜂準、長目、摯鳥膺、豺聲”。簡而言之,相面術(shù)就是為“那個人一瞅就不是啥好東西”這句話所準備的理論基礎(chǔ)。
說它生命力旺盛,是因為相面術(shù)不但能深深地植根于人類“顏控”的本性,還能緊隨時代發(fā)展的步伐,調(diào)整自身形態(tài),最終在新的時代成功站穩(wěn)腳跟。從古代游街串巷的算命先生,到曾國藩的《冰鑒》,再到龍勃羅梭(Cesare Lombroso, 1836-1909)的犯罪人類學的提出,相面術(shù)總能“以無厚入有間”,找到自己的容身之處。在AI日益發(fā)揮著如同工業(yè)時代“蒸汽機”一樣作用的今天,相面術(shù)似乎也嗅到了自己“寄生”的新方向。
去年秋天,來自斯坦福大學的Michal Kosinski和Yilun Wang合作發(fā)表了一篇題為《深度神經(jīng)網(wǎng)絡可通過面部圖像確定個體性取向》(Deep Neural Networks can Detect Sexual Orientation from Faces)的論文,一石激起千層浪,引發(fā)了輿論的大嘩。
二人從美國約會網(wǎng)站及平臺的公開信息中采集了14776位用戶的35326張面部照片,并用深度神經(jīng)網(wǎng)絡(DNN)密集提取并量化了他們的臉型、嘴型、鼻形以及面部毛發(fā)等特征,接著他們引入VGG-Face DNN模型,通過面部表情、光線、圖像屬性等因素標記圖像中的人臉,隨后二人用奇異值分解(SVD)等手段對圖像分類,區(qū)分出同性戀與非同性戀照片。
經(jīng)過一系列訓練,該算法識別男女性取向的準確率分別達到了81%和71%;倘若受測個體的照片有五篇以上的話,這個數(shù)字將分別提高至91%和83%。二人還用數(shù)千張圖片分別合成了兩組照片,分別顯示了男女異性戀和同性戀較具代表性的樣態(tài),兩相比對,同性戀人群的面部輪廓和五官位置形狀確實有細微的差別。
這項研究成果被有些媒體稱之為“AI Gaydar”,它一經(jīng)發(fā)表,就引發(fā)了LGBTQ群體的強烈不滿,這一群體中兩個較有代表性的組織Human Rights Campaign (HRC)和GLAAD直接將此研究斥之為“偽科學”(Junk Science),并認為這一技術(shù)手段的廣泛應用不但會嚴重侵害個人隱私權(quán),而是還將會是對本就脆弱敏感的性少數(shù)人群的新的“系統(tǒng)化虐待”(Systematized Abuse)。更令人不安的是,該文的作者之一Michal Kosinski還對《衛(wèi)報》的記者表示,這一算法在未來還可應用到判定受測者的智商、政治傾向以及犯罪幾率等領(lǐng)域。
事實上,早就有科研團隊在Kosinski提及的幾個領(lǐng)域中取得了研究成果。來自上海交通大學的兩位研究者Xiaolin Wu(武筱林)和Xi Zhang(張熙)于2016年的11月份就在arXiv上提交了一篇題為《基于面部圖像的自動犯罪概率推斷》(Automated Inference on Criminality using Face Images)的論文,二人通過視覺識別和機器學習技術(shù),檢測了1856張中國成年男子的照片,其中近一半照片都來自已經(jīng)定罪的罪犯。
實驗結(jié)果表明,這一算法可以以90%左右的正確率識別出罪犯和非罪犯;同時,他們還發(fā)現(xiàn)罪犯和非罪犯在內(nèi)眼角間距、上唇曲率和鼻唇角度這三個測度上存在著較顯著的差異,并且罪犯面孔特征的差異要大于守法公民。這篇論文的有些結(jié)論與“麻衣相法”的部分內(nèi)容不謀而合,而論文作者也將陳摶所撰寫的《神相全編》(陜西師范大學出版社,2010)列入到了自己的參考文獻當中。
姑且不論上述兩項研究的樣本擇。〝(shù)量、范圍、標準)是否客觀,也不論研究者們設(shè)計實驗的初衷(前者意欲提醒人們注意個人信息安全,后者試圖反對所謂的“相由心生”)是否合理,這樣的研究在邏輯上就存有很大的漏洞:“同性戀”、“犯罪”的成因由多個變量決定,在研究中研究者卻將“相”或“外貌”作為了唯一變量,而這唯一的變量其實是“天生”的,換言之,就是“不變”的;亦即,作為不變的“變量”的“相”與諸如“同性戀”、“犯罪”之間是無法建立起因果關(guān)系的;谶@點,我們可以大致斷定,這類研究不過是形形色色“相面術(shù)”披著AI的外衣在當代的又一次“借尸還魂”罷了。
更令人擔憂的是,由于AI的加持,這樣研究成果一旦從實驗室應用到實際生活場景當中,所產(chǎn)生的負面影響將會超出以往所有的“相面術(shù)”:由于AI處理數(shù)據(jù)的超強能力,這些成果的負面影響極有可能波及到社會中的大多數(shù)人;倘若這些成果一旦堂而皇之地進入到極權(quán)政體或同性戀非法的國家的話,“相面”借由技術(shù)這一貌似“客觀”、“科學”的外衣,將在嚴重侵害少數(shù)族群的正當權(quán)益的同時,制造出一個人人自危的社會環(huán)境,無限放大、擴散本已存在于人類社會的各種偏見、歧視,最終導致災難性的后果。納粹的“雅利安種族優(yōu)越論”殷鑒未遠,從事科學研究的工作者們對此需要慎之又慎。
(納粹科學家正在做容貌測量)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字