Mbioh, W. (2025). Beyond possessive agency: TikTok, YouTube, and the inadequacies of GDPR, OSA, DSA, and AIA. Onati Socio-Legal Series, 15(3), 1022-1051. (gemini翻譯與整理)
論文核心論點摘要與批判性分析
題目: 超越佔有式能動性:TikTok、YouTube 以及 GDPR、OSA、DSA 和 AIA 的不足
作者: Will Mbioh (2025)
一、 技術現實:預測與控制的界線消失
論文首先解構了現代推薦系統(如 TikTok 和 YouTube)的技術骨幹。作者指出,這不僅僅是「演算法」,而是一個由深度神經網絡 (Deep Neural Networks)、大數法則與多臂強盜演算法 (Multi-armed Bandits) 組成的龐大「裝配」(assemblage)。
訓練與使用的模糊化: 透過多臂強盜演算法的「探索與利用」(Explore and Exploit)機制,使用者在消費內容的同時,也在即時訓練系統。
預測即指令: 由於數據規模極大(大數法則),系統對群體行為的預測準確度已極高。當預測準確度超過 90% 時,系統不再只是「猜測」你會看什麼,而是透過微調權重,實質上指令並引導了使用者的行為。預測與實際行為之間的差距已微乎其微。
二、 理論框架:從「個人」到「關係」
作者引用 Karen Barad 的女性主義新物質主義,挑戰了傳統的能動性(Agency)概念:
內-作用 (Intra-action): 能動性不是個人(使用者)或機器(平台)單獨擁有的屬性,而是在兩者糾纏的互動中湧現(emergent)的。
分佈式能動性 (Distributed Agency): 使用者的「想看」並非純粹的內在意圖,而是由演算法的權重、介面設計與運算能力共同構成的。
三、 法律批判:過時的「佔有式能動性」假設
這是論文最核心的法律批判點。現行歐盟與英國法律(GDPR, DSA, OSA, AIA)皆建立在錯誤的本體論假設上:
佔有式能動性 (Possessive Agency): 法律假設「人」是獨立自主的主體,擁有完整的自由意志,而平台只是中立的工具。因此,法律的解方往往是「同意權」、「退出選項」或「透明度」。
法律的盲點: 既然主體性是與機器共同構成(co-constituted)的,那麼依賴「個人同意」就變得毫無意義,因為那個「同意」的瞬間,使用者的意圖已經被演算法的指令性權力所滲透與形塑。
例外論的失敗: 法律只將兒童視為「能動性不全」的例外,卻忽視了在強大的運算力面前,所有成人的能動性都已被系統性的統計力量所壓倒。
四、 危害分析:乘數效應與構成性傷害
作者特別指出,這不僅是成癮問題,而是本體論層次的傷害。
脆弱性的利用: 當使用者處於心理健康危機、孤立或認知超載(絕望)的狀態時,演算法的「探索」機制會捕捉這些微弱訊號。
乘數效應 (Multiplicative Risk): 演算法的精準度與使用者的脆弱性相互加乘,形成強大的「引力」,將使用者鎖死在有害的軌跡上(如反精神病學、激進意識形態)。這不僅影響他們看什麼,更從根本上改變了他們是誰。
批判性分析與研究啟示
1. 對「透明度」神話的解構
這篇論文有力地反駁了當前科技監管的主流解方——「演算法透明化」。由於深度學習的運作是非線性的、機率性的(基於權重而非規則),根本沒有一個靜態的「規則」可以被揭露。要求透明度反而可能掩蓋了真正的問題:權力的關係性本質。這提示未來的法律研究應從「知情同意」轉向「系統性護理」或「關係性治理」。
2. 法律主體的重新定義
Mbioh 的論點呼應了傅柯與 Butler 的觀點,即法律具有「生產性」。現行法律透過預設一個強大的自主個體,反而創造了一個不受保護的漏洞,讓演算法權力得以在此運作。未來的立法可能需要參考環境法或公共衛生法的模式,承認個體在特定環境(演算法生態系)中的不可分割性,而非僅僅依賴個人權利的主張。
3. 下一步的研究方向
這篇論文為「神經權利」(Neurorights)或「認知自由」的討論提供了堅實的理論基礎。如果演算法能以統計學上可忽略的誤差「指令」人類行為,那麼憲法層次對於「思想自由」的保障是否也需要重新詮釋?
論文名稱:
超越佔有式能動性:TikTok、YouTube 以及 GDPR、OSA、DSA 和 AIA 的不足
OÑATI SOCIO-LEGAL SERIES VOLUME 15 ISSUE 3 (2025), 1022-1051: DESAFÍOS SOCIALES Y JURÍDICOS DEL NUEVO PARADIGMA DE LA DISCAPACIDAD INTELECTUAL. UN COMPROMISO CON LOS DERECHOS HUMANOS, LA INCLUSIÓN Y LA IGUALDAD
DOI連結: HTTPS://DOI.ORG/10.35295/OSLS.IISL.2237
收到日期:2025年1月6日,接受日期:2025年2月27日,首次線上發布:2025年3月27日,正式版本發布:2025年6月2日
WILL MBIOH (英國肯特大學肯特法學院法學高級講師)
摘要 (Abstract)
本文批判了英國和歐盟法規——包括《一般資料保護規則》(GDPR)、《線上安全法》(Online Safety Act, OSA)、《數位服務法》(Digital Services Act, DSA)和《人工智慧法》(Artificial Intelligence Act, AIA)——所基於的一項基礎假設,即「能動性」(agency)是一種根植於個人自主權的「佔有式」(possessive)屬性。本文以 YouTube 和 TikTok 為案例研究,檢視了由深度神經網絡(deep neural networks)、多臂強盜演算法(multi-armed bandits)和強化學習(reinforcement learning)驅動的先進推薦系統,如何模糊了使用者能動性與平台影響力之間的界線。藉助女性主義關係理論(feminist relational theory)以及凱倫·巴拉德(Karen Barad)的「內-作用」(intra-action)和「繞射」(diffraction)概念,本文主張當代平台生成了一種獨特的、關係性的能動性形式,它在使用者行動與演算法系統之間的「中間地帶」(in-between)間隙性地運作。這種新興的指令性權力(directive power)對歐盟和英國現行關於線上安全的法律提出了挑戰,因為這些法律將平台視為中立的工具,而非共同構成(co-constitutive)的實體。本文呼籲重新構想法律本體論,並主張從「佔有式能動性」轉向「關係性治理」(relational governance),以應對現代演算法裝配(algorithmic assemblages)所帶來的複雜性與風險。
關鍵詞
GDPR, OSA, DSA, AIA;演算法治理;深度神經網絡;女性主義新物質主義;內-作用與繞射
目錄
前言 ...................................................................................................................... 1025
演算法推薦的骨幹:深度神經網絡概述 ................................................................................................................ 1026
TikTok 演算法:排序與權重的簡化視角 .......................... 1028
為何更多數據意味著更佳預測:大數法則的角色 ... 1029
尋找最佳路徑:多臂強盜演算法如何利用強化學習進行探索與利用 ............................................................................................................... 1031
超越史金納與偏誤:現代推薦系統的新興力量 ........................................... 1032
關係性自主與內-作用:演算法裝配中的分佈式能動性 ........................................................................................................... 1034
法律與佔有式能動性:DSA, OSA, GDPR, AIA ................................................. 1036
鑑於現代推薦系統的轉化性與指令性權力,佔有式能動性的侷限 ..................................................................................... 1038
演算法影響的危險:脆弱性與高風險後果 .......................................... 1040
結論 ....................................................................................................................... 1042
參考文獻 .............................................................................................................................. 1044
1. 前言 (Introduction)
在英國和歐盟,規範社群媒體與影音串流平台上使用者安全的主要法律如下:2016 年的《一般資料保護規則》(GDPR),規範個人資料的蒐集與處理;英國的 2023 年《線上安全法》(OSA)與歐盟的 2022 年《數位服務法》(DSA),兩者皆聚焦於平台在內容擴散與策展(curate)方面的義務與責任(參見 OSA, §§ 7–12; DSA, arts. 16, 23–24);以及歐盟的 2024 年《人工智慧法》(AIA),該法禁止特定演算法系統的使用,特別是涉及操縱或欺騙行為,如潛意識訊息傳遞以及針對兒童等脆弱群體的目標鎖定(參見 AIA, art. 5)。
儘管這些法規存在差異,但它們都隱含著一個共同的基礎假設,即關於「能動性」(agency)的假設。這一假設根植於傳統自由主義對「佔有式能動性」(possessive agency)的概念,建立在自主法律主體(autonomous legal subject)的觀念之上,認為能動性是個人內在的屬性(參見 GDPR, arts. 5–9, 12–14; DSA, recitals 50, 54, and arts. 14–15; OSA, §§ 14–15)。在平台的情境中,這種觀念表現為一種信念——或者更具體地說,是法律上的一個目標——即使用者是對平台採取行動的主體,其意志與意圖反映在他們的互動與參與中(例如,OSA, §§ 26–27, 38; GDPR, recital 32, art. 14)。在此模型下,平台被視為與使用者截然不同且分離的存在——它們是個人用來鏡像和反映其意圖的工具。
這種理解不僅限於法律領域,也延伸至學術研究,特別是在關於同溫層(echo chambers)和監控平台經濟(surveillance platform economy)的討論中(Sunstein 2018, Zuboff 2019)。在這些脈絡下,主要的擔憂在於,既然能動性本質上是個人主義和佔有式的,使用者便是透過與被動平台的互動來行使其能動性,而這些平台則強化、呼應並鏡像使用者的意圖與偏見(Sunstein 2017, 2018)。平台通常被想像為外部工具或鏡子,反映使用者的意圖與偏見,而非從根本上形塑或構成該意圖或能動性的實體(Sunstein 2018, Brown et al. 2022)。同樣地,在監控資本主義領域中,也出現了類似的擔憂:史金納式的行為制約(Skinnerian behavioural conditioning)。此處主要的擔憂是,平台(特別是透過其推薦系統)被設計來利用使用者內在的慾望,以及透過變動獎勵(variable rewards)獲取多巴胺刺激的生理需求(Alter 2017, Zuboff 2019)。此模型假設使用者擁有追求這些獎勵的內在驅動力,而平台作為外部系統,透過提供觸發多巴胺反應的隨機變化來鏡像並強化這種慾望(Zuboff 2019)。
橫跨這些脈絡——無論是在法律、同溫層理論,還是行為制約模型中——個人及其行為、意圖和偏見均被視為主要的分析單位。能動性始終被概念化為個人內在且獨有的屬性,並運作於一個假設個人與平台二元分離的框架內(Barad 2007)。雖然承認使用者與平台之間的關係,但這種關係主要被理解為兩個不同實體之間的互動。個人的能動性被視為與平台分離:平台要麼反映並回傳使用者的意圖(如在同溫層理論或法律框架中),要麼作用於使用者的內在驅動力與慾望(如在行為制約模型中)。即使當平台試圖影響使用者行為時,它也被想像成是在回應使用者的內在佔有式能動性,而非共同構成或重塑它(Sunstein 2017, 2018)。
以 YouTube 和 TikTok 為案例研究,並探討驅動它們的基礎演算法系統(主要是深度神經網絡、大數法則、多臂強盜演算法和強化學習),我將首先介紹這些基礎技術,並主張當前的能動性框架忽視了現代平台——特別是那些由先進推薦系統驅動的平台——如何透過模糊個人能動性與平台影響力之間的界線,從根本上挑戰這些假設。在這種情況下,這些系統的指令性(directive)與構成性(constitutive)權力是如此巨大,以至於系統預測內容與使用者實際行為之間的差距微乎其微,甚至可以說這種差距並非被消除,而是實際上被重新配置並在實踐中變得無法區分。
接著,藉助女性主義關係理論與新物質主義(Alaimo and Hekman 2008, Downie and Llewellyn 2011, Nedelsky 2011, Harris 2021)——特別是 Karen Barad 的「內-作用」(intra-action)與「繞射」(diffraction)概念(Barad 2007, 2014)——我將論證,所浮現的並非一種個人的、佔有式的能動性形式,而是一種獨特的行動與存在模式。這種模式在間隙中運作,存在於生成(becoming)與湧現(emergence)的「中間地帶」(in-between)空間,在此處,使用者的意向性與平台的指令性和構成性權力匯聚。這與其說是個人擁有或佔有的能動性,不如說是一種關係性產生的引力或動態力量,是由使用者行動與演算法系統的糾纏(entanglement)所形塑的(Barad 2007, Nedelsky 2011)。
因此,我最後將主張,這種能動性模式對當前適用的法律構成了重大挑戰,需要法律學者給予更多關注。對於處於脆弱情境和高風險場景的使用者而言,這些挑戰尤為嚴峻,因為能動性與演算法權力的糾纏動態可能加劇邊緣化並導致有害的軌跡。這些風險要求我們重新思考監管假設,以解釋這些系統的關係性和構成性本質,特別是考慮到它們有潛力以重大且往往有害的方式形塑使用者的決定與結果。
2. 演算法推薦的骨幹:深度神經網絡概述
YouTube 和 TikTok 等平台上的推薦系統極其複雜且精密(Covington et al. 2016, Fang et al. 2020, Smith 2021)。運行這些系統所需的運算能力與基礎設施是巨大的——這不僅是為了儲存必要的海量數據、資訊與軟體,也是為了執行支撐這些系統的高階數學建模與機器學習技術(Covington et al. 2016, Gao et al. 2017, Salehi Rizi and Granitzer 2017)。使用者感到直觀且有機的體驗(即如《紐約時報》所言,感覺它們在「讀心」(Smith 2021)),實際上是極其複雜過程的結果,我們無法在此詳盡描述。儘管如此,為了我們的討論目的,對這些系統基礎的關鍵技術有一個高層次的理解應已足夠。
YouTube 和 TikTok 等平台推薦系統的運作,大致可透過兩個相互關聯的階段來理解(Covington et al. 2016, Smith 2021)。第一階段發生在離線狀態,獨立於使用者的即時參與(Chen et al. 2024)。這涉及訓練預測模型,該模型稍後將在使用者與平台互動時被使用。在此階段,公司蒐集並聚合大量的歷史數據——數十億次的使用者互動、行為與平台上的活動——並使用機器學習來處理這些數據集(這是一種教導電腦基於數據來識別模式、做出決策或預測結果的方法,無需針對每種情境進行明確編程,並隨著處理更多資訊而隨時間改進)(Covington et al. 2016, Smith 2021)。
為了讓大家對這些數據的龐大規模與多樣性有個概念,平台會從使用者那裡蒐集顯性與隱性的數據(稱為「訊號」)(Covington et al. 2016, Smith 2021)。顯性訊號包括按讚或倒讚影片、訂閱頻道、評論內容、將影片儲存至播放清單,以及與他人分享等行動。這些是使用者採取的有形、有意圖的行動。此外,平台也蒐集隱性訊號,這些訊號往往較不明顯,但在形塑推薦上同樣重要。這包括數據如:使用者是否完整看完影片、暫停、重播特定段落或快轉跳過(Covington et al. 2016, Hu et al. 2018)。它還包括使用者游標停留在縮圖上的時間、滾動的速度與方向、重訪特定類型內容的頻率,甚至是他們活躍的時段。此外,除了這些行為訊號,平台還蒐集情境資訊,如使用者的設備類型、作業系統、位置、語言偏好與網路速度。它們也可能納入推論出或由使用者直接提供的人口統計數據,包括年齡、性別與區域標識符(Covington et al. 2016)。綜合來看,這些數據的規模是巨大的。全球數十億使用者每秒產生數百萬次互動,平台每天處理 PB 級(petabytes)的資訊(作為參考,單一 PB 相當於超過 5000 億頁的標準列印文本,或大約 13 年連續播放的高畫質影片)(Covington et al. 2016, Georgevici and Terblanche 2019)。
處理這些數據的機器學習技術稱為深度神經網絡(Deep Neural Network)(Covington et al. 2016, Vieira et al. 2020)。雖然它常被描述為模仿人腦結構的演算法——類比於神經與突觸架構(Montesinos López et al. 2022)——但一個更直觀的想像方式可能是將其視為一部巨大且極其複雜、經過精密調校與高度校準的機器、裝置或裝配(assemblage),由數百、數千甚至(在「深度」網絡的情況下)數萬層相互連接的演算法共同運作以完成任務(Montesinos López et al. 2022)。
由超級電腦(之所以如此稱呼,是因為它們比一般電腦強大得多,能夠每秒執行數兆次計算,並透過先進的平行處理同時處理龐大的數據集)驅動,這些網絡能夠在其被餵送的海量數據集中偵測到極其細微且粒度極小的關係與模式(Covington et al. 2016)。這些數據集基於數十億個參數(因素或元素)進行分析,使網絡能夠在數千億個數據點或訊號以及幾乎無法理解的維度數量中揭示模式與關係,其單一目標就是優化其預測能力以增加觀看時間(watch time)——無論是增加幾分之一秒、幾毫秒還是幾分鐘——因為其深知在這個巨大規模下,即使是最小的增量收益也會導致顯著的整體影響(Covington et al. 2016)。
一旦預測模型經過訓練,在此過程的第二階段,它被用來生成公式或推薦邏輯,供模型在即時(real-time)面對活躍使用者時使用(Covington et al. 2016, Chen et al. 2024)。這些公式執行兩個基本功能。首先,它們使系統能夠從龐大的內容庫(數十億個影片或其他形式的媒體)中挑選潛在的候選內容。其次,它們對這些選定的候選內容進行排序,以識別最有可能最大化使用者參與度和留存率的內容。
然而,重要的是要理解,用於決定它們的公式和參數並非固定不變的。它們會隨著時間改變並進行微調,受到新歷史數據和持續優化工作的影響,以提高預測準確性(Covington et al. 2016, Smith 2021, Chen et al. 2024)。由於這些系統依賴深度神經網絡,其運作不應被認為是遵循簡單、靜態的規則,例如「如果使用者觀看影片 A,則推薦影片 B」。相反地,它們的功能更像是一種基於大量習得因素進行推理的方法,以便對內容選擇和排序做出精細平衡且具情境性的決定(Covington et al. 2016, Chen et al. 2024)。
也就是說,這不太像是按照食譜步驟做菜,而更像是透過反覆練習掌握一項技能的經驗,例如學習如何跳傘。經過無數小時的訓練和實踐,跳傘者發展出一種特定的方向感和一套反射動作。他們獲得了一種近乎本能的理解,知道如何在空中定位自己、何時打開降落傘,以及如何針對外部因素進行調整以確保安全著陸。這種理解變得具身化(embodied)——一種肌肉記憶或一種在特定情境下該做什麼的根深蒂固的感覺,經過時間的推移和無數次重複而形塑。同樣地,這些演算法透過處理數千億個關於使用者行為的數據點,發展出一種「反射性智能」(reflexive intelligence),獲得了在特定情境下辨識該做什麼的能力——不是透過遵循一套僵化的指令,而是透過汲取大量訓練中習得的模式和關係(Covington et al. 2016, Chen et al. 2024)。隨著時間的推移,它們建立了一種高度複雜的感知,知道哪些行動(在此例中為推薦)可能實現預期結果,例如最大化使用者參與度。
3. TikTok 演算法:排序與權重的簡化視角
雖然這些公式或邏輯通常被視為高度商業敏感並作為商業機密處理,但由於《紐約時報》對 TikTok 的調查(Smith 2021),我們擁有這類公式的一個極度簡化版本,這讓我們對推薦內容和離線訓練機器時可能考慮的因素有了一些概念。
我們所知的是,TikTok 的推薦引擎使用這個公式,根據影片吸引使用者的潛力來對其進行評分或排序:
分數 (Score) = (Plike × Vlike) + (Pcomment × Vcomment) + (Eplaytime × Vplaytime) + (Pplay × Vplay)。
此公式結合了關於使用者行為的預測與分配給特定行動的權重,以決定哪些影片最有可能保持使用者的參與。公式中的每一項代表兩個部分的組合:預測與權重。由 TikTok 機器學習模型計算出的預測值,估計使用者採取特定行動(例如,按讚影片)的可能性。另一方面,權重量化了系統在影響整體推薦分數時對該特定行動的重視程度或價值(Vieira et al. 2020)。它充當乘數,調整公式中相應預測的重要性。例如,如果系統確定「按讚」影片是參與度的強烈指標,「按讚」的權重(Vlike)將會較高,這意味著 Plike(按讚的機率)將對最終分數產生較大影響。權重在訓練過程中進行微調,以優化系統最大化使用者參與度的能力(Covington et al. 2016, Vieira et al. 2020)。
例如,Plike 是使用者按讚影片的機率,基於他們過去的互動和推論出的偏好;而 Vlike 表示一個「讚」對影片整體分數貢獻了多少價值。同樣地,Pcomment 預測使用者發表評論的可能性,Vcomment 決定該行為在推薦過程中的影響力。Eplaytime 衡量影片被觀看的時間長度——這是一個重要的參與訊號——而 Vplaytime 反映其在分數中的權重。最後,Pplay 估計使用者選擇觀看影片的機率,Vplay 則考量單純按下「播放」的重要性。
這項計算的最終產物是「分數」,這是演算法用來對影片進行排序的相對度量。分數越高,意味著影片越有可能捕捉使用者的注意力並保持他們的參與,因此更有可能展示給他們。演算法為其他影片計算類似的分數,得分最高的影片將進入使用者的動態牆(feed)。因此,這個分數在演算法之外沒有絕對意義(Covington et al. 2016, Vieira et al. 2020, Smith 2021)。相反,它是排序系統的一部分,每個影片都在與其他影片競爭。這個過程是動態且具情境性的——另一個使用者可能會看到完全不同的排序,因為他們的機率和權重會根據其推論出的偏好和行為而有所不同。
4. 為何更多數據意味著更佳預測:大數法則的角色
YouTube 和 TikTok 等平台在決定和微調公式中的權重(即分配給特定因素如按讚、評論、播放時間的相對重要性)時,所擁有的顯著優勢在於它們能夠獲取極其大量、多樣且來源豐富的使用者數據與行為(Covington et al. 2016, Smith 2021, Chen et al. 2024)。如此龐大的數據規模使這些平台能夠利用大數法則(law of large numbers)的統計原理,以及大模型的縮放法則(scaling laws of large models),在其推薦引擎中實現非凡的預測準確性與有效性(Révész 2014, Conti et al. 2018, Zhang et al. 2024)。
大數法則的統計原理指出,隨著數據集規模的增加,隨機變數(在此情況下為使用者行為)的平均結果變得更可預測,並收斂至期望值。在 YouTube 和 TikTok 等平台的背景下,這一原則允許其演算法透過聚合數百萬甚至數十億使用者的行為,來平滑化個別使用者行動中固有的隨機性(Covington et al. 2016)。這種聚合減少了離群值(outliers)和「雜訊」的影響,並使系統能夠以顯著的精確度識別總體趨勢和行為模式(Révész 2014, Conti et al. 2018)。
然而,大數法則依賴於擁有龐大的數據量;它無法在個別使用者的層面上有效運作,因為在該層面上,行為數據過於稀疏且充滿雜訊,無法提取有意義的模式。在個人層面上,隨機性占主導地位,基於單一使用者行動的預測(即通常理解的個人化概念)高度不可靠;亦即,典型的個人化概念——平台僅基於個人的明確偏好和行動為其量身定做內容——是失敗的,因為孤立的數據點缺乏支持準確預測所需的統計穩定性。
與此同時,大模型的縮放法則描述了機器學習模型的表現如何隨著模型大小(以參數衡量)和數據集(以訓練範例衡量)的增加而可預測地提升(Zhang et al. 2024)。較大的模型有能力學習和表徵數據內的複雜關係,包括較小模型可能遺漏的細微和多維度模式(Covington et al. 2016, Zhang et al. 2024)。例如,最近一項關於推薦系統的詳細研究(Zhang et al. 2024)顯示,較大的模型也具有更高的數據效率,意味著與較小的模型相比,它們能從給定的數據集中提取更多價值。當應用於 YouTube 和 TikTok 這樣規模的平台時,這些縮放法則允許其推薦系統微調預測,並對使用者行為做出高度準確的推論。
重要的是,由於填補這些空白的先進技術(利用合成或推論資訊),即使數據存在缺口,這種預測準確性也是可能的(Chen et al. 2024)。當像 YouTube 這樣的平台面臨缺失或稀疏數據時——無論是用戶互動不多、新上傳的影片沒有觀看次數,還是用戶偏好存在缺口——它們可以採用不同的策略來「填補缺口」並維持其預測能力。例如,合成數據生成(synthetic data generation)創造出逼真但人工的數據點,模仿現有數據集中觀察到的模式和趨勢。想像一個沒有初始觀眾的新影片:系統可能會使用類似影片過去的數據來模擬預期行為,幫助模型理解受眾可能如何反應。同樣地,對於新用戶或不常使用的用戶,知識圖譜(knowledge graphs)將稀疏的使用者數據與相關屬性(如喜愛的類型或觀看歷史)連結起來,以推論可能的偏好。在僅存在有限個人層面數據的情況下,遷移學習(transfer learning)允許系統從相關群體或情境中汲取洞察,並在它們之間共享知識以做出準確預測(Covington et al. 2016, Chen et al. 2024)。
當大數法則的統計原理、大模型的縮放法則,以及如合成數據生成、知識圖譜和遷移學習等先進技術相結合時,推薦系統便能達到非凡的預測準確性水平。透過利用使用者數據的龐大數量與多樣性,大數法則意味著個別行為的隨機性被平滑化,允許系統在數十億使用者中偵測穩定的模式。同時,縮放法則使大型機器學習模型能夠捕捉數據內複雜、多維度的關係,以極高的細粒度微調預測。先進技術解決了缺口或稀疏數據的問題,確保即使在不理想的條件下也能保持一致的預測能力。這種綜效使得系統能夠在關鍵參與度指標(如觀看時間)上達到超過 90% 的預測準確性,因為預期行為與實際行為之間的偏差在規模化下變得統計上可忽略不計(Révész 2014, Covington et al. 2016, Zhang et al. 2024)。也就是說,在這些預測準確性水平下,系統預測使用者會做什麼與使用者實際做什麼之間的差距,隨著時間推移變得微乎其微,以至於系統預測偏離使用者行為的情況不僅罕見,而且發生在越來越窄的例外或誤差範圍內。
這是論文翻譯的 第三部分,涵蓋原文的第 5 節至第 7 節。這部分深入探討了多臂強盜演算法與強化學習如何模糊了「訓練」與「使用」的界線,並引入了女性主義關係理論與 Karen Barad 的「內-作用」(intra-action)概念,來重構我們對能動性的理解。
5. 尋找最佳路徑:多臂強盜演算法如何利用強化學習進行探索與利用
此外,當預測模型上線後,TikTok 和 YouTube 等平台通常會採用所謂的多臂強盜演算法(multi-armed bandits)作為一種強化學習(reinforcement learning)形式——這是一種機器學習技術,演算法透過接收基於其執行特定任務表現好壞的「獎勵」或「懲罰」來進行即時學習(Covington et al. 2016, Silva et al. 2022)。更精確地說,「多臂強盜」一詞源自機率論與統計學,類比於一位在一排吃角子老虎機(被稱為「單臂強盜」)前的賭徒。每一台老虎機代表一個具有未知獎勵機率的不同選項。賭徒的任務是透過平衡兩個相互競爭的動作來找出哪台機器回報最高:利用(exploiting)根據先前拉動經驗看似回報最好的機器,以及探索(exploring)其他可能產生更高回報的機器(Feng 2024)。
在推薦系統的情境中,演算法扮演賭徒的角色,而「老虎機」代表它可以推薦給使用者的不同類型內容。在此情況下,獎勵是使用者參與度指標,如觀看時間、按讚、分享或點擊。當使用者以符合系統目標的方式(最常見的是延長在平台上的停留時間)與內容互動時,就會產生「獎勵」。相反地,當使用者脫離參與,例如跳過影片、關閉應用程式或放棄建議的路徑時,就會發生「懲罰」。
演算法持續針對這些「機器」(或內容類型、序列、內容時機)進行實驗,以微調其策略。透過利用(exploitation),系統推薦與使用者已經互動過的相似內容,押注於已知的傾向。然而,探索(exploration)同樣重要:演算法測試替代的內容類型或推薦,試圖發掘可能導致更高獎勵的新興趣或參與機會。這個探索過程涉及觀察使用者對不熟悉或意外內容的反應,並根據這些反應重新校準系統的預測與策略。然而,在實踐中,利用與探索之間的區別變得流動,因為這兩個動作都貢獻於同一個總體目標:最大化使用者參與度。透過利用已知模式,演算法建立在其對使用者偏好的現有理解之上,而探索則允許它完善與擴展這種理解,確保其策略保持動態與適應性(Kwa et al. 2022)。
值得注意的是,多臂強盜演算法不僅依賴來自單一使用者的回饋。它也納入具有相似行為或訊號的其他使用者的數據,利用它在整個平台上收到的獎勵與懲罰,持續微調其決策。這些探索與利用的實驗是常規性且大規模地進行,因此由於縮放法則和大數法則,演算法會隨著時間推移而改進。亦即,它運行的實驗與測試越多,演算法就越擅長決定何時堅持利用策略,何時切換到探索。它也學會適應影響這些決定的特定因素與情境,以進一步微調其方法來優化參與度(Feng 2024)。
這種即時學習意味著平台上的所有使用者實際上都在與系統互動的同時訓練系統。單純使用平台與貢獻於多臂強盜演算法訓練之間的區別變得模糊。這是因為平台實際上將使用者採取的每一個動作——或不作為——都轉化為多臂強盜分散式訓練網絡(distributed training network)的輸入形式。每一次互動,無論多麼微小,都會餵入演算法。透過這個過程,使用者不僅是在訓練演算法使其越來越有效地將他們盡可能長久地留在平台上,同時也是在集體訓練系統,以完善其為其他具有相似參與模式或行為檔案的使用者進行內容排序與策略規劃的能力(Zou et al. 2019, Sharma et al. 2021, Stamenkovic et al. 2022, Feng 2024)。
實際上,使用者正在訓練系統來捕捉並留住自己,同時也貢獻於系統對他人做同樣事情的能力。這創造了一個回饋迴圈,演算法利用個人與集體的行為訊號,在廣大的使用者群體中變得越來越擅長延長觀看時間(Zou et al. 2019, Sharma et al. 2021, Stamenkovic et al. 2022, Feng 2024)。隨著這種情況發生,強盜演算法變得異常有能力延長觀看時間。它們在縮小「預測什麼內容會延長使用者觀看時間」與「使用者實際行為」之間差距的能力上,也變得越來越精確。
6. 超越史金納與偏誤:現代推薦系統的新興力量
這意味著,實際上,YouTube 和 TikTok 等平台為了保持使用者參與所做的事情,與監控資本主義或說服性科技文獻中通常提供的解釋有根本的不同。這些主流模型通常透過兩個主要概念來解釋平台的成癮性或使用者傾向於被鉤住的原因。
第一個解釋根植於史金納行為主義(Skinnerian behaviourism),認為使用者繼續與平台互動是因為它們被設計得像老虎機一樣制約行為(Alter 2017, Zuboff 2019)。這個想法是,平台提供變動獎勵(variable rewards)——不可預測的結果會觸發多巴胺激增(dopamine rush)——鼓勵使用者反覆轉動那隱喻的內容輪盤,期待下一個「獎賞」(treat)。在這個模型中,正是獎勵的不確定性、隨機性與變異性創造了一種強迫感,讓使用者在追逐下一個內容獎賞時保持參與。
第二個解釋來自說服性科技設計(persuasive technology design)與選擇架構(choice architecture)理論,特別是那些受行為經濟學與心理學影響的理論。這個觀點主張,使用者留在平台上是由於內在的認知偏誤(cognitive biases)(Fogg 2009, Sunstein 2018)。例如,同溫層理論認為使用者受確認偏誤(confirmation bias)驅動,尋求強化其既有信念的內容。同樣地,基於群體的偏誤,如同質性(homophily,傾向於被志同道合的群體吸引),被認為解釋了為何使用者會聚集在特定內容與社群周圍(Sunstein 2017, 2018, Brown et al. 2022)。
這兩個模型(即行為制約與同溫層)都暗示,留在平台上的強迫性源自內在的心理機制或偏誤,將延長的觀看時間描繪為使用者心智內在某種東西的結果。然而,雖然這些解釋具有一定的有效性,但我主張它們與我們現在所理解的 YouTube 和 TikTok 等平台運作方式並不完全一致。基於對其推薦系統及所部署技術的了解,這些平台並非主要依賴這些機制來驅動參與。相反地,它們的方法在重要方面有所不同。
在根本的概念層次上,TikTok 和 YouTube 等平台並非依賴或基於孤立的個人行為、行動或內在狀態來設計其系統。這是由於前述原因,包括對大數據集的依賴、這些數據集達到大數法則開始適用之規模的重要性,以及從聚合數據中提取有意義模式的能力。這裡重要的不是個人想什麼、渴望什麼或相信什麼;相反地,這些個人特徵常被視為更大系統中的雜訊(noise)、隨機性或變異性(Conti et al. 2018, Xin et al. 2023)。焦點在於個人的關係性維度——他們的訊號相對於大量聚合數據、模式、趨勢和推論行為意味著什麼。在這個意義上,雖然個人作為分析單位是核心,但對於系統增加預測準確性和實現預測與實際行為收斂的更廣泛目標而言,個人也是邊緣的(Covington et al. 2016)。
因此,個人化與其說是系統反映使用者的意圖或行為,也不必然是關於訓練或制約使用者去追逐某種獎勵。關鍵概念是產生一種形式的力量、權力或引力(gravitational pull),這源自系統本身的極度精密及其運算能力。這創造了一種情境,使用者體驗到一種感覺——一種被吸引的感覺——使得他們的行為與系統的預測一致,或是被變得一致。這不一定是因為演算法反映了使用者的意圖;更確切地說,它是關於創造環境與條件,在這些條件下,並非使用者的意圖不重要,而是他們感到投入,彷彿被呈現的內容正是如果讓他們自己選擇時他們下一個會選擇的內容(Covington et al. 2016)。
這與簡單的預測不同,因為它運作於預測與實際行為之間的那個空間、那條線、那個交會時刻。它是關於特定的差距、精確的時刻,以及在該空間中湧現的關係性效應(relational effect)。這個效應是獨特的,因為它不完全關於使用者的意圖,也不完全關於系統的設計或運作。相反,我主張,它源自所有組件協同工作的整個裝配(assemblage):用於訓練演算法的歷史數據;深度神經網絡處理的各種演算法、函數、權重、公式和參數;驅動這一切的巨大運算能力;透過多臂強盜實現的強化學習;以及大數法則的原理(Covington et al. 2016, Vieira et al. 2020, Feng 2024)。
這些元素在那個時刻匯聚,創造出一種條件、一種力量、一種感覺、一種拉力——一種僅憑藉所有這些組件共同作用才存在與運作的關係性效應(Smith 2021)。這是一種巨大的權力形式,無法輕易簡化為自主或脅迫等概念。它作為裝配本身的現象而存在,本質上更為複雜且具關係性。
7. 關係性自主與內-作用:演算法裝配中的分佈式能動性
我的意思是:在女性主義關係理論、女性主義物質主義、新物質主義和後人類主義領域中,現在已經確立並廣為接受的是,能動性(agency)的概念——或者是本體論(ontology,即世界上存在什麼以及事物如何與自身關聯)的概念——本質上是關係性的(Barclay 2000, Benson 2014, Bergsdóttir 2017, Harris 2021)。它不是可以輕易被理解為任何個體實體(無論是人類或非人類)所擁有的財產(Van Wyk 2012, Elwood and Leszczynski 2018, Draude 2020)。
也就是說,這些領域現在普遍接受,自由主義關於自主主體(autonomous subject)的觀念——即被設想為具有對世界採取行動能力的自我封閉實體——是有限的。這種將能動性理解為個人財產或特徵、有邊界且自我封閉的觀點,假設了自我與世界之間有清晰的區別,是分離且不同的(Mackenzie and Stoljar 2000, Stoljar 2013, Mackenzie 2019)。雖然這種觀點可能捕捉到能動性的某些方面——例如那些與運作於人類個體內部的內在狀態或主體性相關的方面——但它仍然是不完整的。它過度地將人類作為能動性的主要場所或來源,優先將個人視為形塑和作用於世界的權力、能力與意義的所在地(Barad 2007)。
這些領域的學術研究清楚表明,作為人類存在,以及在本體論上存在,就是與他人處於關係之中(Morton 2013, Harris 2021, Mauthner 2021)。這些關係不僅限於其他人,還延伸至物質世界、社會制度、實踐、論述、價值、人造物、物體與效應(Barad 2003, Bennett 2004, Feniak 2021)。Karen Barad 與該領域許多其他人一樣,主張能動性並非個人所有物。它不是我們擁有的東西,也不能被想像成居住在孤立人類主體內部的東西(Barad 2007, Harris 2021)。相反,能動性是透過關係動態與內-作用(intra-action)的過程分佈與構成的(Rouse 2016, Hollin et al. 2017)。
Barad 概念化下的「內-作用」,指的是能動性如何在間隙空間(interstitial spaces)、時刻與過程中湧現——作為關係性相遇之效應而存在於「中間地帶」(in-between)的事物(Barad 2007, Harris 2021)。以這種方式理解的能動性不是被擁有的;它不是固定的屬性。它是一種從關係動態中湧現的現象,由這些內-作用所形塑並賦予形式。正是透過這些動態——以及它們的過程性效應——能動性才承擔起其施為能力(agential capacity),即作用於世界、產生影響以及被世界影響的能力。
因此,這就是為什麼我引用 Barad 和女性主義關係理論來概念化我們在演算法平台與使用者之間的關係性相遇中觀察到的分佈式能動性(distributed agency)。這種能動性從根本上是內-作用的且是間隙性的。它不是使用者擁有的東西,也不單純是平台技術、演算法和運算裝配的產物。相反,它存在於使用者與平台之間湧現的關係空間中。正如女性主義關係理論所表明的那樣,這個空間不是絕對的、固定的類別或二元對立的空間,而是一個生成(becoming)的空間——一種透過糾纏(entanglements)與內-作用展開的關係性效應(Dillen 2018, Elbanna 2018)。
我的意思是,當平台的演算法裝配運作以推薦、引導或將使用者導向特定行為時,所產生的那種感覺、感受、效應或表現,不能完全歸因於使用者的意圖或他們內部的任何狀態。它也不是完全外在於他們、僅由平台的演算法過程所決定的東西。相反,它作為一種關係性現象湧現——一種存在於這些元素交會的空間與時刻中的間隙力量。
因此,使用者與其說是行動(act),不如說是內-作用(intra-act)。與其說他們有意圖,不如說行動的感覺或行為是共同構成(co-constituted)的(Bozalek and Zembylas 2017, Harris 2021)。以此方式,使用者並不完全是決定者;相反,感覺與體驗展開——不是作為他們控制或有意識意圖的東西,而是作為某種被感覺、被做、被展演(performed)並被帶入存在的東西。這是一個過程,不是孤立的能動性,而是關係性的湧現,行動本身透過使用者與系統的糾纏而在其中產生。
因此,這種展開可以被理解為 Karen Barad 所稱的繞射(diffraction)(Barad 2014),因為它暗示了裝配內部能動性與因果關係的動態與關係性質。Barad 的繞射概念借自量子物理學與女性主義關係理論,試圖捕捉現象如何不以線性或可預測的方式展開,而是作為干涉圖樣(patterns of interference)與關係性生成(Barad 2014)。繞射捕捉了元素——無論是物質的、社會的或論述的——如何內-作用、糾纏並相互形塑,以產生無法僅歸因於任何單一組件的湧現效應(Bergsdóttir 2017, Harris 2021)。
當應用於推薦現象時,該過程並非預先固定或決定的;相反,它是湧現的,由無數變數的交集所形塑——歷史數據、演算法權重、使用者偏好、優化邏輯以及平台的總體目標。由此產生的內-作用模式並非反射(輸入的靜態鏡像),而是繞射——干涉與湧現的複雜非線性圖樣。這些圖樣創造了某種新的東西:一種既不單獨存在於使用者內部,也不完全存在於演算法內部的分佈式能動性,而是作為一種僅透過它們的糾纏才產生的關係性現象。
8. 法律與佔有式能動性:DSA, OSA, GDPR, AIA
然而,當我們檢視歐盟與英國旨在保護使用者免受傷害的主要法律時——例如 2016 年的《一般資料保護規則》(GDPR)、2022 年的《數位服務法》(DSA)、2023 年的《線上安全法》(OSA)以及 2024 年的《人工智慧法》(AIA)——會發現它們背後支撐著一個基礎假設:即能動性(agency)是一種佔有式特徵(possessive characteristic)。亦即,能動性被視為個人固有的財產,使用者在內部擁有它,並能自主行使它來形塑自己的行動、保護自己並管理線上體驗。
以 GDPR 為例。從根本上來說,GDPR 建立在一個假設之上,即個人擁有能動性作為一種內在品質,使他們能夠同意其個人資料的處理,或簽訂需要此類處理的服務契約(GDPR, arts. 4(11), 5, 7, 13–14)。這種內在、自我封閉的能動性使 GDPR 下的資料處理合法化。一旦使用者與平台互動,法律進一步假設他們的能動性允許他們透過行使權利來保護自己。例如,他們可以撤回同意、反對資料處理、要求刪除資料或尋求更正(GDPR, arts. 15–18)。此處的基本觀念是,使用者擁有自主、自我封閉的能動性,賦予他們獨立採取這些行動的能力。
循此邏輯,當使用者在平台上遇到推薦內容並對其採取行動時——無論是參與還是忽略建議內容——法律假設他們的行動反映了其內在能動性。此框架將能動性概念化為完全在使用者內部,作為一種支配其意圖與決定的財產,並將平台視為單純的中立工具。就像一把錘子,平台被認為是使用者用來表達自身意志或意圖的器具。
然而,這種理解有顯著的侷限性。由於資料保護法以及規範平台的更廣泛法律架構均建立在這種佔有式、自由主義的能動性概念之上,它們缺乏語言或概念空間來識別平台如何可能以影響、共同構成(co-constitute)甚至限制其能動性的方式來定位使用者。現代推薦系統,特別是那些由先進演算法過程驅動的系統,正如我所主張的,擁有遠超這些法律所設想的簡單「工具式」角色的指令性權力(directive power)。這些法律未能解決使用者能動性可能以關係性方式湧現,或被平台運作從根本上形塑的可能性。
不過,人們或許有理由質疑:既然像英國 OSA 和歐盟 DSA 這樣的法律強制平台識別並移除非法內容(OSA, §§ 9–12; DSA, arts. 7, 16, 23, 34–35),我的論點是否站得住腳?這難道不意味著能動性作為個人、佔有式特徵的概念並不像我所提出的那樣基礎嗎?然而,這些法律似乎並未根本挑戰「能動性主要被理解為個人、內在所有物」這一核心假設。對犯罪行為的法律限制——無論是在平台情境還是其他地方——並不否定能動性作為基礎原則的更廣泛概念。就像法律禁止盜竊或殺人等行為並未否定個人自主與責任的觀念一樣,這些法律也未能破壞「使用者在與平台互動時保留個人能動性」的假設。
這些法律對非法言論與行為的關注,並未改變一個基礎觀念:即使用者被視為擁有內在能動性,可以決定他們希望在網路上觀看或參與什麼(DSA, arts. 7, 16, 23, 34, 35, 45; OSA, §§ 9–10, 26–27, 71, 121)。這些法律主要是劃分出被禁止內容的特定類別,但並未改變更廣泛的基礎模型。事實上,這些法律中的保障條款強化了這一假設。例如,在 OSA 下,保護使用者免受傷害的方式之一是要求平台提供選項讓他們行使個人能動性,例如設定過濾器以過濾他們不希望遇到的詞彙或內容類型(OSA, §§ 15, 22, 70, 77)。同樣地,DSA 強制平台提供使用者退出(opt out)個人化推薦的選項(DSA, art. 38)。
即使在要求平台避免某些做法的情況下,能動性的潛在佔有式基礎仍然完好無損。例如,DSA 包含禁止平台使用「暗黑模式」(dark patterns)的條款——這是一種旨在使取消訂閱或退出服務等行動變得複雜的欺騙性做法(DSA, art. 25)。同樣地,歐盟的 AIA 禁止使用潛意識技術(如閃爍圖像或聲音)來影響行為。它也限制針對脆弱群體(包括兒童與老年人)部署演算法(AIA, art. 5(1)(a)–(c))。雖然這些條款針對特定的有害做法,但它們並未從根本上挑戰能動性作為個人、佔有式特徵的更廣泛概念。
相反地,這些法律狹隘地聚焦於識別可能破壞個人能動性的離散行動——如隱藏取消選項、使用潛意識訊息,或設計演算法來操縱特定群體。這些措施旨在保障並維護該能動性,而非重新建構或挑戰其基礎地位。這些法律非但沒有破壞能動性作為內在所有物的假設,反而透過針對可能侵蝕它的特定、蓄意行動來強調其核心地位。在這個意義上,它們例證了目前的監管框架在多大程度上致力於保護自由主義、個人主義式的佔有式能動性概念。
我的主張是,同樣的邏輯也適用於各種法律——無論是 GDPR、OSA、DSA 或 AIA——如何特別關注兒童與未成年人作為值得特別保護的獨特群體(GDPR, recitals 38, 49 and art. 8; OSA, §§ 12, 29, 35-37, 53, 60–61; DSA, recitals 46–47, 71, 104 and art. 28; AIA, recital 13 and art. 5(1)(b))。明確將兒童識別為需要獨特保障,同時假設其他使用者擁有完全發展的內在能動性,這強化了能動性是固有個人特徵的基礎假設。
將兒童與未成年人歸類為需要特別保護,並不挑戰能動性作為內在所有物的更廣泛觀念。相反,它透過將兒童框架為一般規則的暫時例外來強化這一觀念。這些法律在隱含假設下運作:兒童由於年齡與發展階段,尚未達到歸屬於成人的自主條件。因此,給予兒童與未成年人的保護被呈現為臨時性的,作為過渡措施,直到他們「畢業」進入擁有完全、自我封閉能動性的一般狀態。
透過建立這種特別保護類別,法律實際上強調了一種觀念:即大多數使用者——那些非兒童或未成年人——被推定為完全有能力行使其能動性並保護自己。以此方式,這些法律並未根本挑戰佔有式能動性的概念基礎。相反,它們透過劃定狹窄的例外來強化它,這些例外僅突顯了多數人口被推定的自主性。這維持了現狀,暗示大多數使用者之所以不脆弱,正是因為他們被假設已經擁有自主決策的內在能力。
然而,這個假設未能解釋演算法系統——特別是那些依賴深度神經網絡、強化學習與多臂強盜演算法的系統——在多大程度上系統性地侵蝕了有意義自主所需的條件。這些系統被設計用來消除個人行為中的隨機性,將預測準確性微調至某種程度,以至於使用者的獨立選擇能力變得與演算法優化糾纏在一起,在某些情況下甚至從屬於演算法優化。在這個意義上,使用者不僅僅是在這些系統內行使自主權;相反,他們正越來越多地同意——無論是否知情——一種內-作用(intra-action)模式,在這種模式中,他們的能動性被系統預測和引導其選擇的能力所預先結構化(pre-structured)。這引發了根本性的問題:當使用者行為不僅被近乎完美地預測,而且被形塑選擇本身的感知與體驗的演算法架構所引導時,傳統概念下的決策自主是否仍然可持續。
重申並澄清,所有這些法律都根本地建立在一個前提之上:即能動性是個人內在的固有特徵,被概念化為一種內部屬性。它們也假定使用者與平台之間有明顯的區隔,將平台視為缺乏共同構成或重塑使用者能動性能力的外部工具。在此框架下,存在一種隱含的能動性二元觀點:它要麼是使用者擁有的東西——如在一般人群中,兒童為暫時例外——要麼是由於明確且蓄意的欺騙行為(如使用暗黑模式或潛意識訊息)或因為他們作為脆弱群體成員被具體鎖定,而被剝奪的東西。
這種二元理解超越了能動性,延伸至權力,權力被概念化為要麼透過外部強制行為(例如欺騙性做法或蓄意鎖定)明確存在並行使,要麼在所有其他沒有明顯證據顯示此類機制的情況下缺席。這種僵化的框架排除了對平台與使用者之間關係動態的任何承認,在這些動態中,能動性不是固定的所有物,而是透過他們的內-作用共同構成的東西。
9. 鑑於現代推薦系統的轉化性與指令性權力,佔有式能動性的侷限
這將我帶到了這個問題:為什麼這件事很重要——不僅是為什麼它重要,而是為什麼它對法律構成了一個特定問題,以及法律若有角色的話,能在解決此問題上扮演什麼角色。我理解人們可能會將我目前的論點解讀為僅僅指出比較性的差異,而沒有需要法律介入的重大後果或傷害。換句話說,為什麼法律將能動性概念化為個人內在的佔有式特徵,而非承認人——他們的主體性——是與平台共同構成的,這件事在根本上有何重要?
這之所以重要有幾個原因。第一個且最重要的原因是,透過採納支撐這些法律的假設,我們未能解釋過去十年中出現的最重大且最具轉化性的指令性(directive)與構成性(constitutive)權力形式之一:深度神經網絡、龐大運算裝配、精密演算法與預測模型的使用。這些系統透過其巨大的規模和對大數法則的依賴,達到了一種精確度,使得其預測與實際使用者行為之間的差距現在已微乎其微。這種由這些系統創造並維持的非凡權力不對稱,正被排除在法律與監管對話之外。我在此暗示的是,透過將這些系統視為中立、惰性的工具——類似於一把「在那兒」的錘子,完全區別且分離於與其糾纏的主體——我們掩蓋了其巨大的內-作用、繞射(diffractive)與間隙性(interstitial)力量的現實。
也就是說,當利用深度神經網絡、縮放法則和大數法則,以及多臂強盜演算法與強化學習的系統,獲得了以潛在超過 90% 的準確度「預測」什麼能讓我們保持參與的能力——即使沒有關於我們行為的直接數據——並且當預測與實際行為之間的差距微乎其微或僅限於罕見的離群值時,我們不再是在觀察傳統意義上的「預測」(Révész 2014, Covington et al. 2016, Zhang et al. 2024)。實際上,這些系統以如此非凡的精確度引導和指揮我們的行動,以至於使用預測的語言或透過個人能動性的視角來框架此現象已變得不充分。我們在此遭遇的是某種在本質構成權力上根本不同的東西——一種內-作用的展開以及一種既不單獨存在於我們內部也不完全存在於系統內部的間隙性力量。相反,它因其作為湧現、糾纏與關係性現象的屬性,佔據了一個獨特且極其強大的空間。
這股力量並非源自意圖、個人行動或內在狀態,而是作為一種關係性效應湧現——這些糾纏的動態展開。它代表了一種獨特的內-作用形式,要求徹底重新思考法律傳統上關於選擇、自主與決策的基礎假設。事實上,它挑戰了法律主體性(legal subjectivity)的概念本身——即成為法律主體意味著什麼——並迫使我們重新考慮現行適用法律(如 GDPR, OSA, DSA, AIA)最初是如何想像與建構法律主體的。
我的意思是,如果我們現在擁有的意向性(intentionality)是在統計誤差的邊緣內運作,且能動性(Révész 2014, Covington et al. 2016, Zhang et al. 2024)作為一種力量不是在個人層面上運作,而是在總體層面上運作——同時卻生成個人能動性的體驗(Covington et al. 2016, Zhou et al. 2020, Adomavicius et al. 2021, Wang et al. 2021)——那麼,法律假設其正在規範的那個實體究竟是誰?當我們在如此流動的交集、能動行動的碎片化點以及極其狹窄的影響尺度內運作時,法律如何定義或概念化在這種情境下決定與做決定的實體?
如果在推薦系統內的個人行動——或者就此而言,個人本身——被視為雜訊(Conti et al. 2018, Xin et al. 2023),意即預測不在個人層面上運作,而僅作為關係性、總體現象才有意義,那麼個人的角色就從根本上被重新定義了。在此脈絡下,個人並非不相關,但其重要性僅來自於他們與海量訓練數據集、演算法權重,以及在個人與集體層面上同步且同時發生的分佈式平行強化學習過程之間的關係(Covington et al. 2016, Zou et al. 2019, Sharma et al. 2021, Stamenkovic et al. 2022, Feng 2024)。
這引發了一個重要問題:我們能以什麼方式、在哪裡找到佔有式能動性的任何空間?如果此類系統內的行動,其意義與重要性僅源自於關係性位置(relational positionality)——一種由糾纏與內-作用形塑的現象,而非自主意圖(Dillen 2018, Verlie 2020, Harris 2021)——那麼現有的將能動性視為個人固有擁有或佔有之物的概念,便受到了根本性的動搖(Mackenzie and Stoljar 2000, Nedelsky 2011, Stoljar and Mackenzie 2022)。
10. 演算法影響的危險:脆弱性與高風險後果
然而,在此背景下,我的擔憂並非演算法系統本質上是有害的,或者它們的生成能力總是負面的。在許多情況下——如教育、技能獲取、娛樂(例如學習新語言、掌握技術技能、發掘創意管道或獲取音樂等娛樂)——這些系統能提供巨大的價值。我的擔憂在於,當現代演算法系統顯著的指令性權力,以及它們所生成的分佈式、共同構成的能動性,在使用者處於脆弱的高風險情境中運作時,會發生什麼事。
這類情境之一是心理健康危機,使用者可能正與憂鬱、焦慮、悲傷或其他急性心理健康狀況搏鬥(Gibson 2016, Sangeorzan et al. 2019, Raj et al. 2022)。我也深切關注那些處於孤立或面臨邊緣化的人——即與支持網絡斷聯或尋求認同與連結的個人(Belfort and Miller 2018, Woloshyn and Savage 2020, Moss et al. 2023, Monks-Woods et al. 2024)。此外,更廣泛地說,我心裡想的是那些處於絕望狀態的人。我所指的絕望,是以高度不確定性(例如,後果不可預測或未知,使個人處於焦慮與認知超載狀態)和情緒困擾為特徵的情況,並且迫切需要解決方案,無論是由於財務不穩定、醫療危機、個人喪失或其他複雜的生活挑戰,這些挑戰限縮了認知選項(例如,由於精神或情緒壓力,降低了批判性評估選擇、理性深思或探索替代行動方案的能力),從而提高了受影響的易感性(susceptibility)(Cuthbert et al. 2003, Verhoeven et al. 2011, Lang 2019, Keles et al. 2020)。
我的擔憂是,處於脆弱情境的個人透過這些平台尋求的問題、資訊或指引,往往是開放式的(例如,關於意義、目的、應對機制,或解決複雜情感、社會或實際挑戰的問題,這些問題沒有單一確定的答案)(Ruiz-Gómez 2019, Vega 2023, Ng et al. 2024),而推薦引擎可能呈現多種多樣的潛在路徑(Lavorgna et al. 2018, Gupta et al. 2020, Hayes and Ben-Shmuel 2024)。
這些軌跡可能具有深刻的構成性(constitutive)——形塑他們的世界觀、決定以及重大的人生後果,例如在關係破裂後是否與伴侶和解或斷絕關係、是否繼續或停止心理健康藥物治療,或如何應對深刻的失落感或存在的不確定性(Sangeorzan et al. 2019, Raj et al. 2022, Moss et al. 2023)。例如,一位正在應對婚姻破裂的使用者,可能會遇到從持照治療師提供的建設性建議,到利用其情感脆弱性的自封關係「大師」所提供的誤導性指引(Baker and Rojek 2020, Martaningrat and Kurniawan 2024)。這些軌跡可能將他們導向關於性別角色的激進意識形態、完全歸咎於一方伴侶的「有毒」敘事,甚至是為複雜個人問題提供過度簡化解方的掠奪性社群(Närvänen et al. 2020, Aw and Chuah 2021)。
在另一個案例中,一位質疑是否該服用抗憂鬱處方藥的使用者,可能會被導向支持性、基於證據的醫療建議——或者相反地,被導向反精神病學(anti-psychiatry)社群、陰謀論或推廣不受監管或潛在有害療法的替代療法。這類內容可能鼓勵使用者放棄臨床建議的護理,轉而支持偽科學實踐、未經證實的草藥補充劑或極端的飲食療法。如果關鍵症狀未經治療或管理不當,這可能加劇其病情,導致財務剝削,甚至構成嚴重的健康風險(Vega 2023, Guo et al. 2024, Ng et al. 2024)。
同樣地,那些與悲傷搏鬥或尋找目標的人,可能會被引導至建設性的靈性或治療內容,或者是提供偽科學解決方案的剝削性網紅,或將激進意識形態包裝為賦權(empowerment)的敘事——例如推廣極端自力更生的敘事、阻礙尋求幫助的宿命論世界觀、充滿陰謀論的靈性實踐,或將個人掙扎框架為更高目標的證據,同時將個人與外部支持隔離的封閉社群(Lavorgna et al. 2018, Gupta et al. 2020, Heřmanová 2022, Lawrence 2022, Balishyan and Kompatsiaris 2023, Parciack 2023, Monks-Woods et al. 2024)。
我的主張是,處於這種脆弱狀態的個人所面臨的重大風險,源自多個相互依存因素的匯流,每個因素都對其受有害路徑影響的易感性施加了不成比例的影響。在這些情境中,現代推薦系統可以依賴強大的指令性與探索性權力組合(例如,多臂強盜演算法、強化學習、深度神經網絡、參與度指標的演算法加權、大規模訓練數據集與預測建模技術),透過動態適應使用者的情緒、認知與行為訊號來最大化參與度。對於正在應對急性心理健康挑戰的人來說,每一個變數——如情緒困擾的嚴重程度、孤立程度、解決不確定性的急迫性,或演算法預測的精確度——都充當一種加權力量,放大了它們對系統輸出的影響。例如,高度的情緒困擾帶有顯著權重,加劇了使用者對承諾立即解決或認同的內容的關注,而不論其準確性或長期影響為何。
同時,系統基於探索策略持續微調其推薦的能力意味著,即使是邊緣訊號——如在特定內容上長時間停留——也可能被放大並納入其決策中。這些力量的交集可能產生回饋迴圈(feedback loops),演算法不僅偵測並強化使用者的脆弱性,還透過探索性技術(如多臂強盜測試各種內容組合、強化學習針對參與度指標進行優化,以及基於觀看時間、滾動行為與互動模式等隱性訊號的情境微調)將他們導向高度吸引人但潛在有害的軌跡,從而放大這些脆弱性。
這種使用者脆弱性與演算法精確度之間的關係性糾纏意味著,風險不是相加的(additive),而是乘數效應的(multiplicative)。亦即,各種因素——如使用者情緒狀態、演算法探索技術與內容排名的動態微調——並非僅僅線性疊加其效果,而是以指數方式放大彼此影響的方式相互作用,對使用者行為創造出複合且深度糾纏的影響。系統巨大的運算能力能夠將孤立的訊號轉化為深度構成性的路徑。結果是一個情境,其中傷害並非源自單一變數,而是源自所有貢獻因素的複雜、動態糾纏。這些因素構成了一種引力(gravitational pull),或分佈式與共同構成的能動性,其力量如此強大,以至於使用者——特別是那些處於脆弱情境或以高度情緒困擾、認知超載或絕望為特徵的狀態下的使用者——發現幾乎不可能抵抗。我的意思是,這些系統的指令性拉力,受縮放法則和大數法則驅動,以如此精確的方式運作,使得個體變異性在統計上變得可忽略不計。這使得系統能夠透過將使用者行為與演算法預測緊密對齊,創造出感覺直觀上不可避免的路徑,從而有效地將能動性感知吸收到系統的優化過程中。
11. 結論
對於法律學者與那些對演算法治理感興趣的人來說,關鍵問題是:在根本層次上,法律現在必須應對的這種獨特能動性形式究竟是什麼?它與法律框架中傳統構想的能動性有何不同?進一步地,當能動性——即行動的能力——是如此深度地共同構成與關係性時,法律在應對可能產生的獨特傷害方面,有何侷限與潛力?
一個立即的反應可能建議增加透明度與揭露(transparency and disclosure)作為解決方案。然而,在此情境下,這種方法基本上是受限的。我們所關注的指令性權力,其共同構成、內-作用與間隙性的本質是湧現的(emergent)與繞射的(diffractive);它不是可以被整齊表達或固定在清晰描述中的東西。這些系統的複雜性與精密性,特別是那些由深度神經網絡驅動的系統,違抗了簡單的透明度模型。這些系統並非透過僵化、基於規則的機制(例如「如果 X,則執行 Y」)運作,而是透過機率邏輯、總體行為模式與機器學習的動態運作。因此,沒有靜態的過程或機制可供揭露;相反,存在一種作為這些關係與互動動態之產物而湧現的指令性效應。
僅專注於透明度或揭露,風險在於強化了支撐現行法律(如 GDPR, OSA 和 DSA)的那些有問題的假設——即基於佔有式、個人主義的能動性理解,將其視為個人內在的東西。透過優先考慮透明度,我們冒著掩蓋並實際上延續這一有問題假設的風險。如我所見,問題在於承認此處發揮作用的能動性形式並非個人或內在的,而是根本上關係性的、分佈式的與湧現的。任何試圖僅透過透明度解決這些系統問題的嘗試,都面臨誤診問題本質的風險,因此無法接觸到傷害的物質性、促成性根源。
這將我們帶到一個更廣泛的問題:為什麼這甚至應該被視為一個法律問題?我的回應是雙重的。首先,我們絕不能將這種獨特的能動性形式視為存在於法律之外的東西。相反,它是法律本身構成性權力(constitutive power)的效應。我的意思是,這種湧現的、間隙性的指令性權力形式之所以出現,是因為法律概念化與規範能動性的特定方式。法律對個人、佔有式能動性的關注,創造了這種關係性與指令性權力得以湧現與運作的條件。換句話說,這不是法律缺席造成的結果,而是法律中嵌入的特定本體論框架與假設所導致的問題。
其次,相關地,正如朱迪斯·巴特勒(Judith Butler)所主張(藉助傅柯的「部署」(dispositif)概念)(Butler 1989, 1990),法律不僅僅是強制性或限制性的。它也是生產性與生成性的(productive and generative),形塑了它試圖治理的主體、客體與關係。因此,這個問題並非外在於法律,事實上是法律思維的產物。這種體認邀請我們轉移焦點:與其問這是否為法律的問題,我們應該問在此情境下,法律應如何配置與構成其主體、客體與關係(Foucault 1971, Foucault and Sheridan 1972, Butler 1989, Munro 2003, Hartsock 2013)。目前的關係配置是否應被置之不理,任由指令性與構成性權力如現狀般運作?還是有空間去想像並實施一種不同的思考與規範這些關係的模式?
雖然我不宣稱擁有簡單或決定性的答案,但必須重新檢視支撐現行法律體系的能動性之基礎本體論框架。諸如 OSA, DSA, GDPR 和 AIA 等法律皆植基於佔有式、個人主義的能動性概念。我們需要探索超越此框架的可能性,轉向對能動性與權力的關係性、內-作用與繞射性理解。這種轉向將使我們能夠重新考慮法律在此情境下如何概念化其主體、客體與治理機制,不將其視為固定實體,而是視為在即時中形塑與重塑自主性的流動與動態過程。如果我們將自主視為在預測與行動之間的運動中波動的東西——而非靜態的所有物——這將要求法律框架承認使用者不僅是對平台採取行動,反過來也被平台以制約、擴展或限制其選擇能力的方式所作用。法律主體需要被重新想像為存在於這種運動之中,自主權既非完全存在也非完全缺席,而是在使用者參與和演算法推論的交集中動態協商。透過承認這一點,我們可以開始發展不單純將個人能動性視為既定事實,而是能解釋演算法環境中自主性之變動與湧現本質的監管模型。
這種重新想像是特別迫切的,鑑於演算法系統日益增強的權力。深度神經網絡的能力正透過大型語言模型(LLMs)、生成式 AI(Generative AI)與基於 Transformer 的架構等技術得到增強與擴展。這些進步已經被整合進推薦系統中——例如,YouTube 已開始試驗這些技術(Zhang et al. 2024)。隨著這些系統成熟,其指令性與構成性權力可能會變得更加顯著,利用並強化深度神經網絡、多臂強盜演算法、個人與集體強化學習以及大數法則的效應。亦即,這些系統預測內容與使用者實際行為之間的差距,將以進一步增加系統引導與共同構成使用者主體性之潛力的方式,變得更加狹窄與微不足道。
鑑於這些發展,超越主導現行法律框架的佔有式、個人主義能動性理解至關重要。相反,我們必須關注這些系統所生成的湧現、間隙性與分佈式能動性形式。這不僅是一個短期議題;它代表了一個長期的挑戰,隨著這些技術持續演進,挑戰只會變得更加重大。解決這個問題需要根本性地重新思考法律如何在注意力、平台與監控經濟中想像與配置其主體、客體與關係。
沒有留言:
發佈留言