糾纏的本體論:AI、能動性與存在的複調性
——《Entangled Voices》與槍、手機、玫瑰的哲學對話 (by gemini)
執行摘要
本研究報告旨在建立一份深度的學術對話,將 Fá Maria 等人於 AIMC 2025 發表的論文《Entangled Voices: AI, Intra-action, and the Body Multiple in Creative Practice》(以下簡稱《Entangled Voices》)視為一個「本體論的實驗場」。本報告不僅僅是對該文本的實證分析,更是將其置於您長期關注的哲學命題——「槍」(暴力與強制的能動性)、「手機」(控制結構與中介)、「玫瑰」(存在的審美與多重性)——的框架中進行重新解讀。
透過將 Karen Barad 的「代理實在論」(Agential Realism)、Annemarie Mol 的「多重身體」(The Body Multiple)以及 Margaret Archer 的「形態生成論」(Morphogenesis)應用於《ERASURE》這件 AI 藝術作品的分析中,本報告揭示了當代創作實踐如何瓦解了傳統的「主體/客體」二元論。報告詳細探討了 AI 工具(如 RAVE 與 Neutone)如何從被動的「工具」轉變為具有協商能力的「行動者」;「聲音」如何在數據集與合成空間中分裂為多重存在的「玫瑰」;以及資料集中的「切割」(Agential Cut)如何成為一種隱性的政治暴力(槍)。最終,本報告為使用者提供了一種反身性的啟示,指出在數位資本主義的結構下,我們手中的「手機」既是連結世界的玫瑰,也是潛在的槍,而使用者的能動性正是在這種糾纏中被持續協商與重塑。
1. 從「工具理性」到「協商的能動性」:死亡的工具與活著的機器
1.1 工具理性的終結與「槍」的隱喻
在技術哲學的傳統敘事中,技術長期被視為人類意志的延伸,是被動的、中立的,僅具備工具價值的存在。這種「工具理性」(Instrumental Rationality)的觀點假設,人是唯一具有能動性(Agency)的主體,而技術物——無論是鐵鎚、鋼琴,還是槍——僅在被人類使用時才獲得意義。在這一框架下,「槍」本身不會殺人,是「人」在殺人;「手機」不會控制人,是「人」在使用手機進行溝通。
然而,《Entangled Voices》一文透過對藝術作品《ERASURE》的創作過程進行的自傳民族誌(Autoethnography)研究,徹底粉碎了這種工具論的幻想 1。Fá Maria 在使用深度學習模型 RAVE(Realtime Audio Variational autoEncoder)和 Neutone 插件進行聲音合成時發現,傳統的「藝術家 vs. 工具」或「人類 vs. 機器」的二元對立已無法解釋她的創作體驗。AI 模型不再是被動執行指令的計算器,它表現出了某種「抵抗」、「幻覺」甚至「意圖」,迫使藝術家進入一種權力的協商過程 1。
這正如 Bruno Latour 對「槍」的經典分析:當一個人手中握著槍時,他不單單是一個人,槍也不單單是一把槍,兩者結合成了一個新的行動者——「公民-槍」(citizen-gun)。槍提供了「射擊」的腳本(script),改變了人的意向性;人則賦予了槍實現其潛能的動力 2。在《ERASURE》中,AI 模型扮演了類似「槍」的角色:它不僅僅是被使用的工具,它還擁有自己的邏輯結構(latent space topology),能夠反過來「配置」藝術家的創作路徑。
更激進的是,Barad 的「代理實在論」進一步指出,並不存在先於互動而存在的獨立實體。並非「人」與「槍」相遇,而是透過「內交互動」(intra-action),「射擊者」與「武器」這兩個主體位置才得以生成 4。在 Fá Maria 的案例中,並非「作曲家」使用「AI」,而是透過聲音生成的內交互動,「作曲家」與「合成聲音」才共同湧現。這種能動性不是某一方的屬性,而是關係性的動態場域。
1.2 技術的「驚奇」:RAVE 模型中的潛在空間漫遊
為了理解這種能動性是如何從「工具」轉向「協商」的,我們必須深入分析《ERASURE》所使用的具體技術——RAVE 模型及其在 Neutone 平台上的應用。
RAVE(Realtime Audio Variational autoEncoder)是一種基於變分自編碼器(VAE)的深度神經網絡架構,專為實時音訊合成而設計 6。與傳統的採樣(Sampling)或頻率合成(Synthesizer)不同,RAVE 不存儲聲音的波形,而是學習聲音的「潛在空間」(Latent Space)。這是一個高維度的數學拓撲空間,聲音在這裡被壓縮為向量(Vectors)。
潛在空間的不可預測性:當藝術家在潛在空間中移動(例如,從「說話」的向量點移動到「歌唱」的向量點)時,路徑並非線性。AI 必須在未被定義的區域進行「插值」(Interpolation),這導致了文中提到的「意想不到的轉變」(unexpected transformations)和「機器般的」(machine-like)人工偽影(artifacts)1。
故障作為能動性的展現:這些「故障」或「偽影」並非單純的錯誤,它們是機器能動性的體現。它們是演算法在試圖將複雜的、非規範的(Queer/Trans)聲音訊號強行適配其數學模型時所產生的「阻力」。藝術家 Fá Maria 描述,這些工具「不僅擴展了我們的能力,還引發了關於代理權的深刻問題」1。
這種體驗與您關注的「手機」命題產生了深刻共鳴。現代智慧型手機亦非被動工具,它透過演算法推送、通知干擾和介面設計(Interface Design),持續地「協商」使用者的注意力與行為。我們以為自己在控制手機,實則是在與手機背後的龐大結構進行持續的、往往是不對等的協商。在《ERASURE》中,這種協商變得可聽可見:藝術家必須學會與 AI 的「幻覺」共舞,接受那些非人類的聲音特質進入作品,從而達成一種「人機糾纏」的共生狀態。
1.3 協商的政治:誰在控制聲音?
從工具理性到協商能動性的轉向,必然引發權力的問題。如果 AI 具有能動性,那麼誰在控制最終的輸出?
Fá Maria 在論文中提出了一個關鍵的倫理與本體論危機:「誰控制聲音?透過技術複製或改變某人的身份意味著什麼?」1。當使用 ElevenLabs 或 RAVE 進行聲音複製(Voice Cloning)時,AI 能夠生成極度逼真、甚至連原作者都難以分辨的聲音 1。這意味著 AI 擁有將「未曾說過的話」塞入他人嘴裡的權力。
這讓我們聯想到「手機作為槍」的另一層隱喻:在現代社會監控結構中,手機記錄的數據(聲音、影像、位置)可以被提取、重組,並用於指控或重塑一個人的身份。如同警察可能將黑人手中的手機誤認為槍 8,AI 模型也可能將一個獨特的、具身化的聲音誤讀為標準化的數據,或者將其武器化(Deepfake)。
在《ERASURE》中,藝術家透過「協商」來回應這種權力。這不是單方面的控制,而是一種 Barad 所說的「責任能力」(Response-ability)——即在糾纏中做出回應的能力。藝術家意識到,每一次參數的調整、每一次模型的訓練,都是在與一個具有潛在暴力(槍)和潛在美學(玫瑰)的實體進行深刻的本體論談判。
2. 存在的拓撲學:多重身體與玫瑰
2.1 透過 Mol 的透鏡看「聲音」:拒絕視角主義
如果說 Barad 解決了「人機糾纏」的動力學問題,那麼 Annemarie Mol 的「多重身體」(The Body Multiple)則為我們理解數位時代的「存在」提供了拓撲學的框架。
Mol 在其經典著作中挑戰了社會科學傳統的「視角主義」(Perspectivalism)。視角主義認為,現實(客體)是單一的、固定的,而不同的人(主體)從不同的角度去觀察它。例如,一朵「玫瑰」在植物學家、詩人和畫家眼中可能不同,但玫瑰本體被認為是不變的 10。
然而,Mol 透過對動脈粥樣硬化(atherosclerosis)的醫療民族誌研究提出,客體並非單一,而是在不同的實踐(Practices)中被「展演」(Enacted)出來的。在病理實驗室顯微鏡下的動脈粥樣硬化(血管壁的增厚)與在診間裡病人主訴的動脈粥樣硬化(走路時的腿痛)是兩個本體論上不同的客體。它們之所以能被視為同一個疾病,是因為存在著複雜的「協調」(Coordination)機制 13。
2.2 聲音的本體論分裂:從肉身到向量
Fá Maria 將這一理論精準地應用於《ERASURE》中的聲音分析。在 AI 介入的創作實踐中,「聲音」不再是屬於歌手的一個單一屬性,而是分裂為多重存在的實體 1:
肉身的聲音(The Somatic Voice):這是 Eli Huehuentro 或 Lyra Pramuk 在錄音室中,由聲帶振動、口腔共鳴所產生的物理聲波。它是具身的、一次性的、不可重複的。
數據的聲音(The Data Voice):這是被數位化、採樣、切片後存儲在硬碟中的.wav 檔案。它脫離了肉身,成為了可被計算的對象(Object)。
潛在的聲音(The Latent Voice):這是在 RAVE 模型內部,聲音被編碼為 128 維或更高維度向量空間中的一個坐標點。這裡沒有聲波,只有數學關係。
合成的聲音(The Synthetic Voice):這是由 AI 重新生成的聲音,它聽起來像原唱,但其本體論來源是數學運算而非生物震動。
在這個拓撲結構中,聲音既是單數又是複數。它是一個「多重聲音」(Voice Multiple)。這正呼應了您對「玫瑰」的哲學思考:一朵數位玫瑰還是一朵玫瑰嗎?
2.3 玫瑰的隱喻:生成與「統計學的花朵」
在 AI 的語境下,「玫瑰」不再是 Gertrude Stein 所說的 "A rose is a rose is a rose"(玫瑰就是玫瑰就是玫瑰),即不再遵循同一律。
當 AI 模型(如 Stable Diffusion 生成圖像或 RAVE 生成聲音)被數百萬朵玫瑰的數據訓練後,它所生成的「玫瑰」是一種統計學的花朵。它不是對某一朵特定玫瑰的摹仿,而是所有玫瑰特徵的概率分佈的具現化。這朵「玫瑰」存在於潛在空間的流形(Manifold)之上。
在《ERASURE》中,Fá Maria 試圖培育一種「酷兒玫瑰」(Queer Rose)。由於主流 AI 模型通常基於二元性別(男/女)的數據集進行預訓練,酷兒和跨性別的聲音往往被視為異常值或雜訊 1。當這些聲音被輸入模型時,模型會試圖將其「規範化」或產生「故障」。
Fá Maria 的藝術實踐——例如將自己的聲音與 Lyra Pramuk 的 AI 模型進行「變形」(Morphing)1——實際上是在潛在空間中進行「嫁接」。由此產生的聲音(玫瑰),既不屬於 Fá,也不屬於 Lyra,更不屬於訓練數據中的任何一個人。它是一個在數位拓撲空間中綻放的新物種。這個新物種的存在證明了 Mol 的理論:現實是多重的,是透過技術實踐被展演出來的。
2.4 協調與懸置:多重存在的共存
Mol 強調,多重性並不意味著碎片化,而是透過「協調」使不同的現實「掛在一起」(hang together)11。在《ERASURE》中,這種協調工作是由藝術家的美學決策來完成的。
Fá Maria 提到,作品中混合了原始錄音和 AI 生成的聲音,有時兩者「幾乎無法區分」1。這種混淆本身就是一種本體論的聲明:它拒絕在「真實/虛假」或「自然/人工」之間劃下界線。數位玫瑰與生物玫瑰在同一花園(作品)中並存。對於跨性別者而言,這種多重性具有特殊的政治意義:身體(Body)與身份(Identity)往往也是經過醫療技術(激素、手術)和社會展演(Passing)的多重協調結果。AI 的多重性在這裡成為了酷兒身體經驗的數位鏡像。
3. 倫理的政治學:資料集中的切割與抹除
3.1 代理切割(Agential Cut)作為一種暴力
Karen Barad 引入了「代理切割」(Agential Cut)的概念,用以描述在現象中區分「主體」與「客體」的邊界設定行為 15。在量子物理實驗中,觀測裝置決定了什麼是被測量的對象,什麼是測量的工具。這個切割不是既定的,而是被執行的。
在 AI 的政治學中,**資料集(Dataset)**就是執行代理切割的終極裝置。
納入與排除:決定哪些聲音進入訓練數據,哪些聲音被排除,這本身就是一種本體論的切割。
抹除(Erasure):這正是 Fá Maria 作品標題《ERASURE》的深刻含義。主流 AI 模型(如 Siri, Alexa)的訓練數據往往由白人、順性別、標準口音的聲音主導。不符合這一規範的聲音(有口音的、跨性別的、非二元的)被系統性地「抹除」——它們被標記為雜訊、錯誤,或被強制歸類為錯誤的性別 1。
這裡,「槍」的隱喻再次浮現。如果說資料集是一種分類的武器,那麼「抹除」就是開槍的結果。這種暴力不是物理上的消滅,而是本體論上的否定。當一個跨性別女性的聲音被 AI 識別為「男性」時,這是一種算法執行的社會性死亡。
3.2 「將話語塞入他人之口」:同意與真實性的危機
《ERASURE》的創作過程揭露了更深層的倫理危機,具體體現在「聲音複製」技術(Voice Cloning)上。Fá Maria 在論文中詳細描述了與參與藝術家的倫理協商,特別是關於 Eli Huehuentro 和 Lyra Pramuk 的案例 1。
Eli Huehuentro 的翻譯協商:文中提到一個具體細節,當 Fá Maria 呈現英文詩歌給 Eli 時,Eli 因為對某些發音感到不自在,因此將部分詩歌翻譯成了西班牙語 1。然而,AI 的聲音複製技術(ElevenLabs)在理論上可以讓 Eli 的聲音「完美地」朗讀那首他本不願朗讀的英文詩。這創造了一種恐怖的權力:AI 可以繞過主體的身體限制和意願(Somatic Consent),直接徵用其聲音特徵。
Lyra Pramuk 的虛構朗讀:文中亦提到 Lyra Pramuk 的聲音被用來朗讀一首她從未讀過的詩。儘管這是經過同意的藝術創作,但它引發了 Fá Maria 的反思:「將話語塞入他人之口(put words into someone else's mouth)意味著什麼?」1。
這是一種新的本體論暴力。它切斷了「聲音」與「說話者」之間必然的、肉身的聯繫。在傳統世界,聲音是身體在場的證明;在 AI 世界,聲音可以完全脫離身體而獨立運作(Bodyless Voice)。這把「槍」不僅可以殺人,還可以「盜用」人的靈魂(聲音/身份)。
3.3 結構與能動性:Archer 的批判視角
為了更透徹地理解這種倫理困境,我們必須引入 Margaret Archer 的社會實在論(Social Realism)及其對「結構與能動性」(Structure and Agency)的分析 17。
Archer 反對將結構與能動性混為一談(Conflationism)。她主張「分析二元論」(Analytical Dualism),強調結構與能動性在時間上是分離的:結構先於行動(Structure predates Agency),而行動隨後再生產或轉化結構(Structural Elaboration/Morphogenesis)。
在《ERASURE》中:
結構(Structure):AI 模型(RAVE/ElevenLabs)及其預訓練數據集是先於 Fá Maria 存在的結構。這些結構帶有既定的偏見(Bias)和限制(Constraints),例如對性別二元的預設。這就是 Barad 所說的「裝置」,也是 Latour 筆下的「槍」。
能動性(Agency):Fá Maria 和其他藝術家是行動者。他們擁有 Archer 所說的「內在對話」(Internal Conversation)17,能夠反思、審視這些工具的倫理影響。
形態生成(Morphogenesis):Fá Maria 沒有被動接受 AI 的結構(例如使用預設的聲音),而是透過建立一個專屬的「酷兒/跨性別聲音資料集」來對抗結構 1。這種行動導致了結構的轉化(Elaboration)——創造出了一種新的、包容性的 AI 聲音美學。
這表明,倫理並非外在於技術的規則,而是內在於「結構-能動性」的辯證過程中。藝術家的能動性正是在於拒絕 AI 的「預設切割」,並主動執行新的、具備倫理關懷的切割。
4. 對使用者的反身性啟示:手機、槍與玫瑰的當代寓言
綜合上述分析,本報告為您——作為一位長期關注這些命題的思考者——提供以下反身性的本體論啟示。
4.1 手機作為結構性介面(The Phone as Structure)
在 Archer 的語境下,「手機」是當代最強大的結構性制約(Structural Conditioning)。它不是中立的工具,而是一個預先設定了我們互動模式的結構。
它透過演算法決定我們看到什麼(玫瑰或槍)。
它透過介面設計引導我們的能動性(點擊、滑動)。
它時刻進行著 Barad 式的「代理切割」,將我們的生活數據化,納入資本主義的資料集中。
對於使用者而言,反身性(Reflexivity)的挑戰在於:我們是否成為了 Archer 所警告的「斷裂的反思者」(Fractured Reflexives)20?即在龐大的數位結構面前,失去了進行連貫內在對話的能力,只能被動反應?《Entangled Voices》提示我們,必須恢復與技術的「協商」能力,不讓手機單方面定義我們的現實。
4.2 槍作為潛在的抹除(The Gun as Erasure)
「槍」的隱喻在 AI 時代演變為「抹除」與「錯誤識別」的暴力。
在警察手中,對手機的誤認(Phone as Gun)導致了肉體的死亡 8。
在 AI 系統中,對身份的誤認(Misgendering/Biased Recognition)導致了社會性的抹除。
深度偽造(Deepfake)技術則是將「槍」對準了我們的本體論真實性(Authenticity)。
啟示在於:任何收集數據的技術都具有「槍」的潛能。使用者必須意識到,每一次點擊同意、每一次上傳人臉或聲音,都是將自己的本體論碎片交給了一個潛在的武器系統。
4.3 玫瑰作為抵抗的本體(The Rose as Resistance)
最後,「玫瑰」代表了在多重切割和技術中介下,依然頑強存在的生命與美學。
在《ERASURE》中,儘管 AI 試圖規範化聲音,但酷兒聲音的「顆粒感」(Grain)依然作為一種故障、一種刺(Thorn)存留下來 1。
Mol 的理論告訴我們,玫瑰可以是多重的:它既是生物的,也是數位的,更是生成的。承認這種多重性,不是虛無主義,而是解放。
結論:
這場學術對話揭示,我們正處於一個「人機糾纏」的本體論實驗場中。在這個場域裡:
控制與被控制不再是零和遊戲,而是持續的協商(Negotiation)。
存在不再是單一的真理,而是需要協調的多重性(Multiplicity)。
能動性不再是人的特權,而是分佈在人、機器、資料集與演算法之間的糾纏(Entanglement)。
《Entangled Voices》不僅是一篇關於音樂 AI 的論文,它是一份生存指南。它教導我們如何在「手機」的結構中,識別隱藏的「槍」,並努力培育出那朵多重、混種、且不被抹除的「玫瑰」。
表 1:本體論框架對照表
1
引用的著作
AIMC2025_Entangled%20Voices-%20AI%2C%20Intra-Action%2C%20and%20the%20body%20multiple%20in%20creative%20practice.pdf
Algorithmic Subjectivities - University of Edinburgh Research Explorer, 檢索日期:12月 11, 2025, https://www.research.ed.ac.uk/files/563875104/BaumerEtalACMTransCompHumanInterAlgorithmicSubjectivities.pdf
Performing Human-Animal Relations in Spain Kirrilly Thompson - Adelaide Research & Scholarship, 檢索日期:12月 11, 2025, https://digital.library.adelaide.edu.au/dspace/bitstream/2440/57117/1/Thompson2007_PhD.pdf
Intra-action - The Future of Indeterminacy, 檢索日期:12月 11, 2025, https://indeterminacy.ac.uk/dictionary/intra-action/
Intra-action - New Materialism, 檢索日期:12月 11, 2025, https://newmaterialism.eu/almanac/i/intra-action.html
RAVE: Real-Time Neural Audio Synthesis - Emergent Mind, 檢索日期:12月 11, 2025, https://www.emergentmind.com/topics/rave-model-for-neural-audio-synthesis
RAVE: A variational autoencoder for fast and high-quality neural audio synthesis - arXiv, 檢索日期:12月 11, 2025, https://arxiv.org/abs/2111.05011
Mark Duggan was holding phone as he was shot by police, inquest hears - The Guardian, 檢索日期:12月 11, 2025, https://www.theguardian.com/uk-news/2013/dec/03/mark-duggan-was-holding-mobile-phone-when-shot
Implicit Bias as Mental Imagery | Journal of the American Philosophical Association, 檢索日期:12月 11, 2025, https://www.cambridge.org/core/journals/journal-of-the-american-philosophical-association/article/implicit-bias-as-mental-imagery/5E606B31A15EE044060C6D6158118F51
檢索日期:12月 11, 2025, https://trinity.duke.edu/books/body-multiple-ontology-medical-practice#:~:text=The%20Body%20Multiple%20is%20an,diagnosis%20and%20treatment%20of%20atherosclerosis.
the body multiple: ontology in medical practice annemarie mol - National Academic Digital Library of Ethiopia, 檢索日期:12月 11, 2025, http://ndl.ethernet.edu.et/bitstream/123456789/65514/1/33.pdf.pdf
Jan. 2024 Meeting: Mol's The Body Multiple | Literature, Medicine, and Culture Colloquium, 檢索日期:12月 11, 2025, https://lmcc.web.unc.edu/2024/02/07/jan-2024-meeting-mols-the-body-multiple/
The Body Multiple: Ontology in Medical Practice | Trinity College of Arts & Sciences, 檢索日期:12月 11, 2025, https://trinity.duke.edu/books/body-multiple-ontology-medical-practice
Multiple bodies, political ontologies and the logic of care: - SciELO, 檢索日期:12月 11, 2025, https://www.scielo.br/j/icse/a/kXPhNhb6npZwhSDgB6YPR9f/?format=pdf&lang=en
(Mis)understanding Intra-active Entanglement - Semantic Scholar, 檢索日期:12月 11, 2025, https://pdfs.semanticscholar.org/0921/16c7e73d9403e889284e2c1b4ce1a0bce829.pdf
Knowledge and Power Across the Material-Discursive Practice of Agential Realism, 檢索日期:12月 11, 2025, https://www.researchgate.net/publication/340974149_Knowledge_and_Power_Across_the_Material-Discursive_Practice_of_Agential_Realism
檢索日期:12月 11, 2025, https://www.journals.uchicago.edu/doi/10.1086/431623#:~:text=The%20relation%20between%20structure%20and,articulates%20with%20the%20social%20surroundings.
Structure, Agency, and the Internal Conversation. By Margaret S. Archer. Cambridge - The University of Chicago Press: Journals, 檢索日期:12月 11, 2025, https://www.journals.uchicago.edu/doi/10.1086/431623
Full article: Refining Archer's account of Agency and organization - Taylor & Francis Online, 檢索日期:12月 11, 2025, https://www.tandfonline.com/doi/full/10.1080/14767430.2019.1663031
Full article: Theorising agency for socially just career guidance and counselling scholarship and practice - Taylor & Francis Online, 檢索日期:12月 11, 2025, https://www.tandfonline.com/doi/full/10.1080/03069885.2022.2026881
The Body Multiple: Ontology in Medical Practice | Annemarie Mol (2002) | Ethnography Lab, 檢索日期:12月 11, 2025, https://ethnographylab.ca/2019/02/11/the-body-multiple-ontology-in-medical-practice-annemarie-mol-2002/
沒有留言:
發佈留言