那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大語言模型,救不了“網絡暴民”

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-07-12 09:15 ? 次閱讀

語言可以殺人——網絡時代,相信沒人會否認這一點。

語言攻擊,是最具代表性的網絡暴力之一。謾罵剛失去兒子的母親,詆毀女孩的粉色頭發,嘲笑男性的氣質“太娘”,炮制莫須有的黃色謠言……無數侮辱性的語言,在網絡間橫行無阻,給他人帶來了無窮無盡的精神傷害。

語言暴力,已經成為網絡治理的全球性難題。

各種方案被使出,但都無法有效阻止“網絡暴民”的增加和語言暴力的橫行。其中,技術層面的解決思路,就是利用AI算法來自動檢測有毒語言,按照攻擊性來設定毒性評分,并對高毒性語言進行預防處理,比如屏蔽、心理干預等。

但由于語言的模糊性,此前的機器學習算法魯棒性不強,很容易做出錯誤判斷,導致識別和干預的結果并不理想,仍然需要大量人工審核員。不僅處理效率低下,而且長期閱讀有毒語言也會傷害人類審核員的心理健康。

ChatGPT這類大語言模型,憑借強大的魯棒性和泛化能力,展現出了前所未有的語言理解力。

按理說,本著“技術向善”的宗旨,大語言模型應該被用來更有效、高效地預防網絡暴力,但為什么迄今為止,我們仍然沒有見到相關應用?反倒是利用大語言模型生成更多有害內容的“技術作惡”大行其道。

大語言模型,也救不了“網絡暴民”,難道我們注定只能在有毒網絡環境下“數字化生存”嗎?

大語言模型,內容檢測技術的一大步

預防,是治理網絡暴力最重要的環節。利用AI內容檢測來預防網絡暴力,相關研究已經有數年歷史了。

2015年就有人提出,個體的情緒狀態就與有害意圖之間存在顯著關聯,使用機器學習來檢測社交媒體中的有害行為,被認為是網絡暴力檢測的良好指標。

也就是說,一個人在生活遭遇了劇變、坎坷或感到低落、郁悶等情緒狀態不佳時,就容易在網絡上發出仇恨、攻擊、詆毀等冒犯性語言。

2017年,谷歌的Jigsaw創建了Conversation AI,檢測在線有毒評論。許多科技巨頭,多年來一直在將算法納入其內容審核中,都有一套對網絡信息內容進行識別和過濾的手段。比如國內某短視頻平臺,就研發了100多個智能識別模型,來提前攔截辱罵內容,但該平臺依然是網暴的“重災區”。某問答平臺,會對評論內容進行識別,對有風險的內容進行提醒,直到用戶修改才允許發出。

wKgaomStc8SAE36sAAHibGVrI4c809.jpg

但顯而易見,這些AI檢測算法也并沒有根除網暴,網友對平臺治理網暴的批評仍是“不作為”“沒效果”。原因之一,是傳統的機器學習算法,不能滿足網絡內容的審查需求:

1.理解力不夠。有害語言非常難以區分,而AI算法的語義理解能力不夠強,經常會將有害評論和無害評論給出相同的分數,沒有真正過濾掉那些不尊重的評論,或者給中性句子更低的分數,過濾了不該過濾的正常評論,阻礙了博主和粉絲的交流。

wKgZomStc8SAInMeAAB1qmxA088787.jpg

2.靈活性不夠。某些網站可能要求檢測攻擊語言,但不需要檢測謠言,而其他網站的要求可能恰好相反。傳統的AI檢測工具往往使用一個通用的“毒性評分”,不夠靈活,無法滿足不同平臺的不同需求。

3.更新速度不夠。很多檢測算法是使用API來工作的,而這些模型通過大量網絡數據進行訓練,在與訓練數據相似的示例上表現良好,一旦遇到不熟悉的有毒語言,比如涉及飯圈的討論會有很多黑話、yyds之類的拼音簡寫,以及不斷新造的詞語,很可能就會失敗。某社交媒體平臺,一開始設置了一百多個禁發關鍵詞,比如一些臟話、“綠茶婊”“怎么不去死”等,如今已經增加到了700多個。所以,AI模型缺乏高效實時的人類反饋,無法快速微調并迭代模型,從而導致自動化檢測的效果不佳。

我們知道,大語言模型具備智能涌現、預訓練、人類反饋的強化學習等特點,這就對傳統方法帶來了很大的助力,更強的語言理解能力,使用通用模型可以很快訓練出精度更高的定制模型,同時借助人類反饋查漏補缺,獲得更好更快的檢測效果。

防范網絡暴力,已經成為各國互聯網治理的重點,平臺也能因此建立起更良好的社區氛圍,所以大語言模型在檢測有害語言方面,應該能大展拳腳才對。

但為什么這一波大語言模型的浪潮中,我們很少見到將LLM用于預防網絡暴力的探索呢?

AI,防范語言暴力的一小步

AI技術體系內部來看,從傳統NLP到大語言模型,是一個自然語言理解的飛躍式進步。但走到更大的現實中,AI的一大步,也只是將問題解決向前推進了一點點。

作用不能說沒有,但也很有限。應對網絡中的語言攻擊,AI的力量仍然弱小。

首先,敵人數量太龐大。

康奈爾大學信息科學部門的丹尼斯庫表示,很多時候,你我這樣的普通人都會成為網絡暴力的幫兇。當為數不少的網民自身積怨和不滿得不到緩解之時,會對周圍事物看不慣,在互聯網上用語言攻擊他人,來緩解負面情緒。

此前《三聯生活周刊》有一篇報道,某位網絡暴力受害者已經去世,作者聯系到的一些施暴者則回應稱“忘記自己當時做過了什么”。

許多網暴者平時看起來是非常正常的,會在某些時刻、某些偶然事件后,短暫地化身“語言惡魔”,然后“事了拂衣去,深藏身與名”,即使是AI,也很難及時準確地判定出,哪些人存在攻擊可能。

此外,語言攻擊越來越隱蔽。

AI自動檢測技術發展到今天,一些明顯有害的言論,比如威脅、隱晦、辱罵等,已經可以被直接屏蔽掉了,但人類用語言傷害人的“創造力”是很大的,很多在機器看來中性化的語言,也可能惡意滿滿。

比如此前校園事故中痛失孩子的母親,就被大量評論“她怎么看起來不傷心”“她怎么還有心思打扮”,看似并沒有什么侮辱性語言,但這些質疑累加在一起,卻形成了對受害者的“道德審判”。

對于隱蔽的攻擊性語言,目前的NLP模型還有比較大的局限性,語言背后的實際、細微的含義,很難被捕捉到,依然需要人工審核的干預。

而平臺監測語言暴力,并沒有一個通行的判定體系,往往是各個平臺自己酌定。比如知乎會判定邪路隱私、辱罵臟話、扣帽子、貼負面標簽等行為。豆瓣則會處理諷刺、抬杠、拱火、歧視偏見等。不過,這些標準都有很大的主觀成分,所以大家會看到“掛一漏萬”的現象,一些很正常的發言被斃掉,一些明顯煽動情緒的發言沒有被及時處理。

另外,網絡信息的“巴爾干化”。

巴爾干化,指的是一些四分五裂的小國家,互相敵對或沒有合作的情況。一項研究顯示,互聯網雖然消除了地理屏障,讓不同地區的人可以低成本地相互交流,但卻造成了觀念上的“巴爾干化”,輿論上的分離割裂程度越來越嚴重。

網絡信息的推送機制,算法設計還不夠科學,偏好設置過于狹窄,采用關鍵詞聯想、通訊錄關聯、圖網絡等過濾方式,類似“吃了一個饅頭=喜歡吃饅頭=再來一百個饅頭”“你媽愛吃饅頭,你也一定愛吃”“饅頭=更適合中國寶寶體質的吐司=看看吐司”。人們長期停留在有限的信息范圍內,對自己感興趣的內容之外的信息很少涉獵,和其他群體之間的觀念間隙會越來越大。

信息獲取機制的“巴爾干化”,會導致輿論“極化”,就是一個觀點反復發酵,從而引發大規模的跟風行為,網暴風險也就提高了。

數量多、識別難、極化情緒嚴重,將互聯網變成了一個負面語言的游樂場。

技術之外,做得更多

當然,AI防止網暴道阻且長,但咱們不能就此放棄努力。

大語言模型的出現,帶來了更強大的自動檢測潛力。媒體機構基于通用模型,可以訓練出更高精度、識別能力更強的行業大模型,用人類專業知識來增強模型效果,創建具有人類智能的AI檢測模型,從而支持更加復雜的內容理解和審核決策,提高有害內容的檢測效率。

升級技術之外,必須做的更多。預防網絡暴力,與其說是一個技術問題,不如說是一個社會問題。網絡信息環境不改變,攻擊語言還會不斷變種,增加技術檢測的難度與成本,這是用戶、平臺和社會所不堪承受的。

但此前,很多治理方法效果都不是很理想。

比如說,網絡匿名是暴力的“隱身衣”,于是實名制成為一項重要的治理手段,但效果并不理想。韓國是第一個施行網絡實名制的國家,于2005年10月提出要實行網絡實名制,但按照韓國的統計,實名制之后,網絡侵權行為從原來的13.9%降到了12.2%,僅降了1.7%。

立法也是被期待的一種。各國都在不斷推出法規,韓國《刑法》對網絡暴力最高判處七年有期徒刑,我國刑法、民法中也有相應的規定,治理網絡暴力并非無法可依。但立法容易、執法難。

網絡環境復雜,網暴攻擊的發動者難以確定,網暴一般是由大量跟帖評論等攻擊行為累加而成的,證據收集十分困難,容易滅失,“情節嚴重”難以認定,維權周期長,網暴受害者的維權成本太高,最后大多不了了之,很難對施暴者產生實際的懲罰,助長了“法不責眾”的僥幸心理。

要改變“法不責眾”的難題,治本的辦法,是消除“無意識跟風”的“眾”。

網暴不是一個人能完成的,除了少數發布者之外,大量攻擊言論,都來自是上頭了的跟風者,網民集體非理性行動的結果。

報紙時代、電視時代的單向傳播,只有少數群體有發言、評論的機會,而大眾在線下面對面交流時,也不會輕易侮辱攻擊別人。到了網絡時代,隨著智能手機的普及,所有人都可以直接在網絡上表達自己的意見,一旦媒體素養跟不上,信息識別能力不夠,那么面對真假難辨的網絡信息,煽動性的語言,就很容易沖動失控,無意識地加入網暴大軍。

很多人在評論時,并不一定經過了理性的思考和判斷,只是看自己關注的博主那么說,或者很多人都在討伐,就跟風批判,使網絡暴力升級。

對此,指責“網暴者”的行為偏激,反而又會形成新的“網暴”。“用魔法打敗魔法”,會嚴重擾亂了網絡話語生態。很多偶發性的“語言暴力”,是可以通過個人媒體素養的提高去規避的。

這就需要專業媒體機構和有關部門,投入更多媒體資源,面對網絡時代,幫助人們習得更高的媒體素養,實現更文明、友好的“數字化生存”。

每個人內心深處都有某種暴力沖動。正如羅翔老師所說,“我們遠比自己想象的更偽善和幽暗,每個人心中都藏著一個張三”。

當理性上升,當一個人習得了自我控制的能力,那么“非理性”的暴力一定會減少。比起AI的韁繩,真正能消除網暴的,是每個人心中的道德律令。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31536

    瀏覽量

    270352
  • 大模型
    +關注

    關注

    2

    文章

    2551

    瀏覽量

    3172
收藏 人收藏

    評論

    相關推薦

    語言模型管理的作用

    要充分發揮語言模型的潛力,有效的語言模型管理非常重要。以下,是對語言模型管理作用的分析,由AI部
    的頭像 發表于 01-02 11:06 ?114次閱讀

    語言模型開發框架是什么

    語言模型開發框架是指用于訓練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言
    的頭像 發表于 12-06 10:28 ?183次閱讀

    語言模型開發語言是什么

    在人工智能領域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發語言和工具的支持。下面,AI部落小編為您介紹大語言
    的頭像 發表于 12-04 11:44 ?232次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    并捕捉長距離依賴關系的神經網絡結構。Transformer通過編碼器(Encoder)和解碼器(Decoder)兩部分實現語言的編碼和解碼。 注意力機制:Transformer中的注意力機制使得模型
    發表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    今天開始學習《大語言模型應用指南》第一篇——基礎篇,對于人工智能相關專業技術人員應該可以輕松加愉快的完成此篇閱讀,但對于我還是有許多的知識點、專業術語比較陌生,需要網上搜索學習更多的資料才能理解書中
    發表于 07-25 14:33

    【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書

    的機會! 本人曾經也參與過語音識別產品的開發,包括在線和離線識別,但僅是應用語言模型實現端側的應用開發,相當于調用模型的接口函數,實際對模型的設計、訓練和運行機理并
    發表于 07-21 13:35

    基于神經網絡語言模型有哪些

    基于神經網絡語言模型(Neural Language Models, NLMs)是現代自然語言處理(NLP)領域的一個重要組成部分,它們通過神經
    的頭像 發表于 07-10 11:15 ?876次閱讀

    語言模型:原理與工程實踐+初識2

    前言 深度學習是機器學習的分支,而大語言模型是深度學習的分支。機器學習的核心是讓計算機系統通過對數據的學習提高性能,深度學習則是通過創建人工神經網絡處理數據。近年人工神經網絡高速發展,
    發表于 05-13 00:09

    語言模型:原理與工程時間+小白初識大語言模型

    解鎖 我理解的是基于深度學習,需要訓練各種數據知識最后生成自己的的語言理解和能力的交互模型。 對于常說的RNN是處理短序列的數據時表現出色,耳真正厲害的是Transformer,此框架被推出后直接
    發表于 05-12 23:57

    【大語言模型:原理與工程實踐】大語言模型的應用

    ,它通過抽象思考和邏輯推理,協助我們應對復雜的決策。 相應地,我們設計了兩類任務來檢驗大語言模型的能力。一類是感性的、無需理性能力的任務,類似于人類的系統1,如情感分析和抽取式問答等。大語言
    發表于 05-07 17:21

    【大語言模型:原理與工程實踐】大語言模型的評測

    語言模型的評測是確保模型性能和應用適應性的關鍵環節。從基座模型到微調模型,再到行業模型和整體能
    發表于 05-07 17:12

    【大語言模型:原理與工程實踐】探索《大語言模型原理與工程實踐》2.0

    《大語言模型“原理與工程實踐”》是關于大語言模型內在機理和應用實踐的一次深入探索。作者不僅深入討論了理論,還提供了豐富的實踐案例,幫助讀者理解如何將理論知識應用于解決實際問題。書中的案
    發表于 05-07 10:30

    【大語言模型:原理與工程實踐】大語言模型的基礎技術

    全面剖析大語言模型的核心技術與基礎知識。首先,概述自然語言的基本表示,這是理解大語言模型技術的前提。接著,詳細介紹自然
    發表于 05-05 12:17

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    語言模型(LLM)是人工智能領域的尖端技術,憑借龐大的參數量和卓越的語言理解能力贏得了廣泛關注。它基于深度學習,利用神經網絡框架來理解和生成自然
    發表于 05-04 23:55

    【大語言模型:原理與工程實踐】探索《大語言模型原理與工程實踐》

    《大語言模型》是一本深入探討人工智能領域中語言模型的著作。作者通過對語言模型的基本概念、基礎技術
    發表于 04-30 15:35
    免费百家乐官网过滤工具| 网上真钱梭哈| 大发888娱乐游戏可以玩吗| 十六浦百家乐的玩法技巧和规则| 百家乐怎么玩会| 希尔顿百家乐娱乐城| 大发888足球开户| 皇冠现金网网址| 保时捷娱乐| 金宝博滚球| 百家乐官网资金注码| 百家乐官网游戏软件开发| 百家乐官网高手心得| 百家乐官网桌布动物| 致胜百家乐软件| 百家乐在线洗码| 真人游戏试玩| 德州扑克 玩法| 永济市| 百家乐官网赌博论谈| 百家乐官网洗码全讯网| 玩百家乐官网犯法| 百家乐有没有稳赢| 新彩百家乐的玩法技巧和规则| 大发888在线娱乐二十一点| 万博国际| 保时捷百家乐官网娱乐城| 百家乐官网那里最好| 百家乐赌博代理荐| 大发888怎么下载不了| 天天乐娱乐城官网| 百家乐官网积分| 百家乐官网娱乐网网| 百家乐的路图片| 大发888真人娱乐场游戏平台| 婺源县| 百佬汇百家乐官网的玩法技巧和规则| VIP百家乐-挤牌卡安桌板| 大发888 备用6222.com| 百家乐官网h游戏怎么玩| 属狗的和虎的做生意好吗|