生成式人工智能重塑国际传播:趋势与检视

2024-12-02 00:57 来源:对外传播

在国际传播实践中,以Sora为代表的生成式人工智能已经成为新的技术类行动主体,其在不断培育新的传播模式和样态的同时,也推动着政治、经济、文化等其他传播动力机制的演化。具体而言,人工智能可以作为大数据分析基础设施提升国际传播的适应性和精确性,以及通过多模态内容生成和虚拟现实技术的结合打造跨文化融合的“第三空间”,释放基于共情体验的文化流动。但在人工智能改变信息生产、传播与感知方式的趋势中,也出现了“深度伪造”伦理问题和人类主体创造的“知识中断”,同时算法训练数据的褊狭性也容易加剧极端意识形态和刻板印象的传播。因此,未来还须进一步扩大全球多元主体的参与共治,打破价值文化和技术设计的权力垄断,将技术演进融入进全球人类文明交流互鉴的行动框架。

【关键词】国际传播 人工智能 技术文化 Sora

一、引言:国际传播场景中的人工智能主体

2024年4月27日,清华大学联合北京生数科技有限公司正式发布了我国国产文生视频大模型——Vidu,它基于研发团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果,能够一次性生成16秒视频,在视觉效果方面能够呈现长镜头、追焦、转场等复杂动态。更重要的是,作为国产大模型,Vidu更能理解和生成熊猫、龙等特有的中国元素,可以突破西方中心审美的局限。作为生成式人工智能的前沿技术,文生视频模型正在以令人难以置信的速度更新我们对于全球传播的想象力。

在数字时代,技术创新过程往往在全球范围内指数级扩散,生成式人工智能就是这种创新扩散机制的典型代表。以ChatGPT为代表的大型语言模型(LLM)在信息生产和传播领域的成功应用正在吸引各国政府、高新技术企业、投资机构和媒介组织积极介入生成式AI的迭代升级和配套产业落地,不断挖掘人工智能促进生产力增长和市场消费升级的实用价值。技术哲学家吉尔伯特·西蒙栋(Gilbert Simondon)认为,技术物是一个开放的系统,通过对外部元素和个体的不断组装(assemble)而趋于稳定化。在国际传播领域,生成式人工智能已成为召唤相关联的技术、文化、经济与政治环境重组的关键主体,持续吸引不同内容资源和渠道方式与之缔结。这一趋势激发了我们对国际传播新型手段、界面和应用场景的想象,呼唤着对更多元、更高效的传播样态和产品的发掘。因此,国际传播亟待在与人工智能技术的互动中挖掘新的内涵和表达空间,以更好地适应和引领全球数字社会的发展变化。

但与此同时,生成式人工智能的发展也导致“自动化的困境”,令机器逻辑逐渐取代人本主义成为主导未来信息文明的基础认识论。这有可能强化国际传播场域既有的冲突性结构,为跨文化交流互鉴制造障碍。人工智能通过深度学习技术生成图像、音频或视频的强大能力启示我们必须不断检视“何为真实”的问题。作为能够显著影响信息生产、流通与感知方式的媒介行动主体,生成式人工智能正在界定国家叙事、本土文化价值以及全球受众信任在国际传播实践中的存在和作用机制。

因此,我们需要超越技术分析本身,将生成式人工智能纳入文化反思和批判的范畴,通过揭示人工智能的基础设施和模拟再现特性,正确认识其复杂的可供性,据此积极介入对它的管理和应用,推动向善的国际传播实践。

二、作为国际传播基础设施的生成式人工智能

生成式人工智能大模型可以实现对互联网用户和内容高效的自动化分析,以及对全球媒介用户共通情感的唤醒和营造,因而具有成为构建新型国际传播内容与方式的重要基础设施的潜力。

相比传统的人工局部统计,大模型数据分析的对象是更加庞大和形式丰富的数据,包括社交媒体文本、图像、视频、传感器数据等。对这些多媒体内容的准确分析通常需要依托深度学习、自然语言处理、图神经网络等复杂技术条件。这意味着国际传播主体可以利用人工智能技术进行更为有效的舆情、用户分析以及“出海”内容审核,以支持国家对外传播的全局性部署,从而在 “多元内容赛道”提升国际传播效果。具体来说,中国国际传播主体可以利用自然语言处理(NLP)技术和主题建模技术(如LDA)对海外社交平台上的每日热点话题进行分析,对适宜在全球社交平台传播的国际化议题进行预测判断,主动引领国际传播议程。同时,为了提升面向目标用户的精准传播,大数据分析可以锚定对中国相关内容感兴趣的用户并对他们主页上的多模态内容进行分析研判,提炼用户画像,挖掘更能够激发海外用户正面意见和表达的内容类型。借助人工智能进行“出海”内容审核也是一项重要工作。这一方面是由于国际传播领域存在大量真伪难辨的信息源,需要人工智能技术的自反性核查;另一方面也因为几乎所有全球性社交媒体平台都已建立起利用人工智能技术进行审核的稳定监管模式,加强人工智能审核技术的支持有利于中国“出海”平台和内容的国际化接轨。如Meta公司就在2024年2月制定了识别AI内容的通用技术标准,会给识别出的AI视频、音频和图像打上“人工智能制造”(Made with AI)标签。此外,基于版权信息数据库的内容过滤技术也在优兔等国外社交网站被普遍应用。因此,符合目标国家内容传播政策的智能审核就成为中国平台“出海”和内容“出海”获取合法性、合规性和价值认同的关键。目前,在人工智能审核技术的研发上,中国互联网平台也已经具备丰富的前沿经验。例如,今日头条在2017年上线了CID系统用于保护短视频版权;弹幕视频网站哔哩哔哩在色情审查上则可以做到每秒处理300张截图——嫌疑图片从读图、图片传输、计算、返回结果,全程平均响应时间约2.2秒。当下的主要挑战,是将不同国家的文化管理制度和平台用户政策纳入到“出海”内容审核的技术应用标准中,建立以人工智能基础设施保障国际传播内容监管的长效机制。

此外,生成式人工智能也是国际传播实践中重要的“情感机器”。数字技术革命带来了信息交往方式的变化,不断消解传统的地理空间区隔和与之相关的身份限制,使得源于不同地域的文化和生活方式能够实现普泛式传播,推动了以情感为纽带、具有经验共通性的网络社群生态的形成。与过去相比,数字时代的国际传播更加显著地诉诸用户的情绪与情感,能否进行成功的情感唤醒、营造沉浸式情感体验遂成为衡量传播效果的重要维度。在具体实践中,由于复杂文本在跨文化转译时可能造成的模糊歧义与多义性,故直接且直观的情感表达往往更能够吸引国际受众,这也是短视频近年来成为强势全球性内容产品的原因。目前,TikTok、Kwai等短视频平台在海外的巨大影响力已引发美国等西方国家政府的高度关注。短视频作为短、平、快的内容样态,通过在几分钟甚至几秒内密集输出情感叙事,拉近了用户与视频中人物和生活体验的距离,这同时也带来用户间彼此的兴趣聚合,形成了更易被算法洞察和归纳的情感集群。而人工智能算法依靠其强大的数据处理、分析能力以及学习优化能力,可以分析用户情感、内容偏好以及潜在需求上的相似性,实现对用户的“协同过滤”,并在这一过程中不断提高匹配分析和个性化推荐的精度。由此,人际情感传播在人工智能技术的介入下,开启了跨越广泛文化背景的主体间长循环。事实上,中国短视频平台的顺利“出海”,就依靠了国内用户数据的持续“喂养”,推动了自动推荐算法的优化,快速建立起聚合海外用户情感倾向和兴趣的协同过滤机制,确保海外用户接触到的信息更符合他们的个性化喜好和情感需求。在这一过程中,人工智能成为对接跨文化消费群体的重要基础设施兼制造情感连接的中介化网络行动者,且相比较在政策规范框架下寻求技术和社会文明的“价值对齐”(value alignment),科技平台会在利益驱动下更主动地趋向于利用人工智能基础设施制造人与人、群体与群体的“情感对齐”,以技术量化和聚合用户的情感需求,依托人工智能技术高效的偏好分析和预测来提升用户内容体验和对平台的使用惯习,这也为试图唤起“全球化共情”(global empathy)的国际传播创造了条件。

三、作为“世界模拟器”的生成式人工智能

数字技术在改变传统文化生产方式的同时,也为文化的全球传播凿刻了更加广阔的空间。目前,生成式人工智能正在推动多模态文化产品的跨文化适应和规模化“出海”,让本土文化产品更加高效地对接全球市场,成为全球跨文化虚拟空间生成和演化的关键技术引擎。

人工智能生成内容( AI Generated Content, AIGC)指利用人工智能技术(生成式AI路径)来生成内容的新型内容生产方式,可按照模态分为图像、文本、音频、视频等。据投资机构a16z统计,全球范围内,图像生成、文案写作和代码编写三类AIGC产品年营收都已超过了1亿美元。不同权威调研机构的报告均认为,AIGC有极大潜力覆盖国际传播从多媒体内容制作到海外传播分发的全应用场景,并基于智能产业集群拉动行业多元主体的创新参与。在跨文化传播的内容生产方面,我国主流媒体已开始探索生成式人工智能技术在视频产品制作领域的创新应用。2024年开年至今,中央广播电视总台已陆续推出《千秋诗颂》等AI视频作品。AI合成虚拟主播也成为一种全球性的创新内容生产实践,如今日印度媒体集团研发的多语种AI主播Sana,以及我国媒体推出的具有原型的仿真AI主播和原创数字人主播等。另外,人工智能也能够简化内容面向海外分发的流程,通过AIGC拉动生产效率。伴随全球网文和网剧市场规模扩张,国产原创文化内容正在加速全球化流行,其中,人工智能翻译已成为不可或缺的助力。如阅文旗下海外门户起点国际(WebNovel)已经开始借助人工智能将作品翻译为多种语言,并通过持续训练和词库积累保证人工智能对中国传统文化词汇、成语的准确理解。据《2023中国网络文学“出海”趋势报告》,在生成式人工智能助力下,多语种转化可以突破产能和成本的限制,使网文的翻译效率提升近百倍,成本降低超九成。人工智能应用节省人工成本的同时,作为新质生产力本身也足够引发国际受众的好奇。但从长尾效应来看,国际传播对生成式人工智能的开发还需要给用户创造更加不同的体验,进一步提升用户的情感投入度。

事实上,在生成式人工智能受到大规模关注之前,我们已经看到虚拟现实和感官沉浸如何对个人移情产生重要影响,其基础逻辑就是通过对特定虚拟环境空间的塑造,使个体深度进入不同的文化世界并获得新的感知和审美体验。人工智能技术不仅可以辅助虚拟视频获取更好的视听效果,因而被广泛运用于游戏、电影、动画等媒介业态的升级中;而且还可以利用低门槛的AIGC技术为个人搭建虚拟场景,为讲述数字故事提供支持,激发普通大众的参与,由此动员更广泛的国际传播行动主体,激发更丰富文化场景的出现,提升跨文化内容生产的活力。对此,爱德华·索亚(Edward W. Soja)提出的“第三空间”(Third Space)的概念具有认识论上的启发意义。所谓“第三空间”,指的是一种融构了真实和想象的异质性空间,是一种灵活呈现空间的策略。作为一个超越性的概念,“第三空间”的本质是能够重新协调文化表征的融合性空间,其不断自我增殖以确保纳入不同的异质性“他者”,使关于边界和文化身份的争论和再协商成为可能。依循这一定义,生成式人工智能搭建的元宇宙虚拟空间就具有成为跨越国别与社区、推动异质文化共融共生的“第三空间”的潜能。

例如,利用依托人工智能算法的扩展现实(XR)技术,行动者完全可以创造出更具沉浸感的跨文化交流场景。在大型多人线上虚拟现实(VR)游戏《VR Chat》中,人们可以借助3D虚拟模块形象与其他各国不同文化背景的玩家展开第一人称的交流,实现对彼此的接近与理解。而通过将增强现实(AR)与创意艺术结合起来,数字技术则能够使人造虚拟场景与现实场景成为一个有机整体,唤起不同的文化与情感体验,打造跨越真实与想象边界的“平行世界”。虽然目前这些技术在文化传播领域更多应用于展览场景,如为文物增添动态效果的AR导览系统等,但随着苹果公司的Apple Vision Pro等头显终端设备发展,跨文化传播行动者可基于更加开放的空间进行集体创作,构建更多虚实融合、文化融合的空间体验。

需要强调的是,在AIGC驱动的多模态传播领域,视频生成技术承载着最为极致的感官体验趋势,在国际传播中具有激发跨文化群体共情的广泛应用前景。目前最具代表性的视频生成技术显然就是OpenAI于2024年初推出的文生视频模型Sora。从技术可行性上,它在未来有望与VR、AR等虚拟技术相结合,并接入可穿戴设备,直接生成可感的3D虚拟事件(Virtual event)。在未来,我们可以设想用户进入虚拟空间并与即时生成的场景和事件展开互动,将虚拟观看转化为行动实践,助益有效的信息生产与新闻传播。由AI构筑和精细化处理过的场景也更有助于激发用户共情,使受众在虚实交错的体验中不断形成关于自我和外部社会的新认知,促使其展开对现实空间权力结构的反思。OpenAI在其官网上将Sora定义为“构建物理世界的通用模拟器”——预示着索亚的“第三空间”想象正在坚实的技术进化路径上成为现实。生成式人工智能所包孕的对世界进行仿真再现并与之展开交互的行动潜能,可以成为国际传播观念与实践创新的新起点,帮助我们探索建构虚拟平行世界与推进全球文化融合的生态路径。

不过,政治经济学的基本逻辑仍发挥着关键作用。斯坦福大学《人工智能指数报告》指出,2023年,61个著名的人工智能模型源自美国的机构,超过欧盟的21个和中国的15个,美国在人工智能领域的私人投资总额也是中国的近9倍。这使得消除人工智能的隐性偏见和文化传播中的保守权力结构面临着巨大的障碍。但从国内技术迭代速度来看,各模态呈现出成熟度越低、迭代速度越快的特点,文本和图像生成领域几乎在每一到两个月就能出现突破性技术进展,本文开头提到的Vidu大模型就是佐证。因此,虽然Sora还没有公开投放使用,对外界公布的算法信息也十分有限,但中国仍可以通过破除技术壁垒和在地化数据训练,提前布局对AI视听生成技术及相关全产业的应用构想和探索实践。伴随技术条件达到更加成熟的阶段,便可将搭建虚拟“第三空间”的蓝图转化为更加有影响力的、吸纳广泛国际传播主体的文化行动。

四、反思:多元主体参与共治的意义与实践

新闻传播是人的事业,遵循以人类主体性为中心的价值准则。国际传播建立在跨文化人类个体相互观照、相互理解的基础之上,是一种追寻人类主体间协调性的文化实践。在生成式人工智能日益成为全球数字媒体生态关键行动者的当下,如何构建基于人类主体性原则的参与和共治的国际传播结构,成为一个紧迫的议题。

生成式人工智能在其对国际传播实践的重塑中,催生或激化了一系列价值维度上的问题。比如,与自动化生成内容相伴而生的“深度伪造”的伦理问题。我们之所以要在国际传播实践中对深度伪造给予深切关注,不仅因为它生成虚假的信息,更在于它能够通过机制性和系统性的人工智能幻象让人失去对真实性和历史感的信任。当多模态AIGC能够与沉浸的虚拟体验完美结合,投入并相信虚拟世界或许会成为真实世界中人的一种逃逸式选择。在如此深度的感官麻醉中,我们如何确保人类始终保持自身对现实的关切和认知能力?再如,生成式人工智能强大的文本学习和多模态生成能力也易造成人类在复杂视听内容生产中的“知识中断”问题。当人工智能可以完全代替我们去决定在构造特定场景时呈现什么画面和角度、调度哪些声色光影元素、基于何种逻辑剪辑,人类最主要的主体性创意活动就会陷入停滞,大量业余或准专业创作者(同时也是有着巨大文化潜能的媒介行动者)学习和使用数字生产技术的意愿也会持续降低。对于国际传播来说,这往往带来丧失文化自觉的风险,有可能造成对于文化刻板印象的循环。

因此,本文推崇“人在回路”(human-in-the-loop)的理念,主张在文化生产与流通的不同环节,积极楔入人类主体性价值,推动人类伦理肩负起对智能技术人造物的监管责任。在具体实践中,践行“人在回路”理念的起点是高度重视技术研发与应用的“价值对齐”,即推动人工智能在执行任务过程中所实现的价值和用户所在意的价值保持一致。当前,人工智能科技公司OpenAI、谷歌收购的DeepMind均已建立专注于解决“价值对齐”问题的团队,诸多第三方监督机构、标准组织和政府组织也在参与。简单来说,“价值对齐”是由一种人类价值主导的、动态机器与动态用户间的良性交流协作机制。在理想状态下,这一协作机制应由科研机构、企业、用户、高校研究所和政府共同参与设计。但需要注意的是,不同“价值对齐”团队设立的价值原则是无法做到放诸四海而皆准的。在错综复杂的全球话语环境中,伦理和价值本身就存在着不同的方向和尺度,涉及不同国家政治立场与跨国资本利益等多重要素。而出于复杂的历史和政治原因,当下生成式人工智能技术的前沿设计标准主要掌握在欧美国家手中,同时,TikTok等平台在海外不断遭遇政治审查,揭示了跨国意识形态语境对于媒介技术应用的巨大限制,它致使人工智能的“价值对齐”在很多情况下仅成为与“西方中心主义”发展观的对齐,加剧了国际弱势群体的不公平境遇,造成全球信任危机。Sora就因尚未公开它具体的训练数据来源,而引发了有关文化多样性的担忧:“西方中心化”的大模型训练数据可能导致接入该技术的国内传播主体陷入文化适应与表达困境。“人在回路”得以实现的前提,应是打破既有的话语权力垄断,在伦理监管上为展现不同国家的文化差异和特色提供空间。正如西蒙栋指出:“人类应该成为一个技术物社会永恒的组织者,就像管弦乐队中的指挥家一样。”国际传播实践应始终将与生成式人工智能相关的技术体系作为修缮跨文化交互关系的基本框架,确保社会文化、伦理价值、政策制度、法律法规与技术体系的共同进步。

巴西媒介理论家弗卢塞尔(Vilém Flusser)认为,文字诞生前的图像是对自然界的描摹,而线性文本的产生则造就了概念性思维,使之后出现的图像成为文本的视觉化,因此技术图像的视觉化与对客体物的描绘有着截然不同的意义,这反映了现代视觉表征背后无所不在的话语权力。而像Sora这样的多模态AI生成应用,由于没有具身感知的器官,并不具备对自然进行直接模仿的能力,而只是对数字化符码的再虚拟化,所以它所学习的对于世界的概念化理解并非多元普惠的。因此,我们需要更加警惕人工智能多模态生成背后的数据支持结构。如果不能推动训练数据库的文化多元性,就无法打破传统“第二空间”的文化表征垄断,从而难以在跨国传播中构造中心和边缘相互流动的、具有包容性的“第三空间”。

五、结语

生成式人工智能大模型是未来国际传播实践的重要基础设施,企业、学界、政府应展开合作,推动各国基于自身特殊性建设自主技术设计标准、制定数据采集相关政策与法律,并在积极的跨文化交流对话中促成包容性全球人工智能规范的落地。突破既有传播偏向与权力结构的前提,是拥有更多自主性的技术、应用与模型。目前,中国正在大力推进人工智能技术的自主研发,如百度发布了基于飞桨(Paddle)平台的知识增强型大型语言模型“文心一言”,阿里巴巴也推出了大型语言模型“通义千问”,这两家中国公司都声称未来将把大型语言模型集成到各种项目中。上述研发行动为中国人工智能技术规范的自主建设提供了坚实的基础,显示出社会多元主体参与人工智能基础设施共建的重要意义。

与此同时,生成式人工智能驱动的国际传播新体系下,在观念上应超越技术加速主义和技术威胁论的简单二元论,于实践中则既要努力争取国际先发优势,也要防范自动化系统破坏人的自由全面发展和人类文明的多元演进。数字时代的国际传播不仅要拓宽本土文化的“出海”路径,也要重视提炼文化创意生产和传播需求,建立跨领域、跨学科的理论资源交流平台,有自觉性地引导人工智能基础研究和行业应用,积极促成国际传播多元样态的发展,最终把构建全球人类命运共同体与推进人工智能经济发展的目标统筹协调起来,在现实与虚拟维度为人类文明交流互鉴打造广阔的“第三空间”。

责任编辑:石旭