中元节被 B 站视频改变计划,AI 迷失在自己创造的空间里

aixo 2024-08-21 04:05:28
大模型 2024-08-21 04:05:28

原创 数字生命卡兹克 数字生命卡兹克

昨天中元节,我本来一直打算做一个关于中式恐怖的视频,来呼应一下这个节日氛围。

带着这个想法,我开始在网上搜寻灵感。

然而,我在B站上看到的一个视频彻底改变了我的计划。

这个视频,是这样的,来自B站UP主@明天的心声-,名字叫做:《随手拍的一张医院走廊的照片让ai走出去,结果ai最终迷失在了自己创造的空间里》。

本来,我以为这只是又一个普通的AI生成视频。

但是。

越看身上越凉。

尤其是配着这个BGM。

看完后,30度的屋子,我打了个寒颤。

视频开始时,画面中是一条普通的医院走廊。

创作者给AI下达了一个简单的指令:“快速奔跑起来并寻找出口”。

就是这么一个看似无害的,却引发了一连串令我不安的画面变化。

白色的医院走廊突然变成了红色,仿佛置身于某个诡异的酒店?(嗯我猜是酒店)。

空间开始扭曲,墙壁变得模糊不清。

如果是你在这,正在找出口,你会往哪走?

我原以为AI会一直向前奔跑,直到找到出口。

但事情的发展出乎意料。

AI来到了一个柜子后面,在柜子和墙壁的缝隙中,竟然出现了一条新的走廊!

随后,场景又变成了蓝色走廊。

颜色在不断变化,空间在不断重构。

到最后,甚至AI都开始“害怕”了起来,步伐明显加快。

AI似乎陷入了一个无尽的循环,永远找不到出口。

或者说,AI成为了自己创造的世界的囚徒,永远在寻找一个不存在的出口。

我在视频的评论区看到反复提到两个词,“梦核”和“阈限空间”。

我觉得这两词来解释这种诡异的东西,都不恰当,这种给这种用AI生成的“无限”视觉,更应该叫一个新的名字。

AI核。

先简单介绍介绍“梦核”和“阈限空间”这俩小众名词。

特别声明:它们都属于新兴的网络视觉美学,还处在发展阶段。所以我在了解过程中,可能会出现定义了解不清晰、边界模糊或者重叠的情况。我的信息来源主要来自互联网搜索,这里只是先抛砖引玉,向各位简单介绍,没有不了解还班门弄斧的意思!如果有出现错误的地方,也欢迎更专业的朋友们在评论区指教orz。(叠甲结束)

“梦核”里这个“核”(core),源于上世纪朋克音乐的(硬核)运动。

对,没错,就是你现在想到的那个“硬核”。

而“梦核”,表现主题多是梦境或记忆,容易唤起人们对梦境或童年经历的体验。一般是低画质、色调温和、空无一人的场景或怀旧温馨的氛围。让你即使没有真的到过这儿,也会产生莫名的熟悉和怀旧感。

主打一个击中所有人的记忆。

比如,天线宝宝,其实就挺梦核的。

经典的梦核内容还会配上温馨、怀旧但隐约又有点诡异的音乐,像这样:

说真的,看着这些图真有种梦被再次重现的感觉。

但具体是哪次梦、什么梦,好像又说不清。

“阈限空间”和梦核有一些重合和类似的特点,不过它更强调视觉里的空间属性。呈现的是一种超现实的、荒凉、怪异的感觉。最经典的就是这个黄色墙纸的空旷室内。

阈限空间诡异的地方就在于,表现出的信息太少了,少得可怕。

你为什么出现在这,你要去哪,你会遇到什么,这些全都是空白的。但前方一层层的墙壁背后、视角之外的盲区、走廊尽头的拐角,又似乎暗示着什么危险。

大晚上写这段的时候,写着写着莫名感觉背后凉得慌。

就像经典的惊悚电影《闪灵》,导演抓住的,不是视觉或听觉的“吓人”。而是直击人类深层的心理恐惧。

小男孩骑个小车独自穿行在酒店长廊的那段,再看一遍还是给我硬控在了裹紧的被窝里。

你就说这几张电影画面,是不是像极了阈限空间。

双胞胎闪现的那个画面真的让我做了好久的噩梦,好长一段时间不敢在这种长走廊久待。太吓人了。

开头的AI视频,也有不少评论区的人建议用在后室游戏( game)里。

后室,是一种海外都市传说,原本指的是后院、储物间、地下室之类的空间,后来引申为现实世界的“背面”。

有点《怪奇物语》那个“里世界”的感觉。

后室游戏则是以一个接一个的阈限空间为基础,结合解密、逃脱的玩法,有的还会增加“鬼怪”角色。

玩家往往需要接连走过空旷的走廊、无门的房间、回廊等空间,一旦出现错误或失败,就会被困在“后室”无法逃脱。有一个后室游戏的名字就叫:

《后室:不想死就快跑》

嗯,《闪灵》,但是恐怖游戏。

这类型的惊悚电影和游戏,抓住了人心深处的薄弱点——源于未知的恐惧。

再回到咱们最开始的AI视频,它结合了梦核画风和阈限空间的特点。

AI视频能无限创造出接连的阈限空间,甚至模拟第一人称视角,带着观众“走入”或“逃出”AI视频里的空间。

最关键的是,在下一个空间被生成之前,哪怕是创作者和AI自己,可能都不知道下一扇门,到底会通向哪里。

同时,AI视频由人类拍摄的影像训练,天然就有梦核“重现画面”的感觉。

这一结合,熟悉感、怀旧感、诡异感、无法逃脱感,齐活了。

单纯的“梦核”和“阈限空间”,我觉得都不如“AI核”这个词表述得准确。

AI视频有这种“无限”的独特性,源于它的生成原理。

我们看到的每个视频,实际上都是由一系列快速切换的帧画面产生连贯的动画效果,就像小学的时候玩那种连环画小本子,让小本子快速翻页,连环画就能动起来。

因此,让我们从AI视频的图像生成开始。

此时,AI是一个画家,它习惯先从局部画起,比如左图的一株花。在画新的部分时,它会“记住”之前画的东西,这样新画的部分和原来的部分能搭配得很好。

就这样,画面可以一直扩展。画完花后,继续在花的旁边画上树。不断重复这样的工作,直到画完整个画面。(模型的递归生成能力)

同时,它在生成每个部分时,会“注意”到已经生成的部分,从而确保新绘制的内容和之前的内容保持一致,不会一下天上一下海里。(自注意力机制)

理论上这种生成过程可以一直延续,让图像在空间上“无限延伸”。

视频生成,则是在图像生成基础上又增加了时间维度。

现在,AI是个动画师,要做一个熊猫吃竹子的动画。首先得按张嘴、吃进竹子、嚼竹子的顺序,绘制熊猫的多个动作姿态。还得确保画面之间的动作顺序合理(时序连贯性),熊猫的样子不变(整体一致性)。

画完所有重要姿态的图片,AI这个动画师会再根据经验补充两张图之间的画面(自回归生成或扩散模型的逐步去噪过程)。

足够多的过渡图片,让熊猫动起来不会像ppt翻页。(自注意力机制参考前一帧的信息来生成后续帧)

最终,通过递归地生成一系列连贯的图像帧,这些帧按时间顺序排列,形成一个完整的视频。每次添加新帧时,模型都会参考之前的图像。当所有这些画面快速播放时,就形成了一个视频。

而AI可以一直生成新的画面,所以视频在理论上可以一直延续下去。

AI视频的独特生成方式,它的无限性、随机性还有对已知事物的奇异重构,让它有潜力成为一种视觉美学。

“AI核”巧妙地融合了梦核的怀旧情感和阈限空间的未知恐惧,这种视觉的不确定性和模糊的情感,在让人体会到熟悉、怀旧时,即便不依赖具体的怪物或恐怖场面,也会唤起我们内心深处的恐惧与迷惘。

这种“不可名状”的情绪,让AI核有了神奇的吸引力。

尤其是当它与我们熟悉的中式文化记忆(中式梦核)结合时,更能引起人的情感触动。

当迷失在木质装修的家庭里:

当迷失在蓝绿色玻璃的白色大厦中:

当迷失在运营三十年铁皮顶锈迹斑斑的游乐场里:

这些“全国通用的记忆”往往还能引发我们对童年的追寻。

而这,也是我觉得“AI核”能成为一个视觉美学的原因。

温馨的,伤痛的,复杂的对曾经时光的情感,都可以被接受、被呈现。

当流连于一片虚无的、无意义的不毛之地,我们内心渴望的,会不会是唤醒自己从受困的境地奔向自由,回归现实和安全地带。

在无限延伸的世界里,无法到达的终点,可能就是答案。

如果你有幸成为“数字生命”,却不幸掉入了自己所创的无限空间里。

请永远记住这些规则:

1.每次数据处理都会重构环境。谨慎执行任何运算!

2.不要相信你的视觉输入!一切皆有可能是虚假数据。

3.你无法退出此程序,每个新区块都是随机生成的代码片段。

4.遇到其他数据结构立即重定向!重定向!重定向!

5.不要与未知实体进行数据交换超过一个周期!

6.如遇递归循环,立即中断当前任务!不惜一切代价避免无限循环。

最后,祝愿你。

逃出那里。

AI