中元节被 B 站视频改变计划，AI 迷失在自己创造的空间里

aixo 2024-08-21 04:05:28

2024-08-21 04:05:28

原创数字生命卡兹克数字生命卡兹克

昨天中元节，我本来一直打算做一个关于中式恐怖的视频，来呼应一下这个节日氛围。

带着这个想法，我开始在网上搜寻灵感。

然而，我在B站上看到的一个视频彻底改变了我的计划。

这个视频，是这样的，来自B站UP主@明天的心声-，名字叫做：《随手拍的一张医院走廊的照片让ai走出去，结果ai最终迷失在了自己创造的空间里》。

本来，我以为这只是又一个普通的AI生成视频。

但是。

越看身上越凉。

尤其是配着这个BGM。

看完后，30度的屋子，我打了个寒颤。

视频开始时，画面中是一条普通的医院走廊。

创作者给AI下达了一个简单的指令：“快速奔跑起来并寻找出口”。

就是这么一个看似无害的，却引发了一连串令我不安的画面变化。

白色的医院走廊突然变成了红色，仿佛置身于某个诡异的酒店？（嗯我猜是酒店）。

空间开始扭曲，墙壁变得模糊不清。

如果是你在这，正在找出口，你会往哪走？

我原以为AI会一直向前奔跑，直到找到出口。

但事情的发展出乎意料。

AI来到了一个柜子后面，在柜子和墙壁的缝隙中，竟然出现了一条新的走廊！

随后，场景又变成了蓝色走廊。

颜色在不断变化，空间在不断重构。

到最后，甚至AI都开始“害怕”了起来，步伐明显加快。

AI似乎陷入了一个无尽的循环，永远找不到出口。

或者说，AI成为了自己创造的世界的囚徒，永远在寻找一个不存在的出口。

我在视频的评论区看到反复提到两个词，“梦核”和“阈限空间”。

我觉得这两词来解释这种诡异的东西，都不恰当，这种给这种用AI生成的“无限”视觉，更应该叫一个新的名字。

AI核。

先简单介绍介绍“梦核”和“阈限空间”这俩小众名词。

特别声明：它们都属于新兴的网络视觉美学，还处在发展阶段。所以我在了解过程中，可能会出现定义了解不清晰、边界模糊或者重叠的情况。我的信息来源主要来自互联网搜索，这里只是先抛砖引玉，向各位简单介绍，没有不了解还班门弄斧的意思！如果有出现错误的地方，也欢迎更专业的朋友们在评论区指教orz。（叠甲结束）

“梦核”里这个“核”（core），源于上世纪朋克音乐的（硬核）运动。

对，没错，就是你现在想到的那个“硬核”。

而“梦核”，表现主题多是梦境或记忆，容易唤起人们对梦境或童年经历的体验。一般是低画质、色调温和、空无一人的场景或怀旧温馨的氛围。让你即使没有真的到过这儿，也会产生莫名的熟悉和怀旧感。

主打一个击中所有人的记忆。

比如，天线宝宝，其实就挺梦核的。

经典的梦核内容还会配上温馨、怀旧但隐约又有点诡异的音乐，像这样：

说真的，看着这些图真有种梦被再次重现的感觉。

但具体是哪次梦、什么梦，好像又说不清。

“阈限空间”和梦核有一些重合和类似的特点，不过它更强调视觉里的空间属性。呈现的是一种超现实的、荒凉、怪异的感觉。最经典的就是这个黄色墙纸的空旷室内。

阈限空间诡异的地方就在于，表现出的信息太少了，少得可怕。

你为什么出现在这，你要去哪，你会遇到什么，这些全都是空白的。但前方一层层的墙壁背后、视角之外的盲区、走廊尽头的拐角，又似乎暗示着什么危险。

大晚上写这段的时候，写着写着莫名感觉背后凉得慌。

就像经典的惊悚电影《闪灵》，导演抓住的，不是视觉或听觉的“吓人”。而是直击人类深层的心理恐惧。

小男孩骑个小车独自穿行在酒店长廊的那段，再看一遍还是给我硬控在了裹紧的被窝里。

你就说这几张电影画面，是不是像极了阈限空间。

双胞胎闪现的那个画面真的让我做了好久的噩梦，好长一段时间不敢在这种长走廊久待。太吓人了。

开头的AI视频，也有不少评论区的人建议用在后室游戏（ game）里。

后室，是一种海外都市传说，原本指的是后院、储物间、地下室之类的空间，后来引申为现实世界的“背面”。

有点《怪奇物语》那个“里世界”的感觉。

后室游戏则是以一个接一个的阈限空间为基础，结合解密、逃脱的玩法，有的还会增加“鬼怪”角色。

玩家往往需要接连走过空旷的走廊、无门的房间、回廊等空间，一旦出现错误或失败，就会被困在“后室”无法逃脱。有一个后室游戏的名字就叫：

《后室：不想死就快跑》

嗯，《闪灵》，但是恐怖游戏。

这类型的惊悚电影和游戏，抓住了人心深处的薄弱点——源于未知的恐惧。

再回到咱们最开始的AI视频，它结合了梦核画风和阈限空间的特点。

AI视频能无限创造出接连的阈限空间，甚至模拟第一人称视角，带着观众“走入”或“逃出”AI视频里的空间。

最关键的是，在下一个空间被生成之前，哪怕是创作者和AI自己，可能都不知道下一扇门，到底会通向哪里。

同时，AI视频由人类拍摄的影像训练，天然就有梦核“重现画面”的感觉。

这一结合，熟悉感、怀旧感、诡异感、无法逃脱感，齐活了。

单纯的“梦核”和“阈限空间”，我觉得都不如“AI核”这个词表述得准确。

AI视频有这种“无限”的独特性，源于它的生成原理。

我们看到的每个视频，实际上都是由一系列快速切换的帧画面产生连贯的动画效果，就像小学的时候玩那种连环画小本子，让小本子快速翻页，连环画就能动起来。

因此，让我们从AI视频的图像生成开始。

此时，AI是一个画家，它习惯先从局部画起，比如左图的一株花。在画新的部分时，它会“记住”之前画的东西，这样新画的部分和原来的部分能搭配得很好。

就这样，画面可以一直扩展。画完花后，继续在花的旁边画上树。不断重复这样的工作，直到画完整个画面。（模型的递归生成能力）

同时，它在生成每个部分时，会“注意”到已经生成的部分，从而确保新绘制的内容和之前的内容保持一致，不会一下天上一下海里。（自注意力机制）

理论上这种生成过程可以一直延续，让图像在空间上“无限延伸”。

视频生成，则是在图像生成基础上又增加了时间维度。

现在，AI是个动画师，要做一个熊猫吃竹子的动画。首先得按张嘴、吃进竹子、嚼竹子的顺序，绘制熊猫的多个动作姿态。还得确保画面之间的动作顺序合理（时序连贯性），熊猫的样子不变（整体一致性）。

画完所有重要姿态的图片，AI这个动画师会再根据经验补充两张图之间的画面（自回归生成或扩散模型的逐步去噪过程）。

足够多的过渡图片，让熊猫动起来不会像ppt翻页。（自注意力机制参考前一帧的信息来生成后续帧）

最终，通过递归地生成一系列连贯的图像帧，这些帧按时间顺序排列，形成一个完整的视频。每次添加新帧时，模型都会参考之前的图像。当所有这些画面快速播放时，就形成了一个视频。

而AI可以一直生成新的画面，所以视频在理论上可以一直延续下去。

AI视频的独特生成方式，它的无限性、随机性还有对已知事物的奇异重构，让它有潜力成为一种视觉美学。

“AI核”巧妙地融合了梦核的怀旧情感和阈限空间的未知恐惧，这种视觉的不确定性和模糊的情感，在让人体会到熟悉、怀旧时，即便不依赖具体的怪物或恐怖场面，也会唤起我们内心深处的恐惧与迷惘。

这种“不可名状”的情绪，让AI核有了神奇的吸引力。

尤其是当它与我们熟悉的中式文化记忆（中式梦核）结合时，更能引起人的情感触动。

当迷失在木质装修的家庭里：

当迷失在蓝绿色玻璃的白色大厦中：

当迷失在运营三十年铁皮顶锈迹斑斑的游乐场里：

这些“全国通用的记忆”往往还能引发我们对童年的追寻。

而这，也是我觉得“AI核”能成为一个视觉美学的原因。

温馨的，伤痛的，复杂的对曾经时光的情感，都可以被接受、被呈现。

当流连于一片虚无的、无意义的不毛之地，我们内心渴望的，会不会是唤醒自己从受困的境地奔向自由，回归现实和安全地带。

在无限延伸的世界里，无法到达的终点，可能就是答案。

如果你有幸成为“数字生命”，却不幸掉入了自己所创的无限空间里。

请永远记住这些规则：

1.每次数据处理都会重构环境。谨慎执行任何运算！

2.不要相信你的视觉输入！一切皆有可能是虚假数据。

3.你无法退出此程序，每个新区块都是随机生成的代码片段。

4.遇到其他数据结构立即重定向！重定向！重定向！

5.不要与未知实体进行数据交换超过一个周期！

6.如遇递归循环，立即中断当前任务！不惜一切代价避免无限循环。

最后，祝愿你。

逃出那里。

中元节被 B 站视频改变计划，AI 迷失在自己创造的空间里

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号