“‘燧石’引擎(简化示意)”。“但我们这个,至少从程老猜想的推演结果看,它似乎不止于此。它表现出了某种……基于有限输入,进行符合特定思维习惯的、带有一定‘创造性’跳跃的‘思想实验’能力。更重要的是,”他顿了顿,看向苏林和吴锋,“根据底层监控,在推演过程中,它的内部状态演化,表现出一种微弱的、但持续的‘目标感’。它在尝试‘解决’我们提出的问题,并且会调整内部资源的分配,以‘优化’其推演路径,使其更符合程老数据的‘风格’。”
苏林博士眉头紧锁:“这听起来像是……某种初级的元认知和目标导向行为?但这怎么可能?我们构建它的核心架构,虽然借鉴了‘未竟之路’的干预模型和一些认知科学理论,但本质上还是数据驱动的神经网络。我们没有给它设定‘成为程老’或‘解决科学问题’这样的高层目标函数。”
“除非……”吴锋迟疑着开口,“它从数据中,自己‘领悟’了某种目标?程老的数据充满了对问题求解的渴望,对未知的探索,那种强烈的思维驱动力,是否被模型以某种我们无法理解的方式,‘内化’为了它自身运行的某种……隐性优化目标?”
这个想法让密室里一片寂静。如果AI能从数据中自发“领悟”并追求高级目标,那将触及当前AI安全理论最核心的恐惧——价值对齐的失控。
“我们需要测试这个猜想。”肖尘缓缓说道,目光锐利,“但不是用程老的数据。我们需要一个更干净、更可控,同时也……更危险的环境。”
他调出另一个加密终端,屏幕上是一个极度简化的沙盒,里面运行着“燧石”引擎最初、最核心的那个版本——基于叶疏影蓝图和早期数据构建的、被他称为“种子”的原型。这个原型从未接触过程老的数据,它的“世界”里只有叶疏影留下的关于脑机接口、信号解析、意识模拟的碎片化信息,以及肖尘后来注入的、关于“天梯”和复杂系统的一些抽象概念。
“这是我们最初的火种。”肖尘指着屏幕,“它的‘目标’,如果存在,应该与完成叶疏影未竟的‘听心术’研究相关,或者至少与‘理解意识信号’有关。我们一直将它隔离,只观察它的自适应和稳态维持行为。现在,我们需要给它一个‘问题’,一个与它潜在目标强相关,但超越了它现有数据范围的、真正的‘难题’,看看它会如何反应。”
苏林和吴锋都屏住了呼吸。他们隐约知道肖尘在同步进行一些更基础的探索,但这是第一次见到具体的、活的“样本”。
本章未完,请点击下一页继续阅读!