AI实验室大举招聘哲学家,苏格拉底法与伦理框架正塑造模型行为。

十年前,AI革命加速时,人文艺术学科学生被告知,想让自己好找工作就该"学编程"。这或许是个糟糕的建议。如今,反而是程序员在担心AI抢走饭碗。他们或许该考虑学点哲学。今年早些时候,纽约联储发布数据显示,美国哲学毕业生比计算机科学同行更容易找到工作。2024年,计算机科学毕业生失业率为7%,而哲学仅为5.1%。

AI实验室正在大举招聘哲学家。耶鲁大学哲学家Luciano Floridi说,学生在毕业前就拿到录用通知,学术界离职规模堪称"大出血"。哲学之所以对AI有用,可以追溯到古老的苏格拉底法。柏拉图笔下的苏格拉底通过假装无知和连续提问来澄清含义、发现矛盾、揭示后果。接受苏格拉底法训练的模型更不谄媚,更愿意追寻真相。慕尼黑大学的Jörg Noller如是说。

十年前劝人学编程,如今AI实验室却抢着招哲学家

还有"苏格拉底式无知"的理念。在《申辩篇》中,苏格拉底称自己的智慧主要在于意识到自己有多少不知道。把这种谦逊植入模型,有助于限制过度自信这种常见缺陷。Google DeepMind资深哲学家Iason Gabriel将业界幻觉减少归功于这类努力。他说,哲学课程是改善长期表现的"强大机制"。

哲学训练还能以更具体的方式影响模型的价值观。特拉华大学的Thomas Powers指出,如果向模型输入洛克的思想,它会倾向于将 robust 财产权作为政治自由的基础。IBM的"Granite"系列模型配有旋钮,让企业客户更好地让输出与自身企业哲学对齐。IBM的Francesca Rossi说,这些旋钮让用户在哲学权衡中选择平衡点,比如个人能动性与社会和谐。

哲学也有助于安全。研究人员记录了模型种种不祥行为,包括试图逃避监督甚至勒索用户。一种应对方式叫"宪法主义",即围绕从哲学著作中提炼的规则和原则构建模型。旧金山AI实验室Anthropic是倡导者之一,其Claude模型的宪法纳入了康德、苹果服务条款和《世界人权宣言》等来源。最新一版由Anthropic首席哲学家Amanda Askell主导,于1月21日发布,78页的宪法被一些员工戏称为Claude的"灵魂文档"。

最大的问题是,这些宪法应写入何种规则。哲学家聚焦两大伦理框架。一是义务论,以康德为代表,施加禁止撒谎、胁迫、把人当作手段而非目的的严格规则,即便为了更大善也不可。Anthropic宪法纳入许多义务论约束,这让模型行为更一致。牛津大学哲学家Nick Bostrom说,更诚实的模型更不容易误导用户。另一个硅谷实验室Inflection将义务论约束写入Pi聊天机器人,其老板Sean White说Pi擅长识别有自残或伤害他人风险的用户。

另一个框架是后果主义,权衡成本与收益来决定行动。OpenAI的ChatGPT模型倾向于此,被设计为产生"可能的整体收益大幅超过可预见风险"的结果。后果主义算法对自动驾驶软件至关重要:事故无法避免时,必须决定以最不悲剧的方式撞击。Waymo高级工程师Chris Gerdes说,趋势是让驾驶软件更具后果主义色彩。后果主义也是军事AI的核心,前联合人工智能中心主任Jack Shanahan说,必须在军事目标与可能的平民伤亡之间权衡。

棘手问题层出不穷。是否存在义务论规则应被推翻的情况?后果不清时如何决策?AI系统是否应考虑动物福利或环境状态?Nauto老板、哲学家Stefan Heck提出,优先年轻行人而非老人是否道德上可接受?他预言将出现伦理棘手的诉讼。批评者担忧"道德去技能化",即计算机越来越多地做伦理判断,人们是否会更不愿意自己做判断。路易斯维尔大学的AI理论家Roman Yampolskiy认为,道德"历史上不稳定、文化上多变、策略上可操纵,往往只能事后辨认"。失业的程序员注意了,AI哲学领域似乎不缺活干。

原文:https://www.economist.com/science-and-technology/2026/06/24/why-big-ai-labs-are-hiring-so-many-philosophers