PsychAdapter:让AI生成具有真实人格特征的文本

网易专栏8小时前发布 nxnqh
1 0 0

🤖 AI总结

主题

PsychAdapter:将个体人格特征注入大语言模型的技术突破及其应用前景

摘要

PsychAdapter技术通过将心理评分指标嵌入语言模型,实现AI生成具个体差异的文本,准确率高,并有望推动心理咨询和个性化教育应用,但需注意伦理标注。

关键信息

  • 1 PsychAdapter通过嵌入心理评分指标,使AI生成具有特定人格特征的文本,人格匹配准确率达87%。
  • 2 该技术可应用于心理咨询师培训、个性化教育材料生成等场景。
  • 3 研究强调生成内容需标注AI来源,防止滥用。

PsychAdapter:让AI生成具有真实人格特征的文本

当前的大语言模型是基于数百万名作者的海量文字数据训练而成的。然而,这也导致ChatGPT等大语言模型趋向于输出一种单一、温和、略带正面情绪的语言风格,抹平了不同人类写作者之间的个体差异。用户所感受到的,是一种千篇一律的输出风格——仿佛是”无人之语”。

如今,一组由心理学家和计算机科学家组成的研究团队找到了一种方法,能够将个体特征重新注入大语言模型,并对”谁”在生成语言实现细粒度控制。这一突破将有望推动AI模拟患者用于心理咨询师培训、个性化教育材料生成等多种应用场景的落地。

相关研究成果发表于学术期刊《npj Artificial Intelligence》,论文介绍了PsychAdapter——一种对标准语言模型进行的小幅改造方案。PsychAdapter将一组连续的心理评分指标(如性别、年龄、大五人格、抑郁程度、生活满意度等)作为直接输入,引导模型生成能够反映这些维度上任意取值组合的文本。经专家评分验证,在人格特征维度上的匹配准确率达87%,在心理健康维度上更高达97%。

借助PsychAdapter,AI生成的文本中可以重新体现出人类的个体差异。例如,将外向性设置为+1.7、抑郁程度设置为+3、年龄设置为年轻,模型便会生成符合该心理画像的语言——这并非像”外向型人格”那样可以通过提示词触发的固定类别,而是一个横跨多个维度的连续人格剖面。这种精细化的自由度,是仅靠提示词难以实现的。并且,模型所生成的语言扎根于真实的人类语言数据,而非大语言模型对”外向者语言风格”的主观推测。

“这是一项沿承已久的传统在新时代的推进——从最早的心理学家到大数据时代,过去半个世纪里,心理学一直致力于通过分析语言来理解人格。现在,我们不仅能分析语言来理解人格,还能为特定人格生成对应语言了。”论文共同通讯作者、斯坦福大学以人为本AI研究院教师研究员Johannes C. Eichstaedt表示。

PsychAdapter的出现,补足了AI在心理学应用中长期缺失的一块拼图。借助更为真实的人格模拟能力,AI可以生成针对特定症状剖面校准的模拟患者,用于培训危机热线工作人员和临床医生,而无需真实患者参与。临床和教育材料也可以根据读者的年龄和阅读水平进行个性化定制。社会科学家还可以构建数字化群体——即具备多样人格与人口特征的模拟人群——在对真实人群开展试验之前,先行测试相关理念或项目的可行性。

“语言模型如今已广泛应用于ChatGPT、Claude等产品背后,但从根本上来说,它们在统计层面忽略了一个事实:每个人的说话方式各不相同。PsychAdapter正是针对这一问题而提出的,有助于在区分人与人差异的多个心理维度上生成更具个性化的语言。”共同通讯作者、范德比尔特大学互联计算学院计算机科学与心理学副教授H. Andrew Schwartz说道。

不同的提示词能够使人格差异更加凸显。例如,”我喜欢……”这一句式能很好地体现当前激活的人格剖面——高外向性者会提及聚会和朋友,而内向者则倾向于提及阅读或游戏。

“这种对多维度的同步控制,也让我们得以模拟更复杂的心理特征。例如,通过将高外向性与低宜人性相结合,我们可以模拟出在社交场合具有支配性的人格特征。”论文第一作者、曾就职于石溪大学的Huy Vu表示。

PsychAdapter的训练数据涵盖约50万条推文和70万篇公开博客文章。每篇内容均使用现有机器学习模型对外向性、抑郁程度、年龄等特征进行评分——这些模型是通过问卷调查确定用户特征、再结合语言分析构建而成的。这一步骤至关重要:特征与语言之间的对应规律,并非来源于大语言模型本身,而是从通过调查问卷收集的独立训练数据中提取得出的。最终形成的训练集中,每段文本均与相应的心理剖面一一对应。机器学习模型由此学会了抑郁语言与满足感语言之间的差异,以及内向者与外向者写作风格的不同之处。

研究团队随后对大语言模型的架构进行了改造——Google的Gemma3、Meta的Llama3、OpenAI的GPT2等任意开放权重模型均可适配。团队将心理评分直接嵌入模型的处理层,以数值形式接收特征输入,并在神经网络的每个节点对语言输出施加影响,从而在生成过程中强制贯彻目标人格设定。输入外向性=+3、神经质=-2、年龄=+1,模型输出便会体现出这一组合特征。

当然,以这种方式提升AI模型的心理模拟能力,也带来了相应的伦理问题。”任何针对特定受众或心理剖面生成的内容,都必须明确标注为AI生成,这一点至关重要。”Eichstaedt表示,”同一工具既可用于培训危机干预顾问或推动个性化教育,也可能被用于精准定向营销和舆论操控。”

研究团队已将源代码和训练模型发布至GitHub,供学术研究使用。

PsychAdapter由计算机科学与心理学领域的跨学科团队共同开发。第一作者Huy Vu与共同作者Huy Anh Nguyen来自石溪大学计算机科学系;共同通讯作者Johannes C. Eichstaedt担任斯坦福大学文理学院心理学助理教授、斯坦福大学以人为本AI研究院Shriram教师研究员及欧洲工商管理学院决策科学访问助理教授;共同通讯作者H. Andrew Schwartz及Adithya V. Ganesan、Swanie Juhng、Oscar N. E. Kjell均来自范德比尔特大学互联计算学院;其他作者还包括Joao Sedoc(纽约大学斯特恩商学院)、Margaret L. Kern(墨尔本大学福祉科学中心)、Ryan L. Boyd(德克萨斯大学达拉斯分校心理学系)和Lyle Ungar(宾夕法尼亚大学计算机与信息科学系)。

Q&A

Q1:PsychAdapter是什么?它能解决什么问题?

A:PsychAdapter是一种对标准语言模型进行小幅改造的方案,发表于学术期刊《npj Artificial Intelligence》。它通过将性别、年龄、大五人格、抑郁程度、生活满意度等连续心理评分指标直接嵌入模型处理层,使大语言模型能够生成反映特定人格特征的文本。它解决的核心问题是:现有大语言模型趋于输出单一风格的语言,缺乏对个体差异的体现。

Q2:PsychAdapter的训练数据来自哪里?准确率如何?

A:PsychAdapter的训练数据包含约50万条推文和70万篇公开博客文章。每篇内容均通过现有机器学习模型进行人格特征评分,这些评分来源于真实用户的问卷调查数据,而非依赖大语言模型的自我推断。经专家评分验证,PsychAdapter在人格特征维度上的匹配准确率达87%,在心理健康维度上达97%。

Q3:PsychAdapter有哪些应用场景?使用时需要注意什么?

A:PsychAdapter可应用于多个场景:模拟特定症状剖面的AI患者以培训心理咨询师和临床医生;根据读者年龄与阅读水平个性化定制教育材料;构建具有多样人格特征的数字化模拟群体用于社会科学研究。但研究团队也指出,生成内容须明确标注为AI生成,以防该技术被滥用于精准定向营销或舆论操控等目的。

© 版权声明

相关文章