12月19日,《自然-计算科学》发表的一项研究描述了一种机器学习方法,能够从不同方面准确预测人类生活,包括早死可能性和个性的细微差异。该模型或许能提供对人类行为的量化认知。
社会科学家对人类生活是否能被预测的问题看法不一。虽然我们对在人类生活中起到重要作用的社会人口学因素已有充分了解,但一直无法对生命结局进行准确预测。
丹麦技术大学的Sune Lehmann和同事利用丹麦一个国家登记处约600万人的教育、健康、收入、职业和其他生活事件数据,设计了一个机器学习方法,用来构建个体的人类生活轨迹。作者通过调整语言处理技术,用类似模型中语言的方式表示人类生活。他们的这种方法能以类似语言模型捕捉词语间复杂关系的方式生成一个生活事件的术语表。
研究人员提出的模型名为life2vec,能确定健康相关诊断、居住地、收入水平等概念之间的复杂关系,并用一个压缩向量编码个人生活,以此作为预测生活结局的基础。他们证明,该模型预测早死率和捕捉细微个性差异的能力超过了当下先进的模型和基线标准,其表现至少提升11%。其中早死率是指35-65岁的个体自2016年1月1日起存活4年的概率。
研究结果表明,通过表征社会结局和健康结局之间的复杂关联,准确预测生活结局也许是可以做到的。但作者也强调,他们的研究只是对可能性的探索,而且只应在确保个人权利受到保护的监管下才可用于现实世界。(来源:中国科学报 赵熙熙)
相关论文信息:https://doi.org/10.1038/s43588-023-00573-5