|
|
科研人的“恋爱脑”:结婚一周年,送一篇“paper” |
|
今日主角团,是学霸也是爱神,爱科学也会科学爱:他们可以把论文(paper)作为结婚一周年的“纸婚”纪念日(paper anniversary)礼物;可以邀请伴侣一起写论文,分析为何吵架;可以将43万条聊天记录可视化;可以用数据分析解开分手心结……
结婚、吵架、热恋、分手,不同阶段的他们讲述着不同故事,为我们展开了一幅“智性恋爱脑”的爱情图鉴,完美演绎了爱科学的人爱起人来有多么可“爱”。
01 结婚:结婚一周年(paper anniversary),送你篇论文(paper)!
“原来数据科学和论文都可以如此浪漫!”
在加拿大多伦多某家儿童医院做数据分析师的杨苏亭,找到了她的“对的人”。
2013年,杨苏亭前往多伦多大学读工业工程专业,在学校里与机械工程专业的丈夫相识、相知、相恋,硕士一毕业,杨苏亭就步入了婚姻殿堂。
“2022年7月10日是我们结婚一周年纪念日,一周年又被称作paper anniversary(纸婚),我在4月的时候就在思考,能否为他准备一个与paper有关的礼物。”当时杨苏亭看到网络上有人用聊天记录进行数据分析并撰写了趣味论文,她灵机一动,决定也以聊天数据为内容,为老公写一篇研究论文,主题就是:基于自然语言分析方法,以微信聊天数据为内容的婚前婚后情感变化分析。
这对于杨苏亭来说是一个堪称完美的礼物。因为她本人很喜欢做研究、写论文,且当时她正在读博一,专业与数据分析有关,对相关知识和技能并不陌生。更重要的是,聊天数据的爬取和分析,不需要她丈夫参与,可以在送礼物前完美保持神秘和惊喜。
经过确定主题、确立研究假设、数据提取、自然语言分析、假设检验、数据可视化,以及找朋友做peer review(同行评议)等一系列工作,杨苏亭花了3个月的晚间时间,在丈夫眼皮子底下悄咪咪写好了这篇礼物论文。
婚前婚后用词的情感数值得分结果,左为婚前,右为婚后。
杨苏亭的数据分析证实了她的研究假设并得出研究结论:婚姻使我们变得更加幸福且对未来生活充满信心,“我更加坚定,选择与我老公结婚是我这一生中最重要也最正确的决定”。
她还套用了专业期刊的论文模板,乍一看仿佛是一篇正式发表的论文。
论文开头。
“纪念日前一天晚上,我让他猜这个礼物是什么,他根本猜不到!我记得刚读完摘要他就感动哭了,认真读完整篇论文后他说这是他读过的最好的paper。”两年前的事,仍旧历历在目。
杨苏亭表示自己做的事情可以用“科学的浪漫,理智与情感的表达”来形容。她坦言,自己是一个喜欢用科学的方法分析生活,并帮助自己提升生活幸福感的人。她分析过微信抢红包什么时候可以成为手气最佳;喜爱弹钢琴的她也分析过钢琴演奏与数据分析的共通之处……在杨苏亭的小红书账号中,还有很多将生活与数据分析结合的有趣有用的笔记。
杨苏亭与老公的毕业典礼合照。
她对未来生活充满希冀,畅想着结婚5年、10年纪念日为他们的感情做回溯性数据分析研究。
“马上3周年的皮革婚纪念日,寓意是与皮革相关的。我想做一个比一周年论文更有趣的数据分析作品作为礼物送给他,但是我现在不能说。”她摆了摆手又指了指楼上,压低声音认真地说,“我老公在楼上会听见,我不能让他知道……”
02 吵架:瑞典男友和我一起写“吵架论文”
选择研究自己的亲密关系,Zoi有着双重“目的”——既交了瑞典隆德大学的硕士作业,又解决了当时面临的感情问题。
Zoi本科毕业于暨南大学的翻译专业。当时,她正在研究一个在北欧很流行的交友软件。在这个软件上,她认识了现在的瑞典男友。去隆德大学读应用文化分析硕士后,他们线下见面了。尽管国家不同、文化不同,但是他们的三观却很相似,相处非常“契合”。用Zoi的话说就是,“见面一个月宛如已经认识8年了”。
如此默契包容的关系,在Zoi搬到男友家后,发生了变化。
“我们之前没有吵过架,但因为他那个房间很小,可能因为共享空间、边界感,还有一些情感被忽视的原因,我们开始吵架,非常有规律地每月爆发一次。”
Zoi觉得很恼火,但是同时也觉得很有趣,“我们七八次吵架的点一模一样,这个模式都可以复制粘贴了,太有意思了。我平时很忙,要学习、兼职、实习,工作完想和他看部纪录片,但在跟朋友打游戏的男友反应很冷淡。我又是不会立刻表达不满的那种人,积攒久了就爆发一次。”
在学校的课程中,Zoi对行动者网络理论(ANT)中的纠缠(entanglement)概念非常感兴趣,“纠缠就是说我们人类、物品和环境之间存在很多联系,它们之间的关系形成了一个网络。我一下子联想到了我们的吵架。”
当时恰逢她要交学期作业,于是决定用所学知识写一篇民族学分析论文,解决自己的吵架问题。
Zoi的研究方法是民族志,对于机器和工具的使用十分警惕,所以她只借助了数据分析软件进行编码,后续都是自己手工分析的。
“我分析的文本主要是吵架后的复盘录音转文字,因为我有写日记的习惯,文本还包括一些我随手写的日记。复盘时,我们边录音边回想当时的场景,结果刚好又产生矛盾了,体现了我们吵架原始的样子。”
Zoi表示,坐下来互相心平气和、客观又共情地讨论刚过去的冲突是特别痛苦的过程,但是男友愿意和她一起承受揭开伤疤,撒上药水的痛苦,也算是一种幸福的体验。
在论文中,他们分析了吵架原因,也提出了解决方法。“冲突持续的原因往往来自我们把自己困在冲突里,这个网络的核心无论怎么分析还是冲突。不如将网络核心适当转化为互相关心对方的需求,更加积极地参与到网络转化的过程中,建立规则、惩罚机制。比如我俩的规则之一是如果他要是没有完成工作就打游戏,要包整周的洗碗,反之亦然。”
这篇论文在班里获得了教授和同学们的好评,也拿到了班上为数不多的A。
“我们很感谢这篇论文,给了我们一个以第三人视角去看待恋爱的机会。”在写完这篇论文后,他们更了解对方的情感需求,也没有再吵过架。男友打游戏会提前报备,Zoi也不会再压抑自己的情感需求,有情绪会及时沟通。
恋爱行为改变的背后,是彼此对文化差异的尊重、理解和认同。
“我在中国,从小学到中学到大学,都是班里名列前茅的,一直对自己要求很高。他就是北欧人的典型,干什么都是慢慢悠悠的,用成都话说就是让人‘恼火’。”
如果用国内的教育体系来衡量,相比于Zoi的硕士学历,她的瑞典男友只是大学预科的水平。
最开始她也很纠结,担心学历和认知背景不匹配会产生矛盾。但是后来她意识到,用自己单一的价值观和成功观去评判和对待一个人,很自私也很功利。
“其实没有必要焦虑,我挺喜欢他们的松弛感。他们不上大学,只学一门技术,一样过得特别好。我有时太焦虑,把他当出气筒了。他只能承受我40%的消极情绪,但我把100%的都投给他了。所以通过论文分析,我也进行了反思。”
Zoi说:“我认识他以后重新思考了读书的意义。有时候读书不消化就是在借别人的思想。他不怎么读书(因有阅读障碍,一般通过与人交谈、听播客和看视频获取外界信息),但经常对这个世界、对周围发生的事进行冥想和反思,也会发现很多东西。”
“每天结束后,他都问我开不开心。他不会问我达到了多少KPI,我开心对他来说更重要。”在潜移默化间,她重新建立了对于快乐的感知,也重新思考了快乐的价值。
“这是我在北欧生活几年后认知改变最大的地方,关于亲密关系,也关于如何过好自己的人生……”
03 热恋:把43万条聊天记录可视化
今年年初,#把和男友的聊天记录可视化#话题登上了微博热搜榜,短时间内就获得了千万的阅读量。
“我们发出来没想到引发了大家的关注,有点意外,受宠若惊。”小Y的男友小C说。
小Y在小红书上发布了一篇笔记《当我把和男朋友两年半的聊天记录可视化》,呈现了情侣二人合作完成的聊天记录可视化结果。这篇笔记当晚就火出了圈,不仅在小红书上获得了将近9万的点赞,还被他人搬运到了微博、豆瓣、知乎等平台。
他们分析了认识之后27个月的数据,在没算声音和表情包等非文本数据的情况下,仅文本数据就有43万多条。也就是说,这对热恋的小情侣平均每天会互相发500余条文字消息。
小Y和小C都是东南大学的硕士研究生,学校的培养方案里没有专门教授可视化的课程,但在平时课题研究和学生设计竞赛中有过了解和学习,慢慢积累了一些相关方法。
“课程是没有教过的,这里面的研究方法我们都是自学的。”
第一步也是最重要的一步,是先把聊天数据爬取下来。他们选择的是GitHub上一个已经开发好的开源爬取聊天数据的包。因为微信有加密协议,聊天记录也涉及隐私,所以他们会有数据安全的顾虑。但这个包的好处在于可以安装到电脑上进行本地化配置,不会暴露个人隐私。
爬下来40多万条数据后,需要先进行数据清洗,把没用的语气词、连词、乱码等删掉,处理成可以分析的文本数据。
而后,需要根据想做的分析,选择相应的统计学方法和自然语言处理的文本分析方法。小Y和小C一共做了3个部分:聊天数据描述性统计与频次分布、词频分析和恋爱关键词提取,以及基于语义分析的聊天情感分析。
最后一步用到了excel、python和tableau这3种可视化工具。“之前也有人做聊天记录可视化,但是我们受关注更多些,反思了一下,可能因为我们这个图比较好玩,排版也是仿照专业期刊论文排的,讨喜。”
可视化呈现的结果很有趣。每日聊天时间分布图可以看出两个人都是夜猫子,有时凌晨三点还在聊天;从口头词分析看出了两人语言表达的差异,小Y总说“宿舍”,而小C总说“回寝”;情绪变化图能直观了解谁时常深夜失眠emo,谁又能及时提供情绪价值。比如,日均情绪变化图上显示,6点时,小Y通常情绪比较低落,情绪数值是负的,有可能是失眠了。这时候小C会安慰她,所以他的情绪数据是正向的。
小C认为,特别好玩的图是那张“月度相对热情指数图”,公式是他们两个自己创造的。
“现在不是经常会比谁给谁发的消息多吗?我们自己瞎折腾出一个公式,呈现出来这个红色的点越红越大,这一方发的消息越多。你看我经常极红,就代表我给她发了很多消息,她给我回了很少。”小C并没有任何不悦,转头看了看小Y,然后笑着解释道,“我比较嘴碎,我发的多,她发的表情包还多呢。”
43万条数据分析的背后是巨大的工作量,在问到会不会根据可视化结果改变自己的恋爱行为让关系更好时,小C说:“不需要,我们这样就很好。”
他们热烈又温和,享受当下,不张望,就像日本电影《花束般的恋爱》中的台词所说:我的最大愿望,就是和你维持现状。自然地被爱牵引,用学到的科研方法,给恋爱关系一个有趣、合理的呈现和解释,就是他们在做的事。
小Y说:“一时兴起,就觉得这事特别好。”
04 分手:找寻痕迹,解答你的离去
陈宇也做了一份情侣聊天记录可视化分析,与小Y和小C不一样的是,这份恋爱分析是他独立完成的。
他要研究分手。
陈宇是意大利米兰理工大学数字交互专业硕士。2022年夏天,在恋爱9个月后,他与女友分手了。从他的视角来看,这段关系的结束几乎是断崖式的,也因此在他心中打下了一个过不去的结。他一直有很多疑问和困惑,但也清楚地知道,经过时间与回忆的修正,现在的很多想法都是他极其主观的感受。也许,基于聊天数据可视化的结果,能更真实、理性地呈现这段关系的本来样貌。
在经过前女友同意后,他将恋爱时期9个月的聊天记录进行了可视化,还添加了交互查询功能,试图从数据和表格中,找寻分手原因的痕迹。
做完可视化之后,陈宇发现了一些以前没有意识到的东西。
“我一直以为她是更冷漠的一方,我话多一些,但是分析完之后发现,其实她讲话更多一些;我一直以为我们的感情结束很突然,但是从数据上来看这个过程很缓慢,前期聊天很多,后来有几个月进入了平缓阶段,最后越来越少。互发消息最多的一天达到了1621条,而最少的一天只发了10条。”
为了衡量双方情感热烈的程度及变化,陈宇改进并创新了计算公式和方法,制作了一个“信息回复延迟表”,这是他觉得最有意思的图表。
“我们会用一个词去形容你有多喜欢对方,那就是你是否‘秒回’。”
陈宇说,回复的延迟时间不只是简单地把两个人的对话时间相减。“有时候一个人会连续发很多条消息,回复的人也会回复很多条,需要根据语义判断哪一条是需要被回复的消息,哪一条是回复的消息。还需要考虑到,有的时候一句晚安之后就不需要回复了,所以睡觉等特殊事件前后的消息,也需要根据语义判断进行筛选和排除,不然会对时间差值计算造成极大的干扰。”
这个操作有难度,但是对于陈宇来说不算什么。早在2019年申请留学时,他就做过一个更为复杂的可视化分析——为了弄清楚雅思和托福谁更难。他说,整理数据、可视化呈现,就是他在生活中分析问题和解决问题的思路。
他计划在有空的时候,做一个以旅行攻略内容为主的地图可视化系统,因为他认为现在旅行攻略还是有点烦琐。
可视化分析后能否找到分手原因呢?陈宇回答这个问题时,沉默了一会儿,而后说道:“我之前会纠结为什么分手,她是什么时候开始不喜欢我的,但经过一番数据整理和分析之后,我觉得确切的答案不重要了。我更关注在找寻答案的过程中,我收获了哪些能力,我以后能用这些能力做什么。”
在可视化操作的过程中,如何自学方法、如何思考和设计,以及如何更好地呈现,都让他受益匪浅。
网友说他是“会数据分析的恋爱脑”,陈宇笑着回应:“我承认我是,但我怀疑所有的人都是恋爱脑,只要遇到那个对的人。”
不再纠结原因和细节,更多关注自我与提升,这段无疾而终的感情,在陈宇那里真正过去了。但他对爱情仍充满信心:“碰到合适的人要好好把握,我很认真地相信,那个‘对的人’真的会出现”。
*文中小Y、小C、Zoi为化名,图片由受访者供图
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。