宋仲基宋慧乔没能找到对的人,算法能帮我们找到么?

寻找能够相伴一生的灵魂伴侣是很多人的美好愿望,但现实往往残酷。为此,基于大数据,机器学习,AI 算法的婚恋网站和应用纷纷出招,它们能够帮助广大单身男女解决这个问题吗?

今天,是「分手日」吗?

早晨,微博新浪娱乐爆出宋慧乔和宋仲基声明调解离婚的消息,很多粉丝泪奔:童话般的爱情破灭了。

粉丝在朋友圈泪奔现场

据宋慧乔经纪公司韩国 UAA 声明,两人离婚原因是 「性格不合」,但真实原因到底为何仍不清楚。据不可靠猜测,可能是宋仲基并不适合宋慧乔,而是适合贾玲……

双宋离婚的事情还没来得及消化,晚上李晨范冰冰又宣布分手……

曾经有多甜,现在就多扎心

记得当初双宋 CP 刚出,在众人眼里他们是就是神仙眷侣的代名词,令多少人羡慕不已。结婚当天,媒体纷纷报道这一喜讯,还有算命先生说看两人八字是绝配。然而,短短一年半之后,却迎来这样的结局。

其实,除了这对 CP,还有很多明星也经历了甜蜜到扎心的婚姻。戴安娜王妃和查尔斯、威廉王子和灰姑娘凯特、姚晨与凌潇肃,金童玉女潘粤明与董洁等等,都是最初恩恩爱爱步入婚姻殿堂,最终却劳燕分飞令旁人唏嘘。

在普通人中间,这样的情况就更不少见了。「永远在一起」、「不离不弃」这种誓言似乎总是很容易过期。寻找相爱的人并执手终老是一道人生难题。

国内超 2 亿单身男女求脱单

从数据上看,国内单身男女的初婚年龄越来越大,在一线城市,「30 而婚已不算稀奇。

这背后的原因,一方面因为工作节奏快,压力大,没有太多的时间花在社交上;而另一方面,是因为,每个人都希望能够找到完美伴侣并白头到老,但这并不容易。

现在,国内已经有超过 2 亿的单身男女,95 后都已经开始出来相亲。

为了响应广大单身男女脱单的需求,近年来涌现出各种婚恋交友网站、App。无论是国内外,都在利用大数据、AI 算法帮单身男女匹配最适合他们的「Mr.Right」。

AI 这个虚拟媒人靠谱吗?

总的来看,目前现有的婚恋网站与应用基本分为基于用户大数据直接匹配、通过聊天机器人收集用户信息,再进行推荐以及通过面部识别功能进行匹配等类型 。

这些由数据和算法组成的「媒人」,是否靠谱呢?

  • 基于神经网络,找到更适合的人

成立于美国加州的 Banihal 公司,通过机器学习,人工智能和神经科学方面的研究来解决伴侣匹配问题。

这个社交 App 已经稳定运行了五年 

在创立 Banihal 的之前,创始人 Ishdeep Sawhney 想要结婚安定下来。但是他表示,每次见到朋友或者婚恋网站推荐的那个人,他都不能确定自己是否能和她一起度过接下来的 50~60 年。

于是,为了寻找能相伴一生的完美伴侣,他特地制定了一个长长的问题清单。因此,他总会被约会对象定义为「古怪的人」。

而这份问题清单,给了他灵感。他辞去苹果公司的工作,开始创建匹配网站 Banihal。

众多的婚恋网站都会给用户匹配年龄、职业、薪资之类硬性条件相符的对象,但是这样无法实现个性化匹配,而且并不一定兴趣相投,价值观相同。

Ishdeep Sawhney 则研究了神经科学,了解人们做决策的方式,希望从心理、精神层面进行匹配。

他创建的 Banihal 会在新用户注册时,提出 40 多个问题让用户回答,类似于心理学家亚瑟·阿隆的 「让陌生人迅速相爱的 36 个问题」,利用这些问题让用户深入了解自己和自己的偏好。用户填完比较全面的资料后,系统会为其推荐 5 个最佳匹配。

他们用神经网络打造的算法,帮助用户匹配最完美的伴侣

据介绍,Banihal 使用精确的算法,通过名为 Rae 的软件确保婚姻成功。Ishdeep Sawhney 指出, Rae 软件将研究测试提供给应用程序和网站,以改善配对过程。Rae 能够挖掘潜意识信号。它已经通过人工智能和数据进行了升级,以提供更好的用户体验。

团队由大厂工程师组成,他们来自苹果、微软

此外,Banihal 基于人工智能的软件 Rae 持续更新用户的偏好,用户交互的次数越多,基于算法的软件 Rae 就会更新这些特征,以呈现最合适的匹配。

事实上,此类系统就是与亚马逊、淘宝等购物网站类似的推荐系统利用基于机器学习的聚类算法确定趋于相似的人群。

相似性可以通过行为(例如他们购买或浏览的内容,他们如何支付,购买频率等等),或特征(例如他们的年龄,性别,位置等),或者综合这两方面来定义。然后,推荐引擎将根据某用户 XX 过去做过的事情,来预测他未来的选择,而且也会考虑其他「喜欢 XX」的人的行为这些因素。

  • 机器学习预测你的脱单概率

在滑铁卢大学,由于男女比例极不协调,缺少社交活动,所以一位数据科学家小哥哥尝试用机器学习帮自己脱单。(点击这里查看详情

他首先对决定能否找到对象的影响因素进行分析。

具备哪些属性才能在众多男生中脱颖而出,受到妹纸们的青睐?小哥哥试着列出了男生的特征属性,想找出哪些假设是可以有数据支撑。

在上面这些情况中,他按照是否符合标准会赋予 1 或 0 这两个值。所以,我们是在衡量人们的上述属性和能找到对象之间的关系。

此外,他还分析了各种落单原因,健身、眼镜和自信成为最显著的 3 个变量:

健身:定期去健身房或运动的人有女朋友的概率会高出两倍以上 (P 值=0.02)

眼镜:不戴眼镜的人有女朋友的概率比戴眼镜的人会高出 70%(P 值=0.08)

自信:有自信心的人有朋友的概率更高 (P 值=0.09)

横轴和纵轴是人的性格特征变量红色表示正相关,蓝色表示负相关

之后对这些变量之间的关系进行统计,数据显示从图中看起来 { 有女朋友,看起来自信,去健身房,不戴眼镜 }  有相互关系。

做了这些准备工作之后,小哥哥训练了一个逻辑回归广义线性模型,根据我们前文列举的这些说明变量,预测是否会有女票

借助 R 语言中的 glmnet 和 caret 包,他用弹性网络正则化训练了这个广义线性模型。然后用标准网格搜索法优化了超参数,在每次迭代中使用留一交叉验证法,并优化 kappa 系数。最终模型的交叉验证 ROC AUC 分数为 0.673。

也就是说模型在预测你找到女票的几率方面,比你凭感觉乱猜还是更靠谱些。

但是,据了解,小哥哥在发布文章介绍他的这项研究的四个月之后,还依然单身,不知道现在怎么样了……

脱单首先靠自己,不行再上 AI

据说,于茫茫人海中,遇见对的人的概率是五亿分之一,但是我们这辈子能够遇到多少人?有一部短片说,我们一生会遇到 826.35 万人,会和 39778 人打招呼,会和 3619 人熟悉,会和 275 人亲近,然而那个对的人,却不一定在这些人中。

你和对的人曾擦肩而过,还是还未相遇?

但是如果让机器来帮你寻找,就可以大大提高效率,在千万人之中,找出最合拍的那个人,可能再也不用你苦苦地「众里寻他千百度」。婚恋网站 eharmony  称,每 14 分钟就有人在上面找到真爱。

不过,话说回来了,机器真的比自己还了解自己吗?机器匹配的两个人,会擦出爱情的火花吗?据网上数据显示,婚恋网的成功率也不过 10% 左右。

虽说,AI  帮你找到对的人,可能还不靠谱,但是它会帮你避开错的人,而减少让人痛苦的恋爱经历。人工智能工具会告诉你,不要跟那个带着漂亮跑车的人约会,因为他最后只会把你甩掉。也就是说,人工智能可以帮你鉴别「渣男渣女」,避免情感损失。

所以,脱单路上,你愿意找 AI 做你的红娘吗?

点击阅读原文