超神経質で
ウォータールー大学のバイ・リーという中国人男性は、「独身から抜け出す方法を見つけるためにMLでロジスティック回帰法を使用する方法」に関する彼の魔法の操作をMediumで共有しました。
このような実践的な技術を習得するには、学ばなければなりません。
ウォータールー大学はカナダでも有名な大学で、特に数学やコンピュータサイエンスなどの工学系科目の教育レベルは世界トップクラスにあります。専攻、2017 usnews世界大学ランキングで18位にランクされました。
ウォータールー大学は他の理工系の学校と同様に、男女比が非常に不均衡であることに加えて、社会的な活動が不足しており、パートナーを見つけるのが困難です。
愛は数値化できないと考える人もいますが、必要なのは「自分らしく、自然の成り行きに任せる」ことだけです。
しかし、ウォータールー大学のデータサイエンティストとして、私は異なる意見を持っています。彼はコンピュータに携わっていたので、機械学習を活用して恋人探しをしてみませんか?
女の子といちゃいちゃするための方法論:自分自身を武装させる
興奮よりも行動のほうが悪いので、私はすぐに機械学習テクノロジーを使用して女性のチケットを見つける方法の研究を開始しました。
この研究の中心的な疑問は次のとおりです。
多くの男子の中で目立って女子に好かれるには、どんな特質を持っていると思いますか?
弟どのような仮説がデータによって裏付けられるのか、男子の特徴や属性を列挙してみました。
デート
(ターゲット変数)
彼女がいる、または過去 5 年以内に少なくとも半年以上付き合っている彼女がいる。
国籍
留学生
選考科目
CS、SE、ECE メジャー
原因
学業的に成功し、
高収入のインターンシップを見つけた
面白い
彼は雄弁で、いつも面白い話題を見つけることができます。
社交性
社交的な性格で、常に新しい友達と出会いたがっている
自信
彼は雄弁で、いつも面白い話題を見つけることができます。
ファッション
外見にも気を配り、上品に着こなす
カナダ
基本的に過去5年間カナダに住んでいた
アジア人
東アジアから
このような場合、基準が満たされるかどうかに応じて 1 または 0 の値を割り当てます。そこで、私たちは人々の上記の属性と物体を見つける能力との関係を測定しています。
たとえば、上記の属性の一部は非常に主観的なものです。その人が興味深い人であることをどのように証明しますか?したがって、超本格的で厳密な統計調査を見たい場合は、以下の内容は適さないかもしれません。
データを収集するために、私が思いつくすべての人を表にリストし、各属性について 0 または 1 のスコアを付けました。最終的に、データセットには N=70 行が含まれます。過去 2 年間に私と一緒に学校に通い、私と知り合った人は、おそらくこのフォームに属しているでしょう。
注文の理由を注意深く分析する
まず、正確確率法 (フィッシャーの正確検定) を使用して対象の年代測定変数とすべての説明変数を分析したところ、次の 3 つの変数が最も重大な影響を与えていることがわかりました。
-
フィットネス:定期的にジムに行ったり運動したりする人は、ガールフレンドがいる可能性が 2 倍以上です (P 値 = 0.02)
-
眼鏡:70% メガネをかけない人はメガネをかけている人よりもガールフレンドがいる可能性が高い (P 値 = 0.08)
-
自信:自信がある人は友達がいる可能性が高い (P 値 = 0.09)
弟は、メガネをかけることがこれほど大きな影響を与えることに驚き、メガネをかけていると一般的に「オタク」という印象を与えるからではないかと興味を持った。
そこで弟がいくつかの情報を調べてみたところ、これが実際にあることが分かりました。ある研究論文によると、男性でも女性でも、ほとんどの人がメガネをかけると魅力が下がると考えられています。
一部の変数は年代測定の成功をより予測しやすい可能性がありますが、サンプル サイズが小さいため判断するのは困難です。
-
留学生はカナダ人学生よりデートの成功率が高い
-
アジア人は他の人種に比べてデートの機会が少ない
他の要因を見ると、女子は少ないものの、残りの変数 (身長/キャリア/興味深さ/社交性/ファッション/居住地) はデートの成功にあまり関係がないようです。すべて デートは、関係を確認するための最初のステップにすぎません。
この実験の完全な結果:
次に、変数間の関係を調べます。これは、誤ったモデルの仮定を特定するのに役立ちます。
赤は正の相関を示し、青は負の相関を示します
統計的有意性が 0.1 未満の相関のみが表示されるため、変数間の関係のほとんどは空白になります。
写真からもわかる気がする{ガールフレンドがいる、自信があるように見える、ジムに通っている、眼鏡をかけない}相互関係があります。このデータを使用してトレーニングされたモデルには、これらのバイアスも反映される予定です。将来的には、調査範囲を拡大し、より多くのデータを収集する予定です。
ロジスティック回帰を使用して女性票の発見を予測する
女性のチケットを見つける可能性を予測できるアルゴリズムがあったら素敵だと思いませんか?
弟は、ロジスティック回帰一般化線形モデルをトレーニングして、上に挙げた説明変数に基づいて女性の投票があるかどうかを予測しました。
R の glmnet パッケージと caret パッケージを使用して、この一般化線形モデルを弾性ネットワーク正則化でトレーニングしました。次に、標準のグリッド検索方法を使用し、各反復でリーブ ワン アウト相互検証を使用し、カッパ係数を最適化して、ハイパーパラメーターを最適化しました。
最終結論
最終モデルの相互検証 ROC AUC スコアは 0.673 で、このモデルは女性のチケットを見つける確率を予測する上で、感情に基づいて推測するよりも信頼性が高いことを意味します。
もちろん、人生には偶発的な不確実性が常にあり、人生には驚きもあります。さて、もう話はやめましょう。弟はジムに行くので、メガネを外すために一生懸命働かなければなりません。
Bai Liの弟の最近の写真を提示
イースターエッグ: 私の弟は今どうしていますか?
原作者の Bai Li 氏は、今年 4 月にこの研究を完了し、Medium に記事を公開し、好評を博しました。彼の GitHub を通じて私のプロジェクトについて詳しく知ることができます。
公式アカウントをフォローして「一匹の犬」とリプライすると、
弟の GitHub アドレスを取得できます
この記事が公開されてからほぼ 4 か月が経ちましたが、弟の様子はどうですか? 私たちは、実際にそれを体験するために、存在しない Web サイト (Facebook とも呼ばれます) を通じて弟に連絡を取りました。