言葉を見るのは顔のようなもの: AI はすぐにエージェントに変身する必要がある

6 年前

情報

Sparanoid

特色图像

超神経質で

刑事事件を扱った映画やドラマでは、現場に残された筆跡からその人の身元や年齢、精神性などを鑑定する「筆跡鑑定士」がよく登場します。

現在では、AI 手段を通じて筆者の国籍と身元を直接判断できるため、さらなる調査や証拠収集の作業が不要になります。

1980年代、いわゆるナチスのコレクターが60部の「ヒトラーの日記」をドイツの出版社に持ち込んだ。

出版社は日記の購入に230万ドルを費やし、多くの外国の新聞に再版権を販売した。

その中で、「タイムズ」紙は、ヒトラーの原稿のコピーをサンプルとして使用してメモの鑑定を行うよう多くの専門家を招待しました。専門家は、それが真実であると結論付けました。これはヒトラーの直筆だ!

言葉を見るのは顔のようなもの: AI はすぐにエージェントに変身する必要がある

しかし、その後の紫外線試験により、この日記セットの紙には特別な成分が含まれており、実際には 1954 年にのみ使用されたことが判明しました。

この日記一式は間違いなく偽造であるが、筆跡鑑定に関する専門家の結果も間違っているのだろうか?

実際、最終的な調査では、比較に使用された実際のデータセットがいわゆる「原稿」であるためであることが判明しました。実はそれもあの嘘つきコレクターが捏造したものでした。

手書きの識別は重要です

手書きは、その人の独特の書き方の習慣を反映する特別な痕跡です。手書き識別は、メモの 2 つ以上の部分を比較および識別して、それらが同じ人によって書かれたかどうかを判断することに基づいています。

筆跡鑑定は、美術品、契約書、遺言書などを巡る紛争の解決にもよく利用されます。AIを活用して、国籍を確認する筆跡鑑定を直接行うことが可能になりました。

現在は 5 か国のみを対象としています

このアルゴリズムを通じて、AI は人の手書きの英語テキストを分析して、その人の国籍を判断することができます。

現在この技術で判断できるのは、参加者の国籍がマレーシア、イラン、中国、バングラデシュ、インドの5カ国に属するかどうかだけだ。

研究者らはこれらの国の100人を実験被験者として選び、機械学習用のデータセットとして500行の英語論文を手書きするよう依頼した。

言葉を見るのは顔のようなもの: AI はすぐにエージェントに変身する必要がある

「Cloud Of Line Distribution(ラインディストリビューションクラウドと訳され、COLDと呼ばれます)」というツールを通じて、研究者は各文字を線に分解し、その線がどの程度真っ直ぐか曲がっているかを測定することで国籍を判断することができます。

実験により、COLD が機械学習アルゴリズムとよく互換性があることが証明されました。これは国籍を判定する既存のほとんどの方法よりも効果的であり、一部の国では予測精度が 2 倍以上に向上しました。

さまざまな国の書き方の習慣が、COLD が国籍を判断する能力の鍵となります。

例えば中国人は手書きの際に四角い文字を書くことに慣れており、より直線を使って英語の文字を書きますが、インド人は曲線で書くことに慣れているため、文字を綴る際に曲線の部分が多くなります。

言葉を見るのは顔のようなもの: AI はすぐにエージェントに変身する必要がある

COLDはどのように機能しますか?

COLD は、テキスト分析に特化したツールであり、筆跡分析への応用に加えて、ビデオやナンバー プレート画像などの分野での任意のテキスト検出にも広く使用されています。

この方法では、テキストの特徴を分析し、ランダム フォレストに基づいてテキストを分類し、対応する極座標ドメインに密な点を生成できます。

これらのポイントはランダムに分布しているのではなく、最も類似性が高い国に限りなく近いものです。したがって、キャラクターの分布が変化すると、データが十分に豊富である限り、SVM (サポート ベクター マシン) を通じて結論を簡単に導き出すことができます。

AI分析の結果はまだ完全には信頼できません

以前は、おそらくその適用シナリオが決まっていなかったため、筆跡分析に関する研究はほとんどありませんでした。

しかし、中国、インド、マレーシアの研究者らは、この技術は警察の犯罪捜査に有益であり、通常の画像認識技術よりも効果的であると考えている。

言葉を見るのは顔のようなもの: AI はすぐにエージェントに変身する必要がある

従来の法医学的手法

実際、警察はすでに多くの捜査分野で生体認証技術を使用しており、顔認識は最も一般的に使用されている方法の 1 つです。手書き認識の登場も、このテクノロジーをある程度強力に補完するものになるでしょう。

ただし、この技術はまだ実験段階にあり、実際のシナリオに導入できるかどうかはまだ検討されていません。

ほとんどの生体認証技術と同様に、手書き認識は、この技術または類似の技術によって引き起こされるプライバシーまたは公民権の懸念の一部に直面しています。

さらに、機械学習に使用されるデータがバイアスによって誤った判断を行わないようにする方法も、解決すべき緊急の課題です。