بقلم سوبر نيرو
في أفلام التحقيقات الجنائية والمسلسلات التلفزيونية، نرى في كثير من الأحيان ظهور "خبراء التعرف على خط اليد". سيقوم هؤلاء الأشخاص بإصدار حكم أولي على هوية الشخص وعمره وعقليته بناءً على خط اليد المتروك في مكان الحادث.
والآن، أصبح من الممكن استخدام الذكاء الاصطناعي لتحديد جنسية الكاتب بشكل مباشر، وبالتالي التخلص من الحاجة إلى المزيد من أعمال التحقيق وجمع الأدلة.
في ثمانينيات القرن العشرين، جاء أحد جامعي التحف النازية إلى دار نشر ألمانية ومعه 60 نسخة من "مذكرات هتلر".
اشترى الناشر المذكرات بمبلغ 2.3 مليون دولار وباع حقوق إعادة الطباعة إلى العديد من الصحف الأجنبية.
ومن بين هؤلاء، دعت صحيفة التايمز عدداً من الخبراء لإجراء عملية التعرف على المذكرات باستخدام نسخة من مخطوطة هتلر كعينة. وخلص الخبراء إلى: إنه صحيح! هذه هي خط يد هتلر!
ومع ذلك، كشفت الاختبارات اللاحقة بالأشعة فوق البنفسجية عن وجود مكون خاص في ورق هذه المجموعة من اليوميات، والتي لم تستخدم فعليا إلا في عام 1954.
من المؤكد أن هذه المجموعة من المذكرات مزورة، فهل نتائج التعرف على خط يد الخبراء خاطئة أيضًا؟
في الواقع، لا، فقد وجد التحقيق النهائي أن السبب في ذلك هو أن مجموعات البيانات الحقيقية المستخدمة للمقارنة كانت ما يسمى بـ "المخطوطات". في الواقع، لقد تم تزويرها أيضًا من قبل هذا الجامع الاحتيالي.
التعرف على خط اليد مهم
يعتبر الخط اليدوي أثرًا خاصًا يمكن أن يعكس عادات الكتابة الفريدة لدى الشخص. التعرف على خط اليد هو عملية مقارنة وتحديد ملاحظتين أو أكثر لتحديد ما إذا كانت قد كتبها نفس الشخص.
كما يتم استخدام التعرف على خط اليد في كثير من الأحيان للتعامل مع النزاعات حول الأعمال الفنية والعقود والوصايا وما إلى ذلك.الآن، أصبح من الممكن استخدام الذكاء الاصطناعي لإجراء عملية التعرف على خط اليد بشكل مباشر لتأكيد الجنسية.
نستهدف حاليًا خمس دول فقط
من خلال هذه الخوارزمية، يمكن للذكاء الاصطناعي تحليل النص الإنجليزي المكتوب بخط اليد لشخص ما لتحديد جنسيته.
في الوقت الحالي، لا تستطيع هذه التكنولوجيا سوى تحديد ما إذا كانت جنسية المشاركين تنتمي إلى خمس دول هي ماليزيا وإيران والصين وبنغلاديش والهند.
قام الباحثون باختيار 100 شخص من هذه البلدان كمواضيع تجريبية وطلبوا منهم كتابة مقال باللغة الإنجليزية بخط اليد مكون من 500 سطر كمجموعة بيانات للتعلم الآلي.
من خلال أداة تسمى "Cloud Of Line Distribution (COLD)"،وتمكن الباحثون من تقسيم كل حرف إلى خطوط وتحديد جنسيتها عن طريق قياس مدى استقامة أو انحناء الخطوط.
وقد أظهرت التجارب أن COLD متوافق بشكل جيد مع خوارزميات التعلم الآلي. إنها أكثر فعالية من معظم الطرق الموجودة في تحديد الجنسية، كما تضاعفت دقة التنبؤ في بعض البلدان.
تشكل عادات الكتابة في البلدان المختلفة المفتاح لقدرة COLD على تحديد الجنسية.
على سبيل المثالاعتاد الصينيون على الكتابة بأحرف مربعة واستخدام خطوط أكثر استقامة عند كتابة الحروف الإنجليزية، بينما اعتاد الهنود على الكتابة بشكل منحنيات، لذلك هناك أجزاء منحنية أكثر عند كتابة الحروف.
كيف يعمل COLD؟
COLD هي أداة تستخدم خصيصًا لتحليل النصوص. بالإضافة إلى تطبيقه في تحليل خط اليد، فإنه يستخدم أيضًا على نطاق واسع للكشف عن النصوص التعسفية في مجالات مثل مقاطع الفيديو وصور لوحات الترخيص.
تستطيع هذه الطريقة تحليل ميزات النص، ثم تصنيف النص استنادًا إلى الغابات العشوائية وإنشاء نقاط كثيفة في مجال الإحداثيات القطبية المقابلة.
لا يتم توزيع هذه النقاط بشكل عشوائي، بل إنها قريبة بشكل لا نهائي من البلد الذي تشبهه أكثر. وبالتالي، فمع تغير توزيع الشخصيات، سوف يتغير التوزيع الوطني أيضاً. طالما كانت البيانات غنية بما فيه الكفاية، فمن السهل استخلاص الاستنتاجات من خلال SVM (آلة الدعم المتجه).
لا يمكن الوثوق بشكل كامل بنتائج تحليل الذكاء الاصطناعي
في السابق، نادراً ما سمعنا عن الأبحاث المتعلقة بتحليل خط اليد، ربما لأن سيناريوهات تطبيقه لم تكن محددة بعد.
ومع ذلك، يعتقد باحثون من الصين والهند وماليزيا أن هذه التقنية يمكن أن تساعد الشرطة في إجراء التحقيقات الجنائية، وأنها أكثر فعالية من تقنية التعرف على الصور العامة.
طريقة التعرف الجنائي التقليدية
في الواقع، تستخدم الشرطة التكنولوجيا الحيوية في العديد من المجالات التحقيقية، ويعد التعرف على الوجه أحد الأساليب الأكثر استخدامًا. وسوف يصبح ظهور تقنية التعرف على خط اليد، إلى حد ما، مكملاً قوياً لهذه التقنية.
ومع ذلك، فإن هذه التكنولوجيا لا تزال في مرحلة تجريبية، وما زال يتعين علينا النظر في إمكانية استخدامها في السيناريوهات الفعلية.
كما هو الحال مع معظم التقنيات الحيوية، تواجه تقنية التعرف على خط اليد بعض قضايا الخصوصية أو الحقوق المدنية التي تثيرها هذه التقنية أو التقنيات المماثلة.
علاوة على ذلك، فإن كيفية ضمان عدم اتخاذ البيانات المستخدمة في التعلم الآلي قرارات خاطئة بسبب التحيز هي أيضًا مشكلة تحتاج إلى حل عاجل.