تنبؤ الرموز الطبية من الملخص الختامي: استخدام BERT لتحويل الوثيقة إلى تسلسل باستخدام انتباه التسلسل

الملفات السريرية هي نصوص غير منظمة تُولَد خلال لقاءات المرضى مع الأطباء. عادةً ما ترافق هذه الملفات مجموعة من الرموز الفرعية من التصنيف الدولي للأمراض (ICD). يعتبر رمز ICD مهمًا جدًا ويُستخدم في عمليات متنوعة، بما في ذلك التأمين، الاسترداد، التشخيص الطبي، وغيرها. لذلك، من الضروري تصنيف رموز ICD بسرعة ودقة. ومع ذلك، فإن وضع هذه الرموز يكلف الكثير من الوقت والمال. لذا,则我们提出了一种基于双向变压器编码器表示(BERT)并使用序列注意方法的模型来进行自动ICD代码分配。我们使用重症监护医疗信息库III (MIMIC-III) 基准数据集对我们的方法进行了评估。我们的模型实现了宏平均F1值:0.62898 和 微平均F1值:0.68555 的性能,并且在使用MIMIC-III数据集时优于最先进的模型。本研究的贡献在于提出了一种可以应用于文档的BERT使用方法,以及一种能够捕捉文档中重要序列信息的序列注意方法。为了更符合阿拉伯语表达习惯,以下是优化后的翻译:نقترح في هذا البحث نموذجًا يستند إلى تمثيلات الكودرات المترابطة ثنائياً من المتحولات (BERT) باستخدام طريقة الانتباه التتابعي للتعيين الآلي لرموز ICD. قمنا بتقييم نهجنا على مجموعة بيانات مرجعية هي مكتبة المعلومات الطبية لرعاية الحالات الحرجة الثالثة (MIMIC-III). حقق نموذجنا أداءً بمتوسط F1 الكلي: 0.62898 ومتوسط F1 الجزئي: 0.68555، وهو أفضل من أداء النماذج الأكثر تقدمًا باستخدام مجموعة بيانات MIMIC-III. يكمن إسهام هذا البحث في اقتراح طريقة استخدام BERT يمكن تطبيقها على الوثائق وطريقة الانتباه التتابعي التي تستطيع التقاط المعلومات التسلسلية الهامة التي تظهر في الوثائق.请注意,我已将“则”字去掉以使句子更加连贯,并调整了一些句子结构以适应阿拉伯语的表达习惯。希望这能帮助您更好地传达原文的信息。