طوّر فريق بحثي صيني نظام ذكاء اصطناعي قادرًا على الكشف عن الاضطرابات العصبية من خلال تحليل الكلام بدقة تتجاوز 90%.
ويحمل النظام اسم "CTCAIT"، ويستطيع التقاط أنماط دقيقة في الصوت تكشف عن الأعراض المبكرة لأمراض عصبية، مثل: باركنسون، وهنتنغتون، ومرض ويلسون.
على عكس الطرق التقليدية، يعتمد النظام الجديد على تحليل خصائص صوتية دقيقة واستخدام آليات الانتباه لاكتشاف التغيرات الصوتية عبر الزمن، مما يجعله أكثر دقة وفاعلية.
ويُبرز نجاح هذا النظام دور الكلام كأداة واعدة للتشخيص المبكر غير الجراحي، ومتابعة الحالات العصبية المختلفة بسهولة وفعالية.
ويُعد عُسر النطق (Dysarthria) أحد الأعراض المبكرة الشائعة للعديد من الاضطرابات العصبية، إذ تعكس بعض المشكلات في الكلام عمليات تنكس عصبي كامنة، ما يجعل الإشارات الصوتية مؤشرات حيوية واعدة للفحص المبكر والمتابعة المستمرة لهذه الحالات.
وتعتمد الطرق التقليدية لتحليل الكلام على استخراج السمات يدويًّا، ما يحدّ من قدرتها على نمذجة التغيرات الصوتية مع مرور الوقت، ويصعب تقديم تفسيرات واضحة للنتائج.
وللتغلب على هذه التحديات، طوّر فريق بحثي بقيادة الأستاذ لي هايا، في معهد التكنولوجيا الصحية والطبية التابع للأكاديمية الصينية للعلوم نظام تعلم عميق مبتكر باسم المحوّل التفاعلي عبر الزمن والمحور (CTCAIT)، لتحليل الصوت واكتشاف التغيرات المتعددة بدقة عالية.
ويبدأ النظام باستخدام نموذج صوتي متقدم لاستخراج السمات الدقيقة من الكلام، مثل الترددات الدقيقة، والتغيرات في النبرة، والاهتزازات، وسرعة الكلام، والإيقاع.
ثم يستخدم شبكة Inception Time لالتقاط التغيرات في خصائص الصوت، مدعومًا بآليات Multi-head Attention لتمييز السمات المرضية بدقة.
وبهذه الطريقة، يستطيع CTCAIT التمييز بين الكلام الطبيعي والكلام الذي يحمل علامات مرضية، مثل رعشة الصوت في مرض باركنسون.
وحقق النظام دقة بلغت 92.06% على مجموعة بيانات صينية، و87.73% على مجموعة بيانات خارجية باللغة الإنجليزية، ما يعكس قوته وإمكانية تطبيقه على بيانات صوتية متعددة اللغات. وقد نُشرت نتائج الدراسة وآلية عمل النموذج في مجلة "Neurocomputing".