יישומון לזיהוי דיכאון קליני באמצעות ניתוח קול

מחלקה: הנדסת מערכות תקשורת | סטודנטים: דביר סיידוף ואיתי רינגלר | מנחה: ד"ר דן וילנצ'יק

​על פי רוב התחזיות, בעתיד הלא רחוק, רופאים ייעזרו בבינה מלאכותית על מנת לאבחן את החולה. בהשראת חזון זה בנינו אפליקציה (בינתיים רק באנדרואיד) אשר בהינתן הקלטת קול, תציע אבחנה האם האדם המוקלט סובל מדיכאון קליני או לא. אפליקציה כזאת יכולה להיות שימושית לאנשי מקצוע ככלי עזר לאבחון המחלה ולצורך מעקב אחר מצב המטופלים.

איך זה עובד? אספנו מאגר מידע גדול שמכיל הקלטות של אנשים בדיכאון ושל אנשים שאינם בדיכאון, ובעזרת תוכנה חיצונית אשר מחלצת מאפיינים ווקאליים בדיבור, אשר רלוונטיים לגילוי רגשות, אימנו אלגוריתם למידת מכונה למשימת הבחנה בין אנשים הסובלים מדיכאון, לבין אלה שלא.

לאחר שבחנו את טיב ביצועי האלגוריתם על מאגר המידע שהיה ברשותנו, ביצענו אינטגרציה של האלגוריתם על גבי מערכת ההפעלה של אנדרואיד ובנינו אפליקציה שמאפשרת לבצע הקלטה ולקבל תוצאת חיזוי באופן מיידי.

אפליקציית זיהוי קול
תהליך הזיהוי

 ובמילים אחרות:

  • בכדי שנוכל לממש אלגוריתם לזיהוי דיכאון כאשר מושמעת הקלטה, המערכת מנתחת את קובץ הקול (WAV) ומחלצת ממנו את המאפיינים הרלוונטיים לבדיקה: תדרים, עוצמה וכיו"ב.
  • לשם חילוץ המאפיינים השתמשנו בתוכנת הקוד הפתוח OpenSmile, שמחלצת מאפיינים ווקאליים בדיבור הרלוונטיים לגילוי רגשות ולכן בחרנו בה לרוץ באפליקציה שבנינו.

 וקצת יותר על האלגוריתם לזיהוי דיכאון:דביר סיידוף ואיתי רינגלר

  • את האלגוריתם כתבנו בשפת Python. השתמשנו באלגוריתם Machine Learning בשם Random Forest. בשלב הראשון היינו צריכים ללמד את האלגוריתם: ״השמענו״ לו כמה אלפי דגימות קול של אנשים בדיכאון וכמה אלפי דגימות קול של אנשים שלא בדיכאון שקיבלנו באדיבות הכנס:

AVEC 2016 – Depression, Mood, and Emotion Recognition Workshop and Challenge

במסגרת כנס זה ביקשו להתמקד בהשוואה בין שיטות שונות של עיבוד מולטימדיה ולימוד מכונה המיועדים לבצע ניתוח אוטומטי, ויזואלי ופסיכולוגי של דיכאון ורגשות.

  • בדקנו את רמת הדיוק של האלגוריתם על ידי 10-fold-cross-validation. זו שיטה בה 'מוציאים' חלק מהדגימות של המידע בכדי שנוכל לאמן את האלגוריתם על שאר הדגימות, ולבדוק את טיב הדיוק בתחזית עבור הדגימות שהוצאנו. לאחר מכן חזרנו על התהליך עבור חלקים שונים של מאגר הדגימות כ-10 פעמים.

תודות לשיטה זו התקבלה רמת הדיוק הבאה:

RF results + AUC
תוצאות הבדיקה

 

כלומר, קיבלנו כי אחוז הדיוק של האלגוריתם הינו 98.87%.

השארת תגובה