يقوم هذا النموذج بتحليل المشاعر باستخدام خوارزمية إحصائية تعتمد على حساب لوغاريتمات نسبة الأرجحية القائمة على نظرية الأصل الثنائي للجذور العربية.
تم تدريب النموذج باستخدام مئة ألف من المراجعات والتقييمات العربية لفنادق وأفلام وكتب ومنتجات منشورة على Kaggle
أدخل جملة معينة (تقييم على سبيل المثال):
بحجم لا يتجاوز 18 كيلوبايت للنموذج (الشيفرة البرمجية متاحة هنا)، استطعنا تحقيق نسبة إجابات صحيحة تبلغ %75 على بيانات التدريب، وكذلك %84 على مجموعة بيانات التقييمات العربية للفنادق (87% Precision و 80% Recall) بإجمالي 105698 تقييما لم يرها النموذج من قبل! لمزيد من المعلومات التقنية يمكنكم الإطلاع على النقاش التالي مع فريق ARBML والمشاركة فيه.