أدوات عربي “arabitools” حُزم برمجية مجانية لخدمة اللغة العربية

أدوات عربي arabitoolsأدوات عربي arabitools

عندما يتعلق الأمر بالحزم البرمجية الموجهة للمستخدم العربي أو الخاصة باللغة العربية فهي قليلةً نوعاً ما! ولهذا السبب جاءت منصة أدوات عربي (arabitools).

أدوات عربي (arabitools) هي مجموعة من الحزم البرمجية المكتوبة بلغة الجافا والخاصة باللغة العربية ومعالجة المحتوى العربي.

وهي أدوات برمجية إحصائية وتعتمد بشكل كبير على البيانات المستخدمة في تدريب الأدوات وتعتمد على خوارزميات تعلم الآلة في الكثير من أساسيات ونواه الأدوات وخاصة في تحضير البيانات والمحتوى الداعم.

وتتكون مجموعة أدوات عربي من عديد الحزم منها:

حُزمة الكلمات: وتتضمن أدوات خاصة في كل من (استخراج جذور الكلمات، إيجاد مشتقات الكلمات، التصحيح الإملائي، ولمعرفة إن كان النص المدخل عربياً أم لا).

حُزمة الأسماء: وتتضمن أدوات متخصصة في (أسماء الأشخاص باللغة العربية، وتصحيح إملائي خاص بالأسماء، اكتشاف نوع الاسم (مذكر، مؤنث، اسم عائلة)، وأداة الترجمة، وهي تضم قوائم الأسماء الشائعة في كل من فلسطين والخليج).

حُزمة الشبكات الاجتماعية: حُزمة برمجية تساعد المبرمج أو الباحث على تجميع كمية كبيرة من البيانات من الشبكات الاجتماعية باللغة العربية، وحالياً الأداة تدعم تویتر وقادرة على إرجاع ما يزيد عن ٧٠% من المحتوى العربي (حوالي ٥ مليون تویت عربي يومياً في حال بقائها مفعلة لمدة ٢٤ ساعة). والأداة تدعم اللهجات وحالياً تم تفعيل اللهجة المصرية والخلیجية، وهي تدعم تصنيف المحتوى وتحديده بناءً على كلمات مفتاحية معينة.

حُزمة أداة التصنيف: مختصة بتصنيف المحتوى العربي، ضمن تصنيفات معرفة ومدرب عليها النظام مسبقاً، وتشمل: رياضة، طب، صحة/مختبرات، الكترونيات وميكانيكية، حاسوب وتكنولوجيا، أدب وفنون، أخبار وسياسة، ديانات، إدارة واقتصاد.

حُزمة الكيانات الاسمية: أدوات خاصة في تحليل النص، واستخراج الكلمات الاسمية منه، وتشمل هذه الأداة التعرف على الأشخاص والأماكن والمؤسسات والشركات وغيرها من الكيانات الدلالية داخل النص.

ومع هذه الأدوات والحزم نجد أنها تعالج العديد من المشكلات البرمجية للمطورين والمبرمجين باللغة العربية، وتعمل على توفير المزيد من الحلول بما يخدم لغتنا الأم ومجتمع المطورين.

وما يميز أدوات عربي بشكلٍ أساسي هو سهولة الاستخدام والدمج في المشاريع البرمجية والتطبيقات المختلفة، وستقدم خدماتها لاحقاً على شكل خدمات محوسبة تعمل بشكل مستقل عن لغات البرمجة المستعملة من قبل المستخدم. كما أنها ستبقى مجانية ومتاحة دائماً للتحميل والاستخدام دون انترنت.

 

Ali Qa
الكاتبAli Qa
مهندس اتصالات، محرر ومترجم مقالات تقنية وسلاسل ومشاريع تعليمية ومقدم خدمات على منصات العمل الحر.