الحزمة الثالثة التي أطلقت هي حزمة اللغة العربية. اللغة العربية هي خامس أكثر لغة انتشارًا في العالم، فهي اللغة الرسمية في عشرين دولة، وكذلك فهي اللغة الرسمية المشتركة في ست دول أخرى. كما أنها اللغة الأولى لأكثر من 280 مليون متحدث، واللغة الثانية لعدد 250 مليون آخرين. بالإضافة لذلك، يوجد العديد من ملايين المسلمين ممن يعيشون في دول أخرى لديهم معرفة باللغة العربية لأسباب دينية.
ومن أكثر خصائصها تميزًا، انها تستخدم نظامها الخاص في الكتابة، حيث يبدأ النص من اليمين لليسار وتتصل الأحرف سويًا داخل الكلمة. بهذه الطريقة يمكن للحرف الواحد أن يأتي في 4 أشكال مختلفة. ومن المثير للاهتمام أيضًا عدم وجود حروف كبرى “Captial” في اللغة العربية. وبسبب أن الأسماء الشائعة يمكن الخلط بينها وبين الأسماء الصحيحة، فإن الأخيرة تكتب في الغالب بين قوسين أو علامتي تنصيص.
تقدم “مينينج كلاود” (MeaningCloud) الآن تغطيتها للغة العربية التي توفر الوظائف التالية:
- استخراج الموضوعات: يغطي الكشف عن الكيانات وكذلك جزئيًا التعبيرات الخاصة بالزمن
- تجميع النصوص: تغطية شاملة
ستمدد هذه التغطية في الإصدارات اللاحقة للمنتج اعتمادًا على متطلبات السوق. يمكنكم الحصول على مزيد من التفاصيل عبر صفحتنا الجديدة صفحة التغطية اللغوية.
إذًا، ما هذه المهام الخاصة بتحليل النصوص، وما استخداماتها؟
Continuar leyendo