📘 شو يعني؟

مصطلحات الذكاء الاصطناعي بالعربي

شرح مبسّط لكل مصطلح يمرّ في النشرة — بيكبر مع كل عدد.

💡 مفاهيم (200)

3D bounding boxes
يعني رسم صناديق تلاتية الأبعاد حول الأشياء في الصور والفيديوهات عشان نحدد موقعها وحجمها بدقة. بنسمع عنها كتير في الروبوتات والسيارات ذاتية القيادة والألعاب عشان تساعد على فهم الفراغ والمسافات.
3D point trajectories
احنا بننظر لمسار حركة نقطة معينة في الفضاء ثلاثي الأبعاد - يعني مثل تتبع النقط اللي بتتحرك في الهواء. هذا مهم عشان بنفهم إزاي الأشياء بتتحرك والمسارات اللي بتقطعها.
3D point trajectory
مسار حركة شي معين في فضاء ثلاثي الأبعاد، أي تسلسل نقاط بتوضح كيف تحرك الجسم من مكان لمكان، نفس ما بتتبعي حركة طير في السماء من كل الاتجاهات.
4-bit quantization
يعني احنا بنضغط على أوزان النموذج من 32 بت لـ 4 بت بس، شي زي ما تضغطي صورة بجودة أقل بس تفضل تشتغل. بنسمع عنها عشان بتخلّي النماذج أسرع وأخف، وكل واحد يقدر يشتغل معاها على جهازه بدون ما يحتاج أجهزة غالية.
action prediction
احنا بنستخدمها عشان النموذج يتوقع شو بتكون الحركة أو الإجراء الجاي بناءً على البيانات الموجودة. يعني لو شفنا فيديو لشخص بيمسك كورة، النموذج يتنبأ إنه بيرميها أو بيسيبها.
adaptive multi-granularity distillation
يعني احنا بنأخذ معلومات من نموذج كبير وذكي وبنحطّها في نموذج أصغر وأسرع، بس بطريقة ذكية بتتكيّف مع مستويات تفاصيل مختلفة - عشان الأجهزة الضعيفة تقدر تستخدم الذكاء الاصطناعي بسهولة.
adversarial robustness
يعني إشي إنو النموذج ما ينهار لما حد يحاول يلخبطه بأسئلة غريبة أو محاولات احتيال ذكية. بنسمع عنها عشان النماذج الحساسة أو اللي بتشتغل في مجالات خطيرة بدها تكون قويّة وما تنخدع براحة.
agent benchmark
مجموعة اختبارات معيّنة بنستخدمها عشان نقيّم أداء الوكلاء الذكيين (الأنظمة اللي بتقدر تاخذ قرارات وتتصرف بحالها)، نفس ما نختبر الطالب في امتحان معين.
Agent Memory
يعني نظام بيحفظ الأشياء اللي عملها أو شافها الـ agent (الذكاء الاصطناعي) عشان ما ينساها. بنسمع عنها عشان الوكلاء الذكيين لازم يكون عندهم ذاكرة عشان يتعلموا من الأخطاء والتجارب.
agentic RAG
يعني نموذج ذكاء اصطناعي ما بس بيرجع المعلومات، بل أيضاً بيقدر يتخذ قرارات ويشتغل بحرية أثناء البحث. احنا بنستخدمها عشان النتايج تكون أدق وأذكى من مجرد البحث العادي.
algorithmic transparency
إحنا بدنا نفهم كيف الخوارزمية بتشتغل وإيش الخطوات اللي بتعملها عشان توصل للنتيجة، وليس بس نقول يلا يعطينا جواب وبس.
articulated objects
الأشياء المرنة والمفصلية اللي في أجزاء متحركة متصلة ببعضها، زي الباب والدرج والكرسي - مش جسم صلب واحد بحت.
attention mechanism
آلية تركيز الذكاء الاصطناعي على أجزاء معينة من البيانات اللي مهمة، زي ما إنتِ بتركزي على كلمات معينة في الجملة. بنسمع عنها كتير لأنها السر وراء نجاح نماذج اللغة الحديثة زي ChatGPT والترجمة الآلية.
attention-level enrichment
إثراء آلية الـ attention بمعلومات إضافية تخليها أكثر وعي بالتفاصيل المهمّة في البيانات. بنسمع عنها عشان بتحسّن من دقّة النموذج في التركيز على الأجزاء اللي فعلاً تهمّ.
attribute-level
يعني بنفحص الخصائص الصغيرة والتفاصيل الدقيقة في النموذج، مش نفحصه كشي واحد كبير. مثلاً بنشوف إذا كان متحيّز في سمة معينة من السمات.
attribute-level bias
يعني التحيّز اللي بيصير على مستوى الصفات والخصائص معيّنة في البيانات، مثل لما النموذج يكون متحيّز ضد صفة معيّنة زي اللون أو الجنس. بنسمع عنها عشان بدنا نتأكد إن الذكاء الاصطناعي ما بيميّز ضد أي حدا.
autoregressive
يعني النموذج بيتنبأ بالكلمة الجاية بناءً على الكلمات اللي جاية قبلها، خطوة بخطوة. إشي زي لما تكتب رسالة والهاتف بيقترح عليك الكلمة الجاية.
autoregressive coordinate prediction
طريقة النموذج بتتنبأ بمواقع الأشياء خطوة بخطوة، يعني بتنبأ بموقع واحد وبعدين تستخدم هالموقع عشان تنبأ بالموقع اللي بعده. بنسمع عنه عشان بيستخدم في تتبع الحركة والأنظمة اللي بتحتاج دقة عالية.
autoregressive prediction
يعني بنتنبأ بالخطوة الجاية بناءً على كل الخطوات اللي قبلها، واحدة تلو التانية بالترتيب. بنسمع عنها عشان هي الطريقة الكلاسيكية في معظم نماذج اللغة والفيديو.
benchmark
يعني مجموعة معايير واختبارات بننسخدمها عشان نشيك كيف أداء النموذج تاعنا، شو مستواه الفعلي. بنسمع عنها كتير عشان هي إشي أساسي لمعرفة إذا النموذج بتاعك تمام أم لا.
brea
breakthrough
يعني إشي جديد وثوري بيغيّر اللعبة كليّاً في مجال معين. بنسمع عنه كتير في الذكاء الاصطناعي عشان كل شوي في اكتشافات جديدة بتقلب المعادلة وتخليك تقول: يا الله، هذا شيء ما فكرنا فيه قبل!
Checkpoint and Restore
يعني إنك بتخزّن حالة النموذج في نقاط معينة وبتقدر ترجع له أي وقت إذا شيء ما انعطل أو أردت تحسّن شيء. بنسمع عنها عشان بتخليك توفّر وقت ومجهود بدل ما تبدأ من البداية.
clinical information extraction
يعني استخراج المعلومات الطبية المهمة من وثائق وسجلات صحية معقدة بشكل تلقائي. بدنا إياها عشان توفر وقت الأطباء والممرضين وتقلل الأخطاء البشرية في المعلومات الطبية.
clinical NLP
هاي تطبيق معالجة اللغة الطبيعية في المستشفيات والعيادات - يعني نستخدم الذكاء الاصطناعي عشان نحلل التقارير الطبية والنتائج التشخيصية بتوع المرضى. بنسمع عنها كتير لأنها بتساعد الأطباء يشتغلوا أسرع وأدق.
code generation
يعني البرنامج الذكي اللي بقدر يكتب كود برمجي بحاله بناءً على اللي بتطلبيه منه. بنسمع عنه كتير لأنه بوفّر وقت على المبرمجين ويساعدهم في الأشياء الممّلة والروتينية.
Code-as-Policy
كتابة تعليمات البرنامج (Code) بشكل مباشر وعملي عشان يصير سياسة عمل لروبوت أو وكيل ذكي، بدل ما نعتمد على نماذج إحصائية معقّدة. بنستخدمها عشان تكون التعليمات واضحة وقابلة للتحكم أكتر والآلة تنفّذها بدقة.
coding agents
برامج ذكاء اصطناعي قادرة تكتب وتصحّح الأكواد بحالها من غير ما تحتاج مبرمج بيوجّهها طول الوقت. بنسمع عنها عشان بتحسّن من إنتاجية المبرمجين وبتسرّع عملية التطوير.
compiler optimization
هو العملية الي بندير فيها الكود عشان نخليه أسرع وأخف على الذاكرة، بدنا نعملها عشان البرامج تشتغل بكفاءة أحسن وما تضيع موارد الجهاز.
contact dynamics
يعني دراسة شو اللي بصير لما شي يلمس شي تاني، من قوى واحتكاك وحركة. بنسمع عنه لأنه ضروري عشان نفهم كيفية تفاعل الأشياء في الواقع.
Contagion Networks
شبكات بتدرس كيف الحاجات بتنتشر من شخص لشخص (أمراض، أفكار، معلومات)، عشان نفهم إزاي الأشياء بتتوسع بسرعة.
contamination
لما البيانات اللي درّسنا عليها النموذج تتسرب لداخل بيانات الاختبار، فبنحصل على نتايج مزيفة وما بتعكس الحقيقة. مشكلة خطيرة عشان بتخدعنا نحسب إن النموذج أذكى مما هو بالفعل.
contamination control
يعني بدنا نتأكد إن البيانات اللي بنستخدمها للتدريب مش ملوثة أو فيها أخطاء، عشان النموذج يتعلم بشكل صحيح ما تتلخبطش المعلومات.
contamination controls
إجراءات احنا بنسويها عشان نتأكّد إن بيانات التدريب ما فيها معلومات ملخبطة أو غلط قد تخرّب النموذج، يعني تنظيف الداتا قبل ما ندرّب فيها.
contamination-aware evaluation
طريقة لاختبار نماذج الذكاء الاصطناعي بحيث نتأكد إنه ما في بيانات تدريبية تسربت للاختبار، عشان النتايج تكون موثوقة وما نخدع نفسنا إننا عملنا حاجة أحسن ما هي.
content leakage
يعني معلومات حساسة أو بيانات خاصة تتسرب من النموذج بدون ما تقصد، مثلاً لما تسأل الذكاء الاصطناعي حاجة فيجاوبك بمعلومات كان المفروض يكون محجوب عنها. بنسمع عنها عشان مهم جداً نحمي الخصوصية والأمان في أنظمة الذكاء الاصطناعي.
content preservation
الحرص إنو الآلة تحافظ على المعلومات المهمة والمحتوى الأساسي وهيّ بتعدّل إشي زي الأسلوب أو الشكل. بنركّز عليها عشان لما نعدّل صورة أو نص ما نخسّر المعنى الأساسي اللي بدنا نحافظ عليه.
Content-addressable Memory
ذاكرة بتاعة الحاسوب لما تروح فيها بمحتوى معين بتطلعلك الحاجة مباشرة، مثل لما تتذكري حاجة برقم في دماغك.
context grounding
يعني تثبيت فهم النموذج في الواقع والسياق الفعلي حول الموضوع. مش بس يولّد كلام عام، بل بدّه يربط الإجابات بمعلومات صحيحة وموثوقة من مصادر موجودة فعلاً.
contrastive learning
طريقة تدريب بحيث النموذج بيتعلّم الفرق بين الأشياء المتشابهة والمختلفة. احنا بنقول له: هاي الإجابة صح وهاي خطأ، فبيتعلّم يميّز بينهم ويحسّن دقته.
counterspeech
إشي بتقول فيه كلام ضد خطاب كره أو إساءة، يعني الذكاء الاصطناعي بتدرّب إنه يرد على الكلام السيء بكلام بنّاء ومحترم. بنسمع عنه عشان مهم جداً في حماية الناس من التنمر أونلاين.
Cross-Agent Contagion Matrix
يعني كيف الأخطاء والمشاكل بتنتقل من وكيل ذكاء اصطناعي لتاني لما يشتغلوا سوا. احنا بنسمع عنها عشان لما يكون عندك عدة نماذج ذكاء اصطناعي شغالة مع بعضها، خطأ صغير بيقدر يزعزع العملية كلها.
cross-attention attribution
طريقة نفهم بيها شو العلاقات بين الأجزاء المختلفة في النموذج - مثلاً، كيف كلمة من النص بتأثر على جزء معين من الصورة المُولّدة. بنستخدمها عشان نعرف الذكاء الاصطناعي بيفكر كيف، وهاد مهم جداً للشفافية.
cross-attention fusion
طريقة بتجمع معلومات من مصادر مختلفة (نص وصور مثلاً) بشكل ذكي، بحيث كل جزء يركز على أهم المعلومات من الأجزاء التانية.
cross-space denoising
تقنية بتنظف وتحسن الصور أو البيانات بطريقة ذكية تجمع معلومات من مساحات مختلفة، حيلة ذكية عشان نتخلص من الأخطاء والضوضاء.
CUDA backend
إشي بيسمح لينا نشتغل العمليات الحسابية بسرعة على معالجات NVIDIA الخاصة، لأنو CPU بطيء بشكل جداً وCUDA بتسرعها بـ 100 مرة أو أكتر.
DAAM framework
إطار عمل بيساعدنا نفهم كيفية عمل نماذج التوليد الحديثة، خاصة عندما بتربط بين النصوص والصور. احنا بنستخدمه عشان نشوف بالتفصيل كيف النموذج بيقرر أي جزء من الصورة بتؤثر عليه كل كلمة من الوصف.
data contamination
يعني لما البيانات اللي تعلّمنا عليها النموذج تتكرر في بيانات الاختبار، فالنموذج بيعطيك نتايج مزيفة. مش بدنا هيدا عشان ما بتعكس الواقع الحقيقي.
data fidelity
يعني مدى دقة وصحة البيانات اللي بندخلها للنموذج - إذا البيانات صحيحة وتمثل الواقع، النموذج بيتعلم أحسن وبيعطينا نتايج موثوقة أكتر.
dataset
مجموعة بيانات كبيرة بنستخدمها عشان نعلّم أو نختبر نماذج الذكاء الاصطناعي، تخيلي إنها مكتبة كبيرة فيها ملايين الأمثلة والمعلومات.
decompilation
يعني تحويل الكود المُترجَم (البايناري) اللي بتشتغل فيه المعالجات لكود قابل للقراءة زي Python أو C. بنستخدمها عشان نفهم إشي مش عارفين شو بيعمل أو نتحقق من الأمان.
decompiler
أداة بتأخذ كود مكتوب وتحوّله من لغة معقدة لصيغة أسهل نقدر نفهمها، وبتستخدم كتير في تحليل النماذج الذكية وفهم شو بتعمل بالظبط.
dexterous hand-object interaction
يعني كيفية ما الروبوت أو نموذج ذكي يمسك ويتحكم بالأشياء بمهارة عالية، تماماً زي إيدك أنتِ. بنسمع عنه عشان هاي مسألة صعبة جداً في عالم الروبوتات والذكاء الاصطناعي.
dexterous manipulation
يعني القدرة على التعامل الدقيق والماهر مع الأشياء، مثل قبضة اليد الروبوتية اللي بتقدر تمسك الأشياء الدقيقة وتتحكم فيها بمهارة عالية.
diffusion backbone
هي العمود الفقري لأنموذج بينشر الصورة (يوسعها من ضوضاء لصورة نظيفة)، وبتشتغل كـ الأساس القوي اللي بنبني عليه باقي النموذج عشان نطلع نتايج أفضل.
diffusion models
نماذج بتشتغل بطريقة عكس الضوضاء تماماً - تبدأ من صورة عشوائية وتنضفها شوية شوية لحتى توصل لصورة حقيقية. بنسمع عنها كتير لأنها أساس أفضل أدوات توليد الصور الحديثة زي DALL-E و Stable Diffusion.
diffusion prior
إشي بنستخدمه في نماذج التوليد عشان نوجه العملية نحو نتائج معينة من الأول. يعني بدل ما نقول للنموذج وليد بشكل عشوائي، إحنا بنقوله: شوف هالمعلومات الأساسية وسِر في الاتجاه اللي نحتاجه.
diffusion-based enhancer
احنا بنستخدم نموذج الـ diffusion (اللي بتخيل صور من ضوضاء) عشان نحسّن جودة الصورة. يعني نبدأ من صورة ضعيفة وننظفها وننمّيها لصورة أحسن. بنسمع عنه كتير هلق عشان الـ diffusion models صاروا قويين جداً في تحسين الجودة.
distillation
تقنية بنأخذ فيها نموذج ذكاء اصطناعي كبير وقوي ونعلّم نموذج أصغر يحاكيه، عشان نحصل على أداء شبه نفس الشي بحجم أقلّ وسرعة أسرع.
DNOCS
يعني Dynamic Notion of Conceptual Space - نوع من الطرق بتخليك تفهم كيف النماذج بتتعلم المفاهيم بشكل ديناميكي ومش ثابت. بنسمع عنها عشان بتساعدنا نفهم أكتر كيف بتشتغل الذكاء الاصطناعي من جوة.
DPO
طريقة تدريب حديثة بدل ما نعلم النموذج على إجابات صح وخطأ بشكل منفصل، احنا بندربو يختار بين إجابتين ويفضّل الأحسن منهن مباشرة.
DVSpec
مفهوم بيساعدك تكون تحديدات ووصفات أدق، يعني بدل ما تقول عام عام، بتقول بالتفاصيل إيش اللي بدك وإيش الشروط اللي لازم تتوفر.
egocentric human video
فيديو مصور من منظور الشخص نفسه (من عينه هو)، يعني بتشوفي كل شيء زي ما هو بيشوفه من خلال يده وحركته، بدنا نستخدمها عشان نفهم الذكاء الاصطناعي أكتر عن السلوك البشري.
egocentric video
فيديو مصور من وجهة نظر الشخص نفسو (من منظور عينيه)، بدل ما تصوري الشخص من برّا، وبنستخدمها عشان نعلّم الذكاء الاصطناعي يفهم إشي من خلال وجهة نظر الإنسان الفعلية.
embodied agent
وكيل ذكي مرتبط بجسم فيزيائي حقيقي أو محاكاة (روبوت أو كائن في لعبة افتراضية)، مش بس برنامج في الكمبيوتر. بنركّز على هالمفهوم عشان نطلّع آلات ذكية تتفاعل مع العالم الحقيقي وتتعلم من تجاربها.
embodied foundation models
نماذج ذكاء اصطناعي بتفهم وتتفاعل مع العالم الفيزيائي الحقيقي - مش بتقرا نصوص بس، إنما بتتحرك وتعمل حاجات في الواقع زي الروبوتات الذكية.
evaluator bias
يعني أن المسؤول عن تقييم نموذج الذكاء الاصطناعي قد يكون عنده ميول شخصية مش عادلة بتأثر على النتايج. بدنا نركز عليها عشان التقييم العادل والنزيه هو أساس تطوير نماذج موثوقة وصحيحة.
execution-state capsules
هي وحدات صغيرة بالشبكة العصبية بتخزن معلومات مهمة عن حالة التنفيذ، تساعد النموذج يفهم السياق والعلاقات بشكل أفضل من الطرق التقليدية.
fact-checking
عملية التحقق من الحقائق والمعلومات إنها صح ولا غلط، يعني النموذج بينظر للمعلومات ويتأكد إنها مدعومة بمصادر موثوقة. بنسمع عنه عشان مش كل اللي بيقوله الذكاء الاصطناعي صح وبدنا نكون حذرين.
feature upsampling
عملية بنرجّع تصغير البيانات اللي عملناها وبنوسّعها لحجم أكبر بدون ما تفقد المعلومات المهمة، احنا بنعملها عشان بعد ما نعالج الصورة بشكل مجرّد نرجّعها لحجمها الطبيعي.
fine-tuning
تدريب إضافي لنموذج موجود بالفعل على بيانات جديدة وخاصة عشان يكون أفضل في مجال معين. يعني بدل ما نبني نموذج من الصفر، بنأخذ واحد موجود ونحسّنه. بنسمع عنه عشان بيوفر وقت وموارد كتير.
flow-matching
تقنية بدنا نطابق بيها أنماط الحركة والتدفق بين أشياء مختلفة، بدل ما نتنبأ بكل خطوة لحالها. بنسمع عنها عشان أسرع وأدق من الطرق القديمة في توليد الحركة.
further pre-training
احنا بنأخذ نموذج اتدرّب قبل كده وننضيف تدريب إضافي عليه باستخدام بيانات جديدة أو متخصصة، عشان نحسّن قدراته في مجالات معينة أو نعلّمه معلومات جديدة.
Generate-then-Orchestrate
هي طريقة بنشتغل فيها الذكاء الاصطناعي: أولاً بيعمل أفكار وحلول متعددة (Generate)، وبعدين بيختار أفضل واحد فيهم ويرتبهم بشكل ذكي (Orchestrate)، عشان نوصل لنتايج أفضل بدل ما نعتمد على حل واحد بس.
goal-conditioned forecasting
يعني بدنا نتنبأ بإيش اللي بتصير جدام، بس احنا بنقول للنموذج: شو الهدف اللي بدنا نوصل له. النموذج بعدين بيتخيل الحركات والخطوات اللي بتوصلنا للهدف ده. بنسمع عنه عشان مهم جداً في الروبوتات والألعاب والسيارات المستقلة.
goal-conditioned motion forecasting
نموذج بتنبأ بحركة الأشياء في المستقبل بناءً على هدف معين، يعني إذا قلتله الروبوت بدّه يروح لنقطة معينة، بيتنبأ بأي حركات هيعملها. بنسمع عنه عشان بتطبيقات الروبوتات والسيارات المستقلة بتحتاجه.
goal-conditioned prediction
نوع من التنبؤ بحيث بنقول للنموذج شو الهدف اللي بدنا نوصل له، وهو بيتنبأ الخطوات اللي لازم نعملها عشان نوصل لهالهدف.
hallucination
يعني النموذج بيخترع معلومات مش موجودة أصلاً وبيقدمها وكأنها حقيقية! إشي خطير لأنه الكمبيوتر بيكون واثق من إجابة غلط.
HELM
اختصار لـ Holistic Evaluation of Language Models، وهو منصة قيّمة تختبر نماذج اللغة بطريقة شاملة وموضوعية على مهام ومواقف مختلفة. بدنا هاي الأداة عشان تعطينا صورة واضحة عن قوة وضعف كل نموذج.
imitation learning
عملية بتعلّم الآلة تقليد سلوك انسان أو نموذج آخر من خلال مشاهدة أمثلة، مثل لما تتعلم طفل من أبويه، احنا بنستخدمها عشان بدنا الآلة تتعلم سريع بدون ما تجرّب كل الأخطاء.
implicit feedback
يعني احنا بنستخرج معلومات عن رأي المستخدم من سلوكه من غير ما يقول لنا شيء مباشر، مثل الوقت اللي بيقضيه على موضوع معين أو الحاجات اللي بيشتريها. بنستخدمها عشان أحياناً الناس كسالى ما تقول رأيها بشكل صريح، فاحنا بندخن من الأفعال.
inference-only
مفهوم يعني النموذج بيشتغل للتنبؤ والإجابة بس، مش بيتعلّم معك أو بيتحدّث نفسه. بنسمع عنه عشان في حالات ما بنحتاج تدريب، نحتاج بس نروّح النموذج ويعطينا الإجابة بسرعة.
information extraction
هاي العملية اللي بندور فيها على معلومات مهمة معينة من نصوص أو وثائق كبيرة - مثلاً نستخرج الأسماء أو التواريخ أو الأماكن. بنسمع عنها كتير لأنه في الواقع احنا نحتاج نلاقي المعلومات اللي ضرورية وما نضيع وقتنا بقراءة كل شي.
inpainting
يعني إننا بنملأ أجزاء ناقصة أو محذوفة من صورة باستخدام الذكاء الاصطناعي، يعني إذا في حاجة ما بدك إياها بالصورة بتحذفيها والموديل بيرسم مكانها شي متناسب. بنسمع عنها لأنها خيال سحري للتصاميم والتصوير - بدل ما تحذفي شخص من صورة وتضيعيها، الذكاء الاصطناعي بينسخ الخلفية والتفاصيل تمام التمام.
instruction fine-tuning
عملية بندرب فيها النموذج على تنفيذ أوامر وتعليمات محددة بشكل صحيح، يعني نعلّمه إشي كيف يرد على الأسئلة والطلبات بالطريقة اللي احنا بدنا إياها.
instruction tuning
يعني احنا بنعلّم النموذج كيف يتبع التعليمات والأوامر بشكل صحيح، مش بس نعلمه معلومات عشوائية. بنسمع عنها عشان لما النموذج يتعلّم يتبع تعليماتك بالظبط، بيصير أكتر فائدة وأسهل ما تشتغلي معاه في الواقع.
intermediate representation
هو شكل وسيط للكود بين اللغة البرمجية الأصلية والكود النهائي اللي بشتغل على الجهاز، بدنا إياه عشان يساعد المترجم يحسّن وينقّي الكود بشكل أفضل.
knowledge distillation
عملية بتاخد معلومات نموذج ذكي كبير وتحطها في نموذج أصغر بدون ما تفقد الكتير من الجودة، أشبه بتلخيص كتاب سميك في نسخة مختصرة. بدنا هالشي عشان النماذج الصغيرة بتركض أسرع وتستهلك طاقة أقل.
KV cache
تقنية بتخزّن المفاتيح والقيم اللي حسبناها قبل هيك عشان نستخدمها مرة ثانية. بنستخدمها عشان نسرّع الذكاء الاصطناعي ونقلل الحسابات المكررة.
KV caching
يعني الـ Key-Value caching، وهي تقنية بتخزّن النتائج السابقة اللي حسبناها عشان ما نحتاج نحسبها تاني. بنستخدمها في نماذج الذكاء الاصطناعي عشان تصير أسرع وتستهلك موارد أقل وقت ما بتولّد جمل.
latent conditioning
هذا عبارة عن طريقة بتؤثري على الصورة أو الفيديو من خلال معلومات مخبيّة جواه النموذج، مش معلومات واضحة في البداية. بنسمع عنه في أدوات توليد الصور والفيديو عشان بتعطيك تحكم دقيق على شو بتطلعي بدون ما تكتبي وصف طويل.
latent space
فضاء مخفي داخل النموذج بحط فيه المعلومات المهمة بشكل مضغوط وبسيط، بدل ما يشتغل على البيانات الخام الضخمة. إشي أساسي في نماذج الذكاء الاصطناعي الحديثة عشان بيخليها أسرع وأذكى في معالجة المعلومات.
leaderboard
جدول ترتيب بيظهر أيّ النماذج والفرق هي الأفضل في اختبارات معينة - زي جدول الدوري بتاع الرياضة بس للذكاء الاصطناعي.
leaderboards
يعني قوائم ترتيب بتظهر أداء النماذج والأنظمة المختلفة على مهام معينة. احنا بنهتم فيها عشان بتساعدنا نعرف أيّ نموذج الأفضل والأقوى في أيّ مجال.
LLM
نموذج لغة ضخم بتعلم على مليارات الكلمات وبعدين بيقدر يتنبأ ويكتب نصوص زي ChatGPT و Claude. بدنا نعرف عنه عشان دخل كل حاجة بحياتنا من البحث للكتابة للبرمجة.
LLM agent
يعني نموذج لغوي بس مش بيجاوب وبس، هو بيفكّر ويتخذ قرارات ويستخدم أدوات عشان يوصل لحل المشكلة. بنسمع عنها عشان الشركات بدها أنظمة مستقلة تقدر تشتغل من حالها بدون ما تحتاج إنسان يتدخل في كل خطوة.
LLM agents
يعني برامج ذكية مبنية على نماذج لغة كبيرة، وهذي البرامج قادرة تتخذ قرارات وتقوم بمهام معقدة بنفسها بدون ما نخبرها كل خطوة. بنسمع عنها كتير الآن عشان هي الخطوة الجاية في تطور الذكاء الاصطناعي.
LLM alignment
يعني احنا بندرب النموذج اللغوي الكبير إنه يشتغل بطريقة آمنة وأخلاقية ومفيدة للناس، مش بس إنه يكون ذكي. عشان بدنا النموذج يتصرف بشكل يطابق قيمنا البشرية والحاجات اللي احنا بدنا إياها.
LLM pipeline
سلسلة من الخطوات اللي بتشتغل مع بعضها عشان تحول السؤال أو الطلب لإجابة من نموذج اللغة الكبير، بتشمل معالجة المدخلات والحسابات والنتائج.
LLM pipelines
إشي يعني نسلسل خطوات وعمليات مرتبة عشان نعالج المدخلات والمخرجات، مثلاً: نأخذ النص، نحللو، نعدل عليه، بعدين نطلعو للمستخدم.
LLM-based agents
يعني برامج ذكية بتقول لها إشي تعمله، فتفكر وتتخذ قرارات بحالها، بدون ما تحتاج تدخّل يدوي في كل خطوة. احنا بنخليها تشتغل لحالها وتقرر إيش اللي أحسن خطوة جاي.
LLM-based coding agents
يعني برنامج ذكي بيستخدم نماذج اللغة الكبيرة عشان يكتب ويحلل ويصلح الكود بالآلي. بنسمع عنها عشان اليوم صارت مهمة جداً في البرمجة والتطوير.
Local-λ Mix Interaction (LλMI)
تقنية بتخلط بين مستويات مختلفة من معالجة البيانات بشكل محلي ومتوازن، مش بطريقة عشوائية. بنسمع عنها في الأبحاث الحديثة لأنها بتحسّن دقة وكفاءة النماذج بطرق ذكية.
LoRA
اختصار Low-Rank Adaptation، يعني تعديل وتدريب نموذج ذكاء اصطناعي ضخم بس نضيف طبقات صغيرة خفيفة بدل ما نعدّل النموذج كله. استخدامها بيوفّر وقت وموارد عشان التدريب بيصير أسرع وأرخص.
LoRA fine-tuning
طريقة ذكية لتطوير نماذج الذكاء الاصطناعي بدون ما نغيّر الموديل الأساسي كتير. بدنا نستخدمها عشان تطوير البرامج بتكون أرخص وأسرع.
LoRA SFT
طريقة فعّالة عشان نعلّم نموذج ذكاء اصطناعي مهام جديدة بدون ما نثقّل حسابياً: بدنا نعدّل جزء صغير من النموذج بدل كله، فتصير أسرع وأرخص.
MCP-based agent
وكيل ذكي مبني على بروتوكول MCP اللي بيسمح له يتواصل مع أدوات ومصادر مختلفة بشكل آمن ومنظم، عشان يقدر يعمل مهام معقدة بكفاءة.
MCP-based agents
يعني agents مبنية على بروتوكول Model Context Protocol، واللي بيسمح للنماذج تتكلم مع أدوات وأنظمة مختلفة بطريقة معيارية. بدنا هاي الطريقة عشان تخلي الـ AI أكثر مرونة وقابلية للتطوير.
metadata
هذي معلومات عن المعلومات نفسها، زي عنوان الملف، تاريخ الإنشاء، والمؤلف - المعلومات اللي بتساعدك تنظمي وتفهمي محتوى الملفات. بنسمع عنها دايماً عشان بتساعد النماذج تفهم السياق بشكل أحسن وتجاوب أصح.
MLLM
نموذج ذكاء اصطناعي بيقدر يفهم ويتعامل مع أنواع بيانات مختلفة في نفس الوقت (صور، نص، صوت)، احنا بنسمع عنه كتير لأنه بيقدر يحل مسائل معقدة بكفاءة أعلى.
MLLM (Multimodal Large Language Model)
نموذج ذكي بيفهم أكثر من نوع معلومات: نصوص، صور، صوت مع بعضهم البعض. بنسمع عنه كتير عشان بيعطينا فهم أشمل وأعمق للمعلومات من جميع جوانبها.
MLLMs
يعني نماذج ذكاء اصطناعي متقدمة بتشتغل مع أنواع معلومات مختلفة زي النصوص والصور والفيديو وأصوات في نفس الوقت. بنسمع عنها عشان هيدول النماذج بتفهم وتحلل معلومات معقدة أكتر من اللي بتشتغل على نص بس، وبتساعد في تطبيقات ذكية أكتر كفاءة.
multi-agent architecture
يعني بناء نظام فيه عدة وكلاء ذكيين بيشتغلوا مع بعضهم علشان يحلّوا مشكلة معقدة. كل واحد فيهم له دوره، وبيتعاونوا عشان يوصلوا للنتيجة الأحسن.
multi-agent systems
هي أنظمة فيها أكتر من عامل ذكي (agent) بيشتغلوا مع بعض عشان يوصلوا لهدف معين - كل واحد منهم بياخذ قرارات ويتفاعل مع الآخرين. بنسمع عنها كتير لأنها بتخليك تحل مشاكل معقدة بطريقة أذكى من الحل الواحد.
Multi-LCB
يعني نحنا نستخدم عدة نماذج لغوية مختلفة في نفس الوقت عشان نحصل على نتايج أفضل وأدق. بنسمع عنه لأنه بخليك تستفيد من قوة كل نموذج بطريقة ذكية.
multi-turn reasoning
يعني النموذج بيفكّر خطوة خطوة على طول محادثة كاملة، ما بيجاوب مرة واحدة، بس بيناقش معاك ويبني على كل جواب. بنسمع عنها عشان بتعطيك أجوبة أعمق وأفضل خاصة في المسائل المعقدة.
multi-turn red-teaming
يعني احنا بنحاول كمان ومرات ومرات ننسف النموذج وندوّر ثغرات فيه بأسئلة خطيرة ومتسلسلة. بنسمع عنها عشان لما تطلعي نموذج للناس، بدكِ تكوني متأكدة إنو آمن وما في فيه ثغرات سهل ما حد يستغلها.
multilingual
معناه إنّ النموذج بيفهم ويتكلم أكتر من لغة واحدة، زي ما بتتكلمي عربي وإنجليزي. بنسمع عنه عشان بدنا أنظمة ذكاء اصطناعي تخدم الكل بلغتهم الخاصة.
Multimodal Large Language Model (MLLM)
هاي نماذج ذكاء اصطناعي ذكية قادرة تفهم وتشتغل مع أشياء مختلفة زي النصوص والصور والفيديو في نفس الوقت، بدنا إياها عشان تساعد بمهام معقدة بتطلب فهم الكتير من أنواع المعلومات.
multimodal LLMs
يعني نماذج لغة ذكية بتفهم أكتر من شي واحد في نفس الوقت: نصوص وصور وأصوات مثلاً. بهالطريقة بتقدر تجاوب على أسئلة أعقد وتشتغل في حالات أكتر واقعية.
multimodal reasoning
القدرة على فهم والتفكير باستخدام أنواع مختلفة من المعلومات في نفس الوقت (صور، نصوص، أصوات، إلخ)، يعني النموذج ما بيعتمد على حاجة واحدة إنما على كل الطرق المتاحة عشان يفهم أحسن.
natural language queries
يعني احنا بنكتب أسئلة وجمل عادية زي ما بنتكلم مع بعضنا، والذكاء الاصطناعي يفهمها ويجاوب عليها بدون ما نستخدم رموز غريبة أو أوامر معقدة.
novel view synthesis
يعني احنا عندنا صور لشي من زوايا معينة، والنموذج بدّو يخيّل كيف بنشوف نفس الشي من زاوية ما شُفنا قبل كده. مثل ما تدير الكاميرا حول تمثال وتشوف جنباته من ولا اتوقعت تقدر تشوفها.
off-policy data generation
يعني إحنا بنجمع بيانات من سلوكيات قديمة مش من النموذج الحالي، عشان نوفر وقت وموارد وما نضطر نولد بيانات جديدة في كل خطوة.
off-policy learning
يعني النموذج بيتعلم من تجارب أو بيانات قديمة أو من نماذج تانية، مش بالضرورة من التجارب اللي عم يسويها هسع. بنسمع عنها عشان بتوفر وقت وموارد بدل ما نروح نجمع تجارب جديدة.
On-policy Self-Distillation (OPSD)
هي تقنية بنعلّم فيها نموذج الذكاء الاصطناعي من نفسه بناءً على التجارب اللي بعملها في الحاضر، بدنا إياها عشان النموذج يتحسّن أسرع وبدون ما نحتاج بيانات كتير من برا.
OPSD (On-Policy Self-Distillation)
تقنية بيتعلّم فيها النموذج من نفسه بطريقة ذكيّة، يعني بيستخرج المعرفة من نسختة الأقوى لنسختة الأضعف. بسمع عنها عشان بتحسّن الأداء وبتخفّف الحسابات المطلوبة.
out-of-distribution
يعني البيانات أو الحالات اللي ما شفها النموذج قبل كده أثناء التدريب، فهو ما عنده خبرة معها، لذلك قد يغلط في التنبؤ.
out-of-distribution (OOD)
يعني ما هو في بيانات أو حالات مختلفة جداً عن اللي النموذج تدرب عليها. المشكلة إن النموذج بيصير ضايع ما يعرف شو يعمل، وهاي من أكبر التحديات في الذكاء الاصطناعي.
photorealistic faces
وجوه مصنّعة بالذكاء الاصطناعي بتبدو حقيقية جداً للدرجة إنك صعب تميّز إنها مش فوتوغرافيا حقيقية. بنسمع عنها عشان بتخلق نقاش أخلاقي وأمني عن الخداع والـdeepfakes.
policy learning
يعني البرنامج الذكي بتعلم القرارات والخطوات الصح اللي لازم يعملها عشان يوصل لهدفه. بنسمع عنه لأنه أساسي في كل حاجة من الروبوتات لحتى الألعاب الذكية.
policy optimization
هي عملية تحسين القرارات اللي بياخذها الذكاء الاصطناعي عشان يوصل لأفضل نتيجة - يعني بدنا نعلم النموذج كيف يختار الحركات الصح. بنسمع عنها كتير في التعلم التعزيزي والروبوتات.
pre-training
هي العملية الأولى اللي بنعلم فيها النموذج على كمية ضخمة من الكلام من الإنترنت عشان يتعلم يفهم اللغة والمفاهيم بشكل عام قبل ما نخصصه لمهام معينة.
predictive validity
يعني قدرة النموذج إنه يتنبّأ بشكل صحيح على بيانات جديدة ما شفها قبل كده. بنهتم بالمصطلح ده عشان احنا بدنا نتأكد إن النموذج ما بيكون مجرد حفظ، بل بيفهم البيانات فعلاً.
prefill
مرحلة بداية بمعالجة النصوص حيث بنحضر ونملأ المعلومات قبل ما نشتغل على الجزء اللي بده ينتج، عشان تحسن السرعة والكفاءة.
pretraining
المرحلة الأولى واللي بتاخد وقت طويل في تعليم النموذج: بنعلمو على كمية ضخمة من البيانات العامة عشان يتعلم الأساسيات والمهارات الكبيرة اللي بيستخدمها بعدين في مهام محددة.
probe-and-refine tuning
يعني عملية احنا بنختبر فيها النموذج، نشوف وين الأخطاء، بعدين نصلحها وندقق الإعدادات. بنسمع عنها عشان هي طريقة شاطرة لتحسين أداء النموذج.
prompt augmentation
يعني بدنا نضيف معلومات إضافية أو نعديل على السؤال اللي بنسأل النموذج عشان نحصل على إجابات أفضل وأكتر دقة. بنسمع عنها كتير لأنها بسيطة وفعالة بدرجة كبيرة.
prompt optimization
يعني احنا بندور على أحسن طريقة لنكتب السؤال أو التعليمات للذكاء الاصطناعي عشان يعطينا أفضل إجابة، زي بدل ما نقول 'اكتب قصة' نقول 'اكتب قصة درامية بطل فيها شاب فلسطيني'.
Proximal Policy Optimisation
طريقة بتعلم النموذج أحسن سلوك تدريجياً بدون ما يبعد كتير عن السلوك القديم، عشان الخطوات الكبيرة بتخرب التعلم.
Proximal Policy Optimization
خوارزمية بتعلّم الآلة تاخذ قرارات أحسن من خلال تحديث قليل وحذر لكل خطوة، مش لما تقفز لقرار مختلف بشكل كبير، بدنا إياها عشان تخليّ التعلم مستقر وآمن وبدون ما تعطّل النموذج.
Query Formulation
يعني كيفاش بنصيغ السؤال أو الطلب بالطريقة الصح، عشان النموذج يفهم إشي بدنا ويرد علينا بالمعلومات اللي بدنا إياها.
radiance fields
بدنا نخزّن معلومات عن الضوء والألوان في كل نقطة في الفضاء. يعني كتاب شامل بيقول: في الموقع ده، الضوء بيجي من الاتجاه ده وبهذا اللون. بنسمع عنه كتير في الرؤية الحاسوبية عشان بيساعدنا نعيد بناء الصور من زوايا مختلفة.
RAG
اختصار Retrieval-Augmented Generation، يعني احنا بنجيب معلومات من قواعد بيانات خارجية ونخليها تساعد النموذج إنه يجاوب على أسئلتك بشكل أدق. بنسمع عنه عشان بيحسّن إجابات الذكاء الاصطناعي ويقلل الأخطاء.
RAG (Retrieval-Augmented Generation)
احنا بننجيب معلومات صحيحة من قاعدة بيانات موجودة، بعدين بندخلها للنموذج عشان يعطينا إجابة أدق ومش متخيلة من بنات أفكاره.
red-teaming
يعني فريق من الخبراء بيحاولوا بقصد انهم يكسروا ويخترقوا النظام لإيجاد ثغرات وضعفيات فيه. احنا بنعملها عشان نتأكد إن نماذج الذكاء الاصطناعي بتاعتنا آمنة وما فيها مشاكل قبل ما نطلقها للناس.
reinforcement learning
تعليم الذكاء الاصطناعي من خلال نظام الحوافز والعقوبات، زي لما تعلمي طفل بالمكافأة والعقاب عشان يتعلم السلوك الصحيح. بنستخدمه عشان الآلة تتعلم تاخذ قرارات ذكية بنفسها من غير ما نحطّ كل إجابة جاهزة.
reinforcement learning (RL)
هو أسلوب تدريب حيث النموذج بيتعلّم من الخطأ والصواب زي ما البني آدم بيتعلّم: لما يعمل حاجة صح بنعطيه مكافأة، ولما يعمل خطأ بنقلّل المكافأة. هيك بدّه يحسّن نفسه مع الوقت.
retrieval
يعني البحث وإرجاع المعلومات المناسبة من كم كبير من البيانات بسرعة ودقة. احنا بنسمع عنها دايماً عشان هي الأساس بتاع محركات البحث وأنظمة الذكاء الاصطناعي اللي بتحتاج معلومات صحيحة.
retrieval-augmented generation
retrieval-augmented reasoning
يعني النموذج بدو يبحث عن معلومات من مصادر خارجية أولاً، بعدين يستخدمها في التفكير والإجابة عشان تكون الإجابة أدق وأفضل.
retriever
هذا المصطلح بيعني آلية بتروح تجيب المعلومات الصح من قاعدة بيانات كبيرة، زي ما تروحي توديري في المكتبة وتجيبي الكتاب اللي فيه المعلومة اللي بدك إياها. بنسمع عنه كتير في الذكاء الاصطناعي عشان بيساعد النماذج تجاوب أكتر دقة بناءً على معلومات موجودة.
reward model
نموذج صغير بنعلمه يقيّم جودة الإجابات والمخرجات (شو اللي كويس وشو اللي مش كويس) عشان نستخدمو لتحسين النماذج الكبيرة.
RoPE modulation
تقنية تعديل لموضع المعلومات في نموذج الذكاء الاصطناعي باستخدام Rotary Position Embeddings عشان النموذج يفهم ترتيب الكلام والعناصر بشكل أفضل. بنستخدمها عشان النموذج يركّز على العناصر المهمة ويتحكّم بانتباهه بكفاءة أكتر.
safety-critical system
نظام مش معقول لو انقصّ أو غلط فيه، عشان بيؤثّر على سلامة الناس أو حياتهم مثل: نظام في مستشفى أو سيارة ذاتية القيادة. بنسمع عنها عشان بدنا حد يركّب نماذج ذكاء اصطناعي في أماكن مهمة وحساسة بس لازم تكون موثوقة مئة بالمئة.
safety-critical systems
أنظمة لو فيها خطأ ولو بسيط ممكن يصير فيها كارثة وحادث خطير، زي أنظمة الطائرات والسيارات ذاتية القيادة والأجهزة الطبية. احنا بنركّز عليها كتير عشان الأمان فيها مهم جداً والمسؤولية عليه كبيرة.
Scene Memory
بدنا نخزّن معلومات عن المشهد كامل - الكائنات والأماكن والعلاقات بينهم - حتى نقدر نرجع نستخدمها لاحقاً. بنسمع عنها عشان الأنظمة بتحتاج تتذكر السياق عشان تتنبأ أو تولّد حاجات صح.
scene-centric understanding
معناه إنّ النموذج بيفهم الصورة أو الفيديو من خلال فهم المشهد كاملاً مش فقط الأشياء الفردية. يعني بيشوف الأشياء والعلاقات بينها والسياق بشكل شامل. بنسمع عنه لأنه بيساعد الذكاء الاصطناعي يفهم الحالات المعقدة.
SDF blending
تقنية بتمزج نماذج ثلاثية الأبعاد بطريقة ناعمة بين أشكال مختلفة، بتخليهم يتحركوا وينسجموا ببعضهم بدون ما يصير كسور أو حواف حادة.
self-attention
آلية بتخليّ النموذج يركّز على أجزاء معينة من البيانات اللي إدّاها وينسى الأجزاء الثانية، مثل لما تقرا جملة وتركّز على الكلمات المهمة، بدنا إياها عشان بتحسّن فهم النموذج للعلاقات بين الأشياء.
semantic segmentation
هي طريقة بنقسّم الصورة لأجزاء صغيرة وكل جزء بنقول إيش هو (سيارة، شجرة، إنسان)، احنا بنستخدمها عشان الكمبيوتر يفهم محتوى الصورة بشكل دقيق مش بس يعرّف إن في سيارة لأ يقول وين السيارة بالضبط.
Shortcut-learning
هو لما نموذج الذكاء الاصطناعي بتعلّم حاجات سهلة وسريعة (shortcuts) بدل ما يتعلّم الطريقة الصحيحة الفعلية، مشكلتنا فيه أنه يخلي النموذج ضعيف ومش موثوق على حالات جديدة.
Signed Distance Field (SDF)
طريقة ذكية لتمثيل الأشكال والكائنات في الفضاء ثلاثي الأبعاد بحساب المسافة من أي نقطة لسطح الشكل. بنستخدمها في الرسوميات والذكاء الاصطناعي عشان بتساعد في بناء نماذج ثلاثية الأبعاد بشكل دقيق.
skill distillation
نقل المهارات والقدرات من نموذج كبير معقّد لنموذج صغير أبسط، زي لما تعلّمي شخص خبير مهارته لشخص آخر. بنستخدمها عشان نخلق نماذج خفيفة وسريعة بس محافظة على القدرات الأساسية للنموذج الكبير.
skill library
مكتبة بتضمّ كل المهارات والقدرات اللي تعلّمها النموذج من قبل، زي لمّا تتذكّري كل حاجة اتعلّمتِيها. بتسمع عنها عشان بدنا نعيد استخدام المهارات القديمة بدل ما نبدأ من الصفر في كل مرّة.
social bias
يعني أن النموذج قد يعطيك إجابات متحيّزة بناءً على النوع أو العرق أو الديانة وإشي كتير. بنركز عليها عشان بدنا نتأكد أن الذكاء الاصطناعي مش بينقل الأحيازات اللي موجودة في المجتمع.
soft fusion
طريقة بنمزج معلومات من مصادر مختلفة بطريقة ناعمة بدل ما نختار واحدة منهم، مثل بنحط وزن لكل مصدر ونطلّع النتيجة النهائية من المزج، احنا بنستخدمها عشان تكون النتائج أفضل وأدق.
spatial blocking
هذا تقنية بتحدّد أماكن معيّنة في الصورة أو الفيديو وتتحكمي بشنو اللي بدّو يطلع في كل مكان، مثلاً الشخص هان والخلفية هان. بنسمع عنها عشان بتعطيك دقة أعلى في التحكم بالمحتوى اللي بتوليّديه.
spatial grounding
يعني النموذج بتاعك بيقدر يحدّد بالضبط أين الشيء في الصورة، مش بس يقول في كتاب، بل يشير وين الكتاب تحديداً في الصورة.
spatial tool-use
يعني استخدام أدوات بطريقة بتركز على المكان والفراغ، يعني النموذج بيفهم كيف يستخدم الأشياء في مكان معين أو كيف يتحرك في بيئة حقيقية. بدنا هاي المهارة عشان نخليّ الروبوتات والأنظمة الذكية أكثر عملية في الواقع.
spatio-temporal evidence accumulation
يعني احنا بنجمع معلومات عن الحركة والمكان عبر الوقت، مثل إشي بنراقبه بشكل مستمر ونسجل كل تغيير يصير. بنسمع عنها عشان المودلات الحديثة بتحتاج تفهم الحركة والتسلسل الزمني مع بعضهم.
spectral radius
يعني أكبر قيمة ممكنة بتطلعها من مصفوفة معينة، وهي مهمة جداً في الرياضيات والهندسة. بنسمع عنها في مجال الذكاء الاصطناعي عشان تساعدنا نفهم استقرار الأنظمة والشبكات.
speech diffusion models
نماذج بتولّد كلام طبيعي من خلال إضافة وإزالة ضوضاء بشكل تدريجي لحتى توصل للكلام النهائي. بنسمع عنها عشان بتعطي جودة صوتية عالية وطبيعية أكتر من الطرق القديمة.
structural bottleneck
مشكلة بتصير في النموذج حين بتكون بعض أجزاء المعمارية ضيقة أو ضعيفة، فبتحد من قدرة كل شيء يشتغل بكفاءة عالية وتبطّئ الأداء الكلي.
style captions
نصوص بتوصف أسلوب وطريقة تصميم الصورة (الألوان، الخطوط، الملمس)، مش بس بتقول شو الموجود في الصورة إنما كيف يا جماعة!
style-content separation
فصل أسلوب الشيء (لونه، شكله، طريقة الرسم) عن محتوى الشيء (الفكرة والموضوع الأساسي). بنسمع عنها كتير في الذكاء الاصطناعي الإبداعي عشان بتخليك تعدّلي على الأسلوب وتحافظي على المعنى، أو العكس.
style-reference generation
عملية بتولد صور أو تصاميم جديدة بنفس الأسلوب والمظهر الجميل اللي شفتيه في صورة تانية، يعني نسخ الفنّ بدون ما ننسخ الفكرة الأصلية.
style-transfer
نقل أسلوب وشكل من صورة لصورة ثانية، زي لما تأخذي لوحة فنان مشهور وتطبقي أسلوبها على صورتك الشخصية. بنستخدمه عشان نولّد محتوى جديد بأسلوب معيّن بدون ما نعدّل محتوى الصورة الأصلية.
supervised fine-tuning (SFT)
عملية تدريب نموذج بيانات بحيث بنديله أمثلة صحيحة وبنقول له شو الإجابة الصح، نفس ما تعلمي الطفل من خلال إعطاء أمثلة محددة.
SWE-bench
يعني قياس نموذجاتك على مهام هندسة البرمجيات الحقيقية، وشو قادر يحل من المشاكل البرمجية بشكل صحيح. بنستخدمه عشان نتفرج إذا النموذج فعلاً نافع للمبرمجين.
synthetic bug-fix probes
يعني أسئلة واختبارات صناعية احنا ما نستحصيلها من الواقع، بس بنصنعها عشان نشيك إذا النموذج بيقدر يصلح الأخطاء في الكود. بنسمع عنها عشان هي طريقة اقتصادية ودقيقة لتقييم الأداء.
tabular data
البيانات اللي مرتبة في جداول (صفوف وأعمدة) زي ما تشوفي في إكسل أو قواعد البيانات، وهي نوع مهم جداً في تطبيقات الذكاء الاصطناعي في الشركات والمستشفيات.
teleoperated real-robot trajectories
بيانات حركة روبوتات حقيقية اتم التحكم فيها عن بعد بواسطة الإنسان، يعني الروبوت بيتعلم من حركات الإنسان. بنسمع عنها عشان بتساعد الروبوتات تتعلم مهام معقدة بأسرع ما في.
test-time scaling
يعني إننا بدنا نصرف موارد أكتر وقت ما نختبر النموذج (مش وقت التدريب) عشان نحصل على إجابات أفضل وأدق. بنسمع عنها لأنها طريقة ذكية تخليك تحسّن النتايج بدون ما تدرّب النموذج من الأول.
text-to-video
يعني تقنية تاخد نص مكتوب وتحوله لفيديو كامل بشخصيات وحركات وخلفيات. بدنا نركز عليها عشان بتفتح إمكانيات جديدة في الإعلام والتعليم والترفيه.
text-to-video generation
يعني بتكتبي نص أو وصف، والذكاء الاصطناعي بيطلّع لك فيديو متحرك كامل بناءً على الوصف اللي أعطيتيه. بنسمع عنها كتير الأيام دي عشان التقنية بتطورت وصارت بتطلع فيديوهات احترافية جداً.
token bottleneck
إشي زي الاختناق في الزحمة، يعني النموذج بتاعك عنده حد أقصى للرموز (tokens) اللي يقدر يتعامل معها في مرة واحدة، وهذا بيحدّ من كم معلومات يقدر يعالج.
TTS
تقنية بتحوّل النص المكتوب لكلام مسموع، يعني الكومبيوتر بيقول لك النص إلي بتكتبيه. بنسمع عنها عشان بتستخدم في مساعدين صوتيين والقارئات الذكية وتطبيقات الوصولية.
upsampling
عملية بتكبر الصور أو المخرجات من دقة منخفضة لدقة أعلى، بحيث يصير واضح أكتر والتفاصيل تطلع أحسن.
variable transparency
يعني إننا نشوف وِنفهم قيمة المتغيرات والمدخلات اللي الذكاء الاصطناعي بيستخدمها، عشان ما نصير في ظلام بخصوص إيش بالضبط اللي بيؤثر على القرارات اللي بيطلعها.
vision-language model (VLM)
نموذج ذكي يفهم الصور والنصوص مع بعضهم، يعني بيقدر يشوف صورة ويقرأ نص ويربط بينهم ويعطيك إجابة ذكية عن الاتنين.
vision-language models (VLMs)
يعني نماذج ذكية قادرة تفهم الصور والنصوص معاً في نفس الوقت. بنستخدمها عشان نسأل النموذج عن شو موجود في الصورة أو نعطيه صورة ونص مع بعض.
visual cues
يعني الإشارات والعلامات البصرية اللي بندقق عليها بالصورة، مثل الألوان والأشكال والتفاصيل. بنسمع عنها عشان النماذج تبعت الرؤية بتعتمد على الإشارات دي عشان تفهم الصورة.
visual grounding
ربط الكلمات والمصطلحات بالأشياء الفعليّة في الصور، يعني النموذج بيقول 'الجسم الأزرق ده هو الكرسي'. بنسمع عنها عشان بتساعد النموذج يفهم إشي فعلاً وين موجود في الصورة.
visual question answering (VQA)
تقنية بتسمح للنموذج يقرأ صورة ويرد على أسئلة حولها، زي ما تقول 'كم شخص في الصورة؟' والبرنامج يجاوب. بنسمع عنها عشان بتفتح أفاق للتطبيقات اللي تساعد الناس العمياء والمكفوفين.
VLM
اختصار لـ Vision Language Model، يعني نموذج ذكي بيفهم الصور والنصوص مع بعض. بنسمع عن هاي النماذج كتير الآن عشان بتفتح إمكانيات جديدة في تحليل الصور والفيديوهات.
Walsh-Hadamard rotation
هي تقنية رياضية بتدوّر البيانات بطريقة ذكية قبل ما نضغطها، شي زي ما تعيدي ترتيب الأشياء بشكل أفضل عشان الضغط. بنسخدمها في 4-bit quantization عشان تحافظ على دقة النموذج وما تخسري معلومات مهمة.
weight diff transfer
يعني احنا بدنا نأخذ الفروقات (الفرق) بين أوزان نموذج الأساس والنموذج المحسّن، وننقلها لنموذج آخر عشان نوفر وقت وموارد بدل ما نعيد التدريب من الصفر.
zero-shot
يعني إنك بتطلبي من النموذج يعمل حاجة ما دراب عليها ولا شُفت أمثلة عليها، الذكاء الاصطناعي بيحاول يفهم المطلوب من أول مرة بناءً على معرفته العامة. بنسمع عنه كتير عشان بيوفر وقت ما بدنا نعلّم النموذج على حالات جديدة.
zero-shot generation
النموذج بيتمكن يولد أو ينتج حاجات لأول مرة بدون ما يشوف أمثلة كتيرة عليها أو بدون تدريب خاص. احنا بنحب إشي كذا عشان الذكاء الاصطناعي بيصير أكثر مرونة وبيقدر يتعامل مع حالات جديدة.

🤖 موديلز (33)

3D Gaussian Splatting
احنا بنستخدم كتير من الكرات الضبابية (الـ Gaussians) عشان نرسم صورة ثلاثية الأبعاد، وكل كرة بتساهم شوية في الصورة النهائية. هذا سريع جداً وسهل، لهيك بصير محبوب كتير في تطبيقات الواقع الافتراضي.
bge-small
نموذج تضمين نصي صغير وسريع بيحول الجمل لأرقام بطريقة ما الجملتين المتشابهة بتاخد أرقام قريبة من بعضها. بنسمع عنه عشان بيساعد في البحث والمقارنة بين النصوص بكفاءة عالية وموارد قليلة.
CapSpeech-TTS
نموذج متخصص بتحويل النص للكلام (Text-to-Speech) مع إنه بيحافظ على خصائص الصوت والتعبير الطبيعي. بنستخدمه عشان نولد أصوات بشرية بتبدو طبيعية أكتر من الطرق القديمة.
CLIP
نموذج ذكي يفهم العلاقة بين النصوص والصور في نفس الوقت، وبيقدر يطابق صورة مع وصف نصي. شغلته سهل وسريع ولازم بنستخدمه في توليد صور من نصوص وتصنيف الصور.
ContextRL
يعني احنا بندرّب النموذج على إنه يتعلّم من السياق اللي حوله، مش بس من القواعد الجامدة. عشان كذا بينجح أكتر في المهام اللي فيها معلومات متغيّرة ومختلفة.
DAAM
DAAM هو نموذج بتشتغل على فهم الصور والنصوص مع بعض، يعني بتقول لك أي جزء في الصورة مرتبط بأي كلمة في النص. احنا بنستخدمه عشان نفهم إشي أكتر عن كيفية الاتصال بين ما نكتبه وما نشوفه بالصورة.
DeepSeek-chat
هذا نموذج ذكاء اصطناعي محادثة طورته شركة DeepSeek، بيتحاور معاك ويجاوب على أسئلتك بشكل طبيعي ومفصل. بنسمع عنه عشان بيتنافس مع النماذج الكبيرة التانية ويوفر خيار فعال وقوي.
DiffusionGemma
يعني نموذج نشر صور مبني على نموذج Gemma، بيستخدم تقنيات الانتشار عشان يوليد صور جديدة من وصف نصي. بنسمع عنه عشان هو جديد وبيقدّم أداء تمام في توليد الصور.
DragMesh-2
هاي حاجة متقدمة للرسم والتصميم باستخدام الذكاء الاصطناعي، بتخليك تحرّك الأشياء برسمتك بسهولة. بنسمع عنها لأنها بتخليك تتحكم في التصميمات بطريقة سلسة وطبيعية.
FAPO
نموذج بدو يساعد في تحسين الأداء بطريقة فعّالة وسريعة بدون ما نستهلك موارد كتير، مشهور إنو خفيف وسهل التطبيق.
FlashRT
يعني نموذج سريع جداً بيعطيك الأجوبة لحظة ما تسأل. بنسمع عنه لأنه بيركز على السرعة والكفاءة، وهسع الناس بدها نماذج ما تضيع وقتها.
Flow-Matching TTS
نموذج لتحويل النصوص لصوت، بيستخدم تقنية Flow-Matching عشان يعطينا صوت طبيعي وسلس بدون تقطع.
FLUX.1-Fill-Dev
نموذج صور متقدم من Flux بيقدر يملأ الأجزاء الناقصة من الصورة بذكاء عالي. بنستخدمه للتطوير والاختبار لأنه بيدي نتايج احترافية في تعديل وتكملة الصور.
Ghidra
أداة قوية من وكالة الأمن القومي الأمريكية بتساعدك تفكك وتحلل الأكواد المُترجَمة. بنستخدمها المحترفين في الأمن السيبراني عشان تفهم البرامج الغريبة أو الضارة.
GRPO
نموذج حديث بتقنية RL متطوّرة بتساعد النموذج يتعلّم بكفاءة أعلى وأسرع. هو بيركّز على الجودة في كل خطوة تدريب، عشان كذا بينتج إجابات أفضل بموارد أقل.
LLVM
هاي منصة قوية بتساعد في بناء مترجمات (compilers) وتحسين الأكواد البرمجية، اسمها Low-Level Virtual Machine وبنستخدمها عشان نخلي البرامج تشتغل بشكل محسّن على معالجات مختلفة.
Modern Hopfield Network
شبكة عصبية قديمة بتقنيات جديدة، بتخزّن وبتسترجع معلومات مثل الذاكرة، إشي مشابه لكيفاش احنا بنتذكر الحاجات.
MolmoMotion
نموذج تم تطويره لفهم وتوليد الحركة البشرية أو الأجسام، بيجمع بين رؤية الكمبيوتر وتوليد الحركة. بنسمع عنه عشان متخصص في الحركة بشكل دقيق جداً.
PICA
مفهوم بيتعلق بكيفية ما البرنامج يفهم التفاعل بين الأشياء المختلفة والمساحات. بنسمع عنه عشان مهم جداً للروبوتات وحتى الألعاب ثلاثية الأبعاد.
Qwen2.5-7B-Instruct
إشي نموذج ذكاء اصطناعي من تطوير علماء صينيين، خفيف الوزن وبسيط (7 مليار معاملة) وتم تدريبه عشان يفهم التعليمات والأسئلة بشكل دقيق جداً.
RadGrounder
نموذج متخصص في الصور الطبية (زي صور الأشعة)، بيفهم الصورة والنص مع بعضهم ويقدر يقول وين المنطقة اللي بتتحدث عنها النصوص الطبية بالضبط.
RATs (Robotics Agent Teams)
نموذج بيخليّ عدّة روبوتات تشتغل مع بعضها كفريق موحّد، كل واحد بتاعهم بيعمل مهمّة معيّنة وبيتنسّق مع الباقين. بسمع عنها عشان الروبوتات بتصير أذكى لمّا تشتغل مع بعض من لمّا تشتغل لحالها.
RetDec
أداة مفتوحة المصدر بتحول الكود المترجَم لكود عالي المستوى أكتر سهولة. احنا بنفضلها لأنها مجانية وبتشتغل على أنواع ملفات كتير.
RL4IL
نموذج بيجمع بين التعلم من التعزيز والتعلم بالمحاكاة في نفس الوقت عشان يخليّ الآلة تتعلم من أمثلة وكمان من التجربة والخطأ، بدنا إياه عشان بيسرّع التعلم ويحسّن الأداء.
S-Agent-8B
نموذج متخصص في الحركة والفهم المكاني، وعدد المعاملات فيه 8 مليار تقريباً. بنسمع عنه عشان هو من النماذج الحديثة اللي بتتعامل مع الفيديو والحركة بكفاءة.
TurboQuant
نموذج متخصص بتقليل حجم نماذج الذكاء الاصطناعي الكبيرة وتخزينها بطريقة أكثر كفاءة. بنستخدمه عشان نخليها تشتغل على أجهزة أضعف وأسرع من غير ما نفقد أداءها الكتير.
ViGOS
هاي منصة أو نموذج بيساعد في إنشاء وتقييم أنظمة ذكاء اصطناعي بصرية، بدنا نستخدمها عشان نشتغل على مشاريع بتتعلق برؤية الحاسوب والفهم البصري.
Vision Transformer (ViT)
يعني نموذج بيشتغل على الصور بنفس الطريقة اللي النماذج الكبيرة بتشتغل على الكلام (Transformers). بنسمع عنه كتير لأنه فعّال جداً في مهام الرؤية بتاعة الحاسوب والذكاء الاصطناعي.
Vision Transformers
نموذج ذكي بيقرأ الصور زي ما بنقرأ النصوص - بينقسم الصورة لقطع صغيرة ويتعامل معها، وهاد أحسن بكتير من الطرق القديمة.
Vision Transformers (ViT)
نموذج ذكاء اصطناعي بيشتغل على الصور بنفس الطريقة اللي بتشتغل على الكلام، بدل ما يقسّم الصورة لأجزاء صغيرة، بيقسّمها لقطع ويفهمها كتسلسل. بنسمع عنها عشان بتعطي نتائج قوية جداً في تصنيف والتعرّف على الصور.
vLLM
هو مكتبة بتشتغل على تسريع النماذج اللغوية الكبيرة وتخليها تجاوب أسرع كتير. بنسمع عنها عشان الناس بدهم نماذج سريعة وفعّالة، و vLLM بتحل المشكلة هاي بتقنيات ذكية في إدارة الذاكرة.
VLM (Vision Language Model)
نموذج ذكي بيقدر يشتغل مع الصور والكلام في نفس الوقت، بمعنى آخر بيفهم الصور ويقدر يتكلم عنها ويجاوب أسئلة حولها.
Wan 2.2
هاي نسخة من نموذج ذكاء اصطناعي معين اللي بنستخدموها في تطبيقات معينة - كل ما يطلعوا نسخة جديدة يحسنوا الأداء والسرعة. بنسمع عنها لأن التطويرات المستمرة بتخليك تحصل على أفضل النتائج.

📏 مقاييس (13)

Content Alignment Score (CAS)
درجة تقيس مدى توافق محتوى النموذج مع القيم والمتطلبات المطلوبة منه. بتسمع عنها عشان بتساعدنا نتأكّد إنّ النموذج بيقول حاجات صحيحة وآمنة.
CWE (Common Weakness Enumeration)
Directional Failure Index
مقياس بيخبرك في أي اتجاه النموذج بتاعك بيفشل أكتر (مثلاً بيعطيك نتايج متفائلة أو متشائمة). مهم عشان نعرف إذا النموذج موثوق ولا لأ.
Directional Failure Index (DFI)
مقياس متقدّم بنقيس فيه كيف النموذج بيفشل في اتجاهات معينة محددة، يعني شو نوع الأخطاء بتصير وفي أي الحالات، عشان نفهم الضعف بشكل أدقّ.
exact-match
معيار بنقيس فيه إذا الإجابة اللي طلعها الذكاء الاصطناعي مطابقة تماماً للإجابة الصحيحة حرف بحرف، مش قريبة منها أو شبه صح، لازم تكون نفسها بالضبط.
F1 score
مقياس بنستخدمه عشان نحكم على أداء النموذج بشكل متوازن، لأنه يدمج دقة التنبؤات مع نسبة اللي النموذج اكتشفها من الأشياء الصحيحة.
LPIPS
اختصار Learned Perceptual Image Patch Similarity - بدل ما نقيس الفرق الرياضي بس، احنا بنسأل: كم البشر بيلاحظ الفرق؟ يعني قياس أذكى بشوية من PSNR عشان بأخذ بعين الاعتبار كيف العين البشرية شايفة الفروقات.
Phoneme Error Rate
Phoneme Error Rate (PER)
مقياس بنستخدمه عشان نقول كم غلطة صوتية صارت في النموذج، يعني إذا النموذج قال أصوات غلط بدل الأصوات الصحيحة.
PSNR
اختصار Peak Signal-to-Noise Ratio - يعني بنقيس كم الفرق كبير بين الصورة الأصلية والصورة اللي نتجت من النموذج. يعني كم واحد من الصورة صحيح وكم واحد ضوضاء. بنسمع عنه لأنه أسرع طريقة نقيس جودة الصور.
resolve rate
يعني نسبة المشاكل أو التحديات اللي النموذج قادر يحلّها بنجاح من أصل كل المشاكل. إذا كان الـ resolve rate عالي، يعني النموذج كويّس في شغله.
TTFT (Time to First Token)
هاي المدة اللي بتأخذ حتى يطلع أول حرف أو كلمة من الذكاء الاصطناعي لما تسأليه سؤال - يعني كم سرعته في البداية. بنسمع عنها لأنه المستخدمين بيشعروا بتجربة أسرع وأحسن لو الرد ابتدى يطلع بسرعة.
VLM-based Rejection Score
الـ VLM-based Rejection Score هي مقياس بيقول لك إذا النموذج (اللي بيفهم صور ونصوص) بيرفض الإجابة على سؤال معين أم لا. احنا بنستخدمها عشان نعرف متى النموذج مش واثق من جوابه وبدنا نتجاهل إجابته.

🗂️ بيانات (6)

GAPartNet
مجموعة ضخمة من البيانات فيها معلومات عن أجزاء الأشياء المختلفة وخصائصهم. بنسمع عنها لأنها بساعد النماذج تتعلم كيفية تفكيك وفهم الأشياء.
LIBERO-PRO
هاي مجموعة بيانات بتحتوي على آلاف المهام الروبوتية المختلفة، بدنا نستخدمها عشان نعلّم الذكاء الاصطناعي يفهم ويعمل مهام معقدة بأدوات وبيئات متنوعة.
LiveCodeBench
منصة اختبار حقيقية بتقيّم قدرة نماذج الذكاء الاصطناعي على كتابة كود برمجي فعلي وتحل مشاكل حقيقية. بنركز عليها عشان فيها أسئلة جديدة باستمرار ومش مجرد مذكرة قديمة.
PointMotionBench
قاعدة بيانات تحتوي على أمثلة كتير من الحركات والنقاط المتحركة في الفضاء، بتُستخدم لاختبار وتدريب النماذج. بنسمع عنها عشان بدنا نقيّم النماذج بشكل علمي على أرض واقعية.
RefRad2D
قاعدة بيانات فيها صور طبية مع وصفات نصية ومحددة المواقع، استخدموها الباحثين عشان يعلّموا النماذج تفهم الصور الطبية والنصوص مع بعضهم.
SWE-bench Verified
يعني مجموعة بيانات تحتوي على مسائل برمجة وتصليح أخطاء تم التحقق منها يدويّاً من قبل خبراء. بنسمع عنها عشان هي بتساعدنا نقيّم كيف النماذج بتاعتنا بتقدر تكتب وتصلح كود.