1. By :
Avin Jalal .
Supervisor: Ms.Shaheen Abdlkarim.
AI & PATTERN RECOGNITION
2. SUBJECTS:
WHAT IS PATTERN?
TYPE OF PATTERNS.
IDEA OF PATTERN RECOGNITION.
WHAT IS PATTERN RECOGNITION?
PROCESS PHASE IN PR.
DESIGN PATTERN RECOGNITION.
PATTERN RECOGNITION PROCESS.
WHAT IS PATTERN CLASS?
APPROACHES FOR PATTERN RECOGNITION.
PROBLEMS & APPLICATIONS.
3. WHAT IS PATTERN?
PATTERN : PATTERN IS A SET OF PHYSICAL
OBJECTS WHERE THE ELEMENTS OF THE SET
ARE SIMILAR TO ONE ANOTHER IN CERTAIN
WAYS.[1]
4. TYPE OF PATTERNS: [1]
SPATIAL PATTERNS:
TEMPORAL PATTERN:
ABSTRACT PATTERNS:
6. PATTERN RECOGNITION:
PATTERN RECOGNITION: Is the science for
how machines can: [6]
– Observing (sensing) the environment,
– Learning to distinguish patterns ,
– and making sound decisions about the patterns
or pattern classes.
RECOGNITION PATTERN WAYS: [9]
1. Statistical way.
2. Artificial Intelligence.
PATTERN : Pattern is a set of physical objects or phenomena or concepts=المفاهيمِ where the elements of the set are similar to one another in certain ways. The Pattern are described by certain quantities, qualities, traits, notable features and so on.[SIT_PC.ppt]
1.SPATIAL PATTERNS- These patterns are located in space.Eg:- characters in character recognition * images of ground covers in remote sensing * images of medical diagnosis.2.TEMPORAL PATTERN-These are distributed in time.Eg:- Radar signal, speech recognition, sonar signal etc.3.ABSTRACT PATTERNS-Here the patterns are distributed neither in space nor time.Eg:- classification of people based on psychological tests. * Medical diagnosis based on medical history and other medical tests. * Classification of people based on language they speak.[SIT_PC.ppt]
The idea of pattern recognition -Since our early childhood, we have been observing patterns in the objects around us (e.g., toys, flowers, pets, and faces).By the time children are five years old, most can recognize digits and letters. Small and large characters, handwritten and machine printed characters, characters of different colors and orientations and partially occluded letters - all are easily recognized by the young. We take this ability for granted until we face the task of teaching a machine how to recognize the characters. [10.1.1.108.1064.pdf]///////////////////////////////////////////Humans have developed highly sophisticated skills forsensing their environment and taking actions according towhat they observe, e.g.,– Recognizing a face.– Understanding spoken words.– Reading handwriting.– Distinguishing fresh food from its smell.– ...[11848aipresentationonpatternrecognition-111204123817-phpapp02.ppt]
What is pattern recognition -Pattern recognition is the science for how machines can: observing (sensing) the environment, learning to distinguish patterns of interest (e.g., animals) from their background (e.g., sky, trees, ground), and making sound decisions about the patterns (e.g., Fido) or pattern classes (e.g., a dog, a mammal, an animal).[10.1.1.108.1064.pdf]
• Two phase Process1.Training/Learning• Learning is hard and time consuming• System must be exposed to several examples of each class• Creates a “model” for each class• Once learned, it becomes natural2.Detecting/Classifying[introductiontopatternrecognition-110316123301-phpapp02.pdf]//////1- التعليم : تبدأ بجمع صور لوجوه الموظفين وأخذ مميزات “feature extraction ” دقيقة تعتمدها لكل وجه مثل المسافة بين العينين أو أقصى مسافة بين جانبي الوجه أو غيرها من المميزات ومن الممكن أن تختار أكثر من مميز وتدخلها إلى النظام لتصبح كقاعدة بيانات لديه وتخزن بأن س من الناس له هذه المميزات بتلك المقاييس “انظر للصورة في الأسفل “.2- التمييز : عند وقوف احدهم امام الكميرا للدخول للشركة تلتلقط الكاميرا لوجهه صورة وتعالج بشكل أو بآخر ” من مشكلات الإضاء أو استدارة الرأس أو القرب والبعد وغيرها – فيما يعرف بـــpreprocessing “ ” – ومن ثم تقارن هذه المميزات بالمميزات المسجلة في قواعد البيانات فإذا تشابهت إلى حد كبير مع احد المميزات الموجودة فقد تعرف النظام عليها وتكون لأحد الموظفين وإلا فلا . .. فكر الآن في عدة أمور . . . ما مقدار التشابه بين المميزات هل هناك مقدار بسيط يُسمح به ؟هل عدد الوجوه للشخص الواحد بظروف الإضاءة المختلفة مثلا وتدريب النظام عليها تزيد الدقة ؟هل من الممكن خداع النظام بوجه مشابه ؟كل هذه الأسئلة يجب أن تسأل لاختيار النظام المناسب وتجهيزه بالشكل الذي يراعي الدقة وسولة الاستخدام؟
The design of a pattern recognition system essentially involves the following four aspects:(i) data acquisition and preprocessing, e.g., taking a picture of an object and removing the irrelevant background,(ii) data representation, e.g. deriving relevant object properties (like its size, shape and color) which efficiently offer pertinent information needed for pattern recognition,(iii) training, e.g., imparting pattern class definition into the system, often, by showing a few typical examples of the pattern, and (iv) decision-making that involves finding the pattern class or pattern description of new, unseen objects based on a training set of examples. [10.1.1.108.1064.pdf]
Data acquisition and sensing:Measurements of physical variables.Important issues: bandwidth, resolution , etc.Pre-processing:Removal of noise in data.Isolation of patterns of interest from the background.Feature extraction:Finding a new representation in terms of features.ClassificationUsing features and learned models to assign a pattern to a category.Post-processingEvaluation of confidence in decisions.:[talalalsubaie-1220737011220266-9.ppt]
1- التدريب ” training” : والهدف منها بناء نموذج يمثل نتائج البيانات التي تم تدريب النظام عليها فكما هو ملاحظ في الصورة ” من اليمين “:ا- جمع البيانات المراد تدريب النظام عليها : نجمع صور الموظفين !ب- القيام بعمليات فلترة أوعمليات اخرى ” مثلا في حال تمييز الوجه ” نعالج مشكلة الإضاءة المختلفة والاستدارة والحجم و غيرها : نأخذ الصور للموظفين بوضعية متشابهة وبنفس البعد عن الكاميرا وبنفس الإضاءة – قدر المستطاع – ونقوم ببعض عمليات الفلترة وتحديد شكل الرأس ونعالج بعض المشاكل إن وجدتج- اختيار الخصائص التي تميز كل عينة كما في الصورة مثلا ,وقد تستطيع أخذ مميزات تراها أنت دقيقة وهذا ما يجعل تطبيقك مختلفا عن الآخرين فقد تعتمد مميزات للوجه تزيد نسبة الدقة أكثر كما في الــ 3D face recognition التي اعتمدت بالاضافة للميزات السابقة مميزات أخرى تعتمد على المسافة بين ” مثلا ” البعد بين العينين والانف إذا أخذت بالبعد كمحور عمودي على الوجه !فيكون لدينا نموذج يمثل بيانات التدريب للنظام وسيرجع إليه النظام في الخطوة التالية لعمل الـــ “matching”.2- التمييز “recognition or test” : يتم الآن اختبار النظام وفي هذه الخطوة يتم التعرف على الأشياء وفق هذه الخطوات:ا- ادخال العينة المراد التعرف عليها : مثل صورة الوجه أو الصوت المراد التعرف عليه أو صورة لقزحية العين أو غير ذلك حسب النظامب- القيام بعمليات فلترة أوعمليات اخرى ” مثلا في حال تمييز الوجه ” نعالج نشكلة الإضاءة المختلفة والاستدارة والحجم و غيرها.ج- اختيار الخصائص وانتزاعها من الصورة وفق نفس المعادلة التي طبقت في مرحلة التدريب.د- في هذه المرحلة بالضبط يحدث التعرف والتمييز وذلك بتصنيف العينة التي تم إدخالها إلى الأنواع التي تم تدريب النظام عليها فتحصل مقارنة بين العينة المدخلة وجميع عينات التددريب بطرق بحث وخوارزميات تراعي الدقة والسرعة.
What is a Pattern Class (or category)?– is a set of patterns sharing common attributes– a collection of “similar”, not necessarily identical, objects– During recognition, given objects are assigned to a prescribed class[introductiontopatternrecognition-110316123301-phpapp02.pdf]
Supervised Training/Learning [introductiontopatternrecognition-110316123301-phpapp02.pdf]– a “teacher” provides labeled training sets, used to train a classifier
Unsupervised Training/Learning [introductiontopatternrecognition-110316123301-phpapp02.pdf]– No labeled training sets are provided– System applies a specified clustering/grouping criteria to unlabeled dataset– Clusters/groups together “most similar” objects (according to given criteria)
Template matching:Match with stored template considering translation, rotation and scale changes; measure similarity (correlation) based on training set.Statistical classification:Each pattern is represented in terms of d features(measurements) andViewed as a point in a d-dimensional space. using training sets establish decision boundaries in the feature space - following decision theoretic or discriminate analysis approaches.Syntactic or structural matching: complex pattern is composed of sub-patterns and the relations; they themselves are built from simpler / elementary sub-patterns are called primitives. the patterns are viewed as sentences belonging to a language, primitives are viewed as the alphabet of the language. the sentences are generated according to a grammar. a large collection of complex patterns can be described by a small number of primitives and grammatical rules. the grammar for each pattern class are inferred from the training samples.neural networks:are viewed as weighted directed graphs in which the nodes are artificial neurons and directed edges (with weights) are connections between neurons input-output. neural networks have the ability to learn complex nonlinear input-output relationships from the sequential training procedures, and adapt themselves to input data.
(Template-Matching and Correlation Method) طريقة المطابقة القالبية(templates) مرحلة التعليم في هذه الطريقة تقوم على تخزين مجموعة من القوالبقالب من كل صنف في الحاسوب ويوضح الشكل رقم ( 3) القوالب (prototypes) أو النماذج. [ المدخلة المراد تمييزها مع القوالب المصدر المخزونة داخل الحاسبة [في مرحلة التصنيف تقارن الصورة الداخلةY أكبر من نتيجة مقارنتها مع الصنف X فإن كانت نتيجة مقارنتها مع الصنف (template)حيث تحسب درجة الاختلاف بين الصورتين وتقارن بقيمة X فإنها تصنف ضمن الصنفوإذا تجاوزت درجة الاختلاف قيمة .(threshold value) محددة سلفا تسمى قيمة العتبةالعتبة، فهذا يعني إن الصورتين غير متشابهتين وبعكسه يعني إن الصورتين متشابهتان أومتطابقتان. وقد تم استخدام هذه الطريقة في تمييز الحروف المطبوعة وقراءة صكوك البنوكوهكذا [ 9]. يوضح الشكل رقم ( 4) علمية التصنيف بالحاسبة.تتم عملية المقارنة بإدخال صورة الحرف على شكل مصفوفة ذات بعدين وتقارن معفإذا كانت نسبة الخطأ ضمن منطقة pixel by pixel القوالب المخزونة في ملف بالحاسبة1-,1 ) فان الحرف يطابق هذا الحرف أما إذا كانت اكبر ) (threshold value) مدى العتبةفان الحرف لا يتطابق. أما المطابقة بالنسبة للصور فتؤخذ الصورة المقطع وتقارن معالصورة الكبيرة وكما في الإشكال ( 4,3 ) حيث تجري عملية تمرير الصورة المقطع علىالصورة الكبيرة ومن البداية إلى النهاية باستخدام اللافوف الرياضي إلى إن يتم إيجاد منطقةمشابهه للمقطع أو لا. وتتم عملية المقارنة ببساطة بخزن الصورة الداخلة على شكل مصفوفةثم تقارن مع القوالب الموجودة في الحاسوب وتعطي قيمة للمقارنة [ 2,3,7 ]. تعد هذه الطريقةطريقة سهلة جدًا، والصعوبة الوحيدة في هذه الطريقة هي الاختيار الجيد للقوالب من كلصنف فض ً لا عن تحديد معايير المقارنة وخصوصًا لو كانت الصورة الداخلة تحمل تشوهات!فمث ُ لا لو استخدمنا هذه الطريقة للتعرف على المجرمين، لابد أن نأخذ لكل مجرم عدة لقطاتكي تخزن على جهاز الحاسوب لقطتان جانبيتان واحدة من كل جهة، لقطة أمامية، ولقطتانبزاوية نظر 45 درجة عن الكاميرا. ولكم أن تتخيلوا المساحات التخزينية اللازمة لكل هذهالقوالب !.(correlation) الترابطلمعرفة أو تحديد ما إذا كانت الصورة تحتوي على منطقة مشابهة لمنطقة ما، فانM*N ذات مقياس F(x,y) الترابط هو إحدى الطرق المستخدمة. فمث ً لا لدينا صورة رقميةW(x,y) وإننا نريد أن نحدد ما إذا كانت هذه الصورة تحتوي على منطقة مشابهة لمنطقة ماF(x,y), W(x,y) سنستخدم الترابط بين هاتين المنطقتين K<N و J<M حيث J*K ذات قياسكما في المعادلة الآتية:R(m,n)= ΣΣ − −x yf (x, y).w(x m, y n) .............(1حيثn=0,1,2….N-1, m=0,1,2……M-1نطبق المعادلة رقم ( 1) للحصول على F(x,y) داخل (m,n) من اجل أية قيمة لفي أرجاء منطقة الصورة باستخدام W(x,y) تتحرك n,mومع تغير R قيمة واحدة لR(m,n) بعدئذ تدل القيمة العظمى ل R(m,n) اللافوف الرياضي ونحصل عندئذ على الدالةوان عملية المسح تكون كما F(x,y) مع W(x,y) على الموضع الذي تطابقت فيه الصورتانفي الشكلين التاليين رقم ( 5,6 ) حيث يوضحان عملية المسح للصورة باستخدام اللافوفالرياضي [ 1,6,8 ]. على الرغم من إن دالة الترابط في معادلة ( 1) سهلة في طبيعتها إلا أنهناك دالة ( 2) وهي أكفأ في استعمالها وهي على النحو الآتي:ΣΣ[ ( , ) − ( , )]2.ΣΣ[ ( − , − ) − ]2 ]1/ 2x y x yf x y f x y w x m y n wR(m,n)حيثn=0,1,2….N-1,m=0,1,2……M-1هو متوسط الشدة للقالب (تحسب هذه القيمة مرة واحدة) Ww(x,y) في المنطقة المتطابقة مع f(x,y) هي متوسط القيمة ل f (x,y)تكون ضمن المدى (- 1، 1 ) حيث القيم الموجبة العالية تدل على R(m,n) إن قيمةأن الترابط موجب وعال بين الصورتين والقيم السالبة العالية تدل على أن الترابط سالبوعال بين الصورتين في حين إن القيم القريبة من الصفر تدل على انعدام الترابط بينإذ تكون هذه Source لنافذة معينة من صورة ال R(m,n) الصورتين. يتم حساب قيمةعلى صورة template وبعدها يتم تزحيف صورة ال template النافذة بحجم صورة ال. ( كما في الشكل ( 7 R(m,n) وتحسب قيمة Source ال(convolution) اللافوف الرياضيحيث يتم تحديد إطار للصورة من الصف الأول والأخير والعمود الأول والأخيرووضع النافذة على الصورة ابتداء من العنصر الأول كما في الشكلين التاليين ( 6,5 ) أي إنالطريقة تقوم بمطابقة ثنائية بين عناصر الصورة الكبيرة وعناصر الصورة الصغيرة أو النافذة.ثم نتقدم بالنافذة إلى اليمين وبمقدار عنصر واحد فقط وتعاد عملية مقارنة عناصر النافذة مععناصر الصورة الكبيرة وهكذا حتى نهاية الصف ، بعدها يتم الانتقال إلى الصف التالي لتعاد.[ العملية ، وهكذا إلى نهاية الصورة الكبيرة [ 4
في هذه الطريقة، يوصّف كل pattern بواسطة مجموعة من الخصائص set of features والتي من الممكن أن نعبر عنها بقيم حقيقية. في مرحلة التعلم: يقدّم كل نمط pattern كمتجه من الخصائص feature vector كما توضح الصورة:
أما في مرحلة التعرف او التمييز أو التصنيف، فهذه عادة تتم عن طريق تقسيم مساحة الصورة إلى مناطق مجزأة، كل منطقة تقارن مع صنف كما توضح الصورة:فمثلاً لو كنّا نريد التعرف على صورة تفاحة، ماهي خصائص التفاحة التي نخزنها في مرحلة التعلم؟! هي على سبيل المثال: اللون، الشكل، الدوران، المنطقة السفى، المنطقة العليا.... ألخ. وكذلك يتم التعرف على التفاحة، تقسم الصورة إلى أجزاء وكل جزأ نقارن الخصائص الموجودة فيه مع خصائص الصنف المخزنة وهكذا.الصعوبة هنا هي في اختيار مجموعة الخصائص لكل فئة وقواعد القرار في التعرف على النمط.