Download Activation Power =0*1 + 1*1.9 + 0*1 = 1.9

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
‫אלגוריתם ‪Back Propagation‬‬
‫• הרעיון‪:‬‬
‫* בהתחלה משקלות אקראיים‬
‫* בשלב האימון מציגים דוגמאות‬
‫* כל דוגמא מכילה קלט ופלט תואם‬
‫* שינוי המשקלות‬
‫* לאחר אימון הרשת חוזה טוב‬
‫‪1‬‬
‫דוגמא‪ :‬איתור הונאות בתחום הטלקומוניקציה‬
‫• שלב האימון‪:‬‬
‫* ייבנו אוסף רשומות שיחות טלפון המייצגות מקרי‬
‫הונאה ואי הונאה‬
‫* רשומות אלה מהוות את קבוצת האימון‬
‫* מציינים מהם משתני הקלט ומהם משתני הפלט‬
‫* למשל‪ :‬קלטים ‪-‬‬
‫* משך שיחה‬
‫* יעדים‬
‫* זמן שיחה‬
‫‪2‬‬
‫איתור הונאות בתחום הטלקומוניקציה‬
‫* מפעילים את האלגוריתם‬
‫‪3‬‬
‫איתור הונאות בתחום הטלקומוניקציה‬
‫• לאחר האימון ‪ -‬הרשת מוצאת ?‬
‫• שלב השימוש‪? :‬‬
‫‪4‬‬
” ‫ “העברה לאחור‬:‫דוגמא לאלגוריתם‬
(Backward Propagation Algorithm)
O
T
Repeat
For each e in example do
Neural Network Output for e
Target Output value from e
•
•
•
•
Update the weights (Wj) in the network •
based on T - O •
End •
Until Stopping condition is •
reached
5
‫דוגמא לאלגוריתם‪“ :‬העברה לאחור ”‬
‫‪(Backward Propagation Algorithm‬‬
‫• עדכון המשקלות‪:‬‬
‫• ‪Err = T - O‬‬
‫• )‪(Wj = Wj + a * (Ij * Err‬‬
‫• כאשר ‪ a‬הנו מקדם קצב הלמידה‬
‫‪6‬‬
‫דוגמא‪-‬חיזוי פשיטת רגל ע"פ גיל‬
‫המנהל‬
‫• הרשת חוזה ע"ס גיל המנכ"ל‬
‫(‪ 25-0‬צעיר‪ 40-26 ,‬בוגר‪ + 41,‬זקן)‬
‫האם תהיה פשיטת רגל (‪ )1‬או לא (‪)0‬‬
‫• עבור משתנה הקלט "גיל" נקצה ‪ 3‬נוירוני קלט ‪-‬‬
‫* צעיר‪ 1 :‬בנוירון העליון‬
‫* בוגר‪ 1 :‬בנוירון האמצעי‬
‫* זקן‪ 1 :‬בנוירון התחתון‬
‫• עבור משתנה הפלט נקצה נוירון אחד ויחיד‬
‫ערך ‪( 0‬אין פשיטת רגל) או ‪1‬‬
‫שיקבל‪:‬‬
‫(יש פשיטת רגל)‬
‫‪7‬‬
‫דוגמא‪-‬חיזוי פשיטת רגל ע"פ גיל‬
‫המנהל‬
‫• נאמן את הרשת עם קבוצת אימון אחת מסוימת‪:‬‬
‫קלט‪ :‬מנהל בגיל ‪( 38‬בוגר) (‪ )0,1,0‬כאשר הפלט‪ :‬אין‬
‫פשיטת רגל (‪)0‬‬
‫• מאחר והנוירון בשכבת הפלט "ירה" ‪ 1‬ולא ‪0‬‬
‫השגיאה הינה‪Err=0-1=-1 :‬‬
‫• כעת האלגוריתם משנה את המשקלות בהתאם לשגיאה‬
‫‪8‬‬
‫דוגמא להתאמת המשקלות בצמתים בחיזוי פשיטת רגל ע"פ‬
‫גיל המנהל‬
‫גיל‬
0
W1=1
Activation Power =0*1 + 1*2 + 0*1 = 2
T=1.95
Activation Power =1*0.5 + 1*0.5 = 1
1
Out=1
W2=2
W4=0.5
W3=1
0
W5=1
W7=0.5
T=0.5
Out=1
Out=1
W6=0
Activation Power =0*0.5 + 1*1 + 0*0 =1
T=0.5
9
1
W8=0.5
‫מצב‬
‫שגיאה‬
‫התאמת משקלות בצמתים – קבוצת אימון‬
‫אחת‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫)‪(Wj = Wj + a * (Ij * Err‬‬
‫מקדם הלמידה ‪a = 0.1 :‬‬
‫‪W1=1+0.1*(0*(-1))=1‬‬
‫‪W2=2+0.1*(1*(-1))=1.9‬‬
‫‪W3=1+0.1*(0*(-1))=1‬‬
‫‪W4=0.5+0.1*(0* (-1))=0.5‬‬
‫‪W5=1+0.1*(1*(-1))=0.9‬‬
‫‪W6=0+0.1*(0*(-1))=0‬‬
‫‪W7=0.5+0.1*(1*(-1))=0.4‬‬
‫‪W8=0.5+0.1*(1*(-1))=0.4‬‬
‫‪10‬‬
‫דוגמא להתאמת המשקלות בצמתים בחיזוי פשיטת רגל ע"פ‬
‫גיל המנהל‬
‫גיל‬
0
W1=1
Activation Power =0*1 + 1*1.9 + 0*1 = 1.9
T=1.95
Activation Power =0*0.4 + 1*0.4 = 0.4
1
Out=0
W2=1.9
W4=0.5
W3=1
0
W5=0.9
W7=0.4
T=0.5
Out=0
Out=1
W6=0
Activation Power =0*0.5 + 1*0.9 + 0*0 =0.9
T=0.5
11
0
W8=0.4
‫מצב‬
‫תקין‬
‫רשת עצבית לסיווג רוכשי מכוניות‬
‫‪12‬‬
‫רשת עצבית לסיווג רוכשי מכוניות‬
‫• מטרת הרשת‪ :‬לנבות אילו לקוחות יקנו איזה‬
‫מכונית‬
‫• הסיווג מתבסס על ‪ 4‬פרמטרים‪:‬‬
‫* גיל (‪ 3‬טווחים)‬
‫* קיום מכונית‬
‫* השכלה אקדמית (כן‪/‬לא)‬
‫* רמת הכנסה (‪ 2‬טווחים)‬
‫‪13‬‬
‫שקלול הקלטים בצומת‬
‫‪14‬‬
‫רשת עצבית במצב קידוד‬
‫‪15‬‬
‫מתי נשתמש ברשת עצבית‬
‫•‬
‫•‬
‫•‬
‫•‬
‫לא ניתן לבטא את משתנה הפלט כפונקציה‬
‫ליניארית לדוגמא‪Y = aX1 + bX2 + cX3 … :‬‬
‫נתונים לא אמינים‬
‫נתונים חסרים‬
‫שאר הטכניקות לא הגיעו לדיוק‬
‫‪16‬‬
‫יתרונות וחסרונות בשימוש ברשת‬
‫עצבית‬
‫• יתרון‪ :‬תוצאות חיזוי‪/‬סיווג טובות‬
‫• חסרונות‪:‬‬
‫* תוצאות קשות להסבר‬
‫* "קופסא שחורה"‬
‫* תהליך האימון ארוך‬
‫‪17‬‬
Clustering
18
K-Means Node
19
Clusters Generation
20
Clusters Generation
21
Clusters Generation
22
Attributing each customer to a cluster
23
Distribution of each cluster overlay age
24
‫אלגוריתם ליצירת אשכולות‬
‫‪25‬‬
‫המשך‬
‫‪26‬‬
Association Rules
27
‫הגדרת קובץ נתונים‬
‫‪28‬‬
Apriori Node
29
Association Rules
30
Generate Rule Set
31
Rule set for Sour_Cream
32
Rule set for Sour_Cream
33
‫התפלגות צרכני השמנת ע"פ גיל‬
‫‪34‬‬
‫התפלגות צרכני השמנת ע"פ גיל‬
‫‪35‬‬
‫יתרונות וחסרונות של טכניקות‪/‬מודלים‬
‫‪36‬‬
‫תהליך כריית הנתונים‬
‫• ‪ 80%‬מאמץ בהכנת הנתונים‬
‫• ‪ 20%‬מאמץ בתהליך כריית הנתונים עצמו‬
‫‪37‬‬
‫תהליך כריית הנתונים‬
‫‪38‬‬
‫שלבים בתהליך כריית נתונים‬
‫‪ .1‬הגדרת מרחב הבעיה‬
‫)‪(Problem Formulation‬‬
‫‪39‬‬
‫שלבים בתהליך כריית נתונים‬
‫‪ .2‬הכנת סביבת העבודה‬
‫)‪(Data Mining Environment Setup‬‬
‫וודא ‪-‬‬
‫* זמינות החומרה‬
‫* זמינות התוכנה‬
‫* זמינות רשת התקשורת‬
‫* זמינות כלי כריית הנתונים‬
‫‪40‬‬
‫שלבים בתהליך כריית נתונים‬
‫‪ .3‬איתור וגזירת הנתונים‬
‫)‪(Data Selection‬‬
‫* מיפוי נתונים הקיימים ‪ -‬מחסן ‪ /‬מערכות‬
‫תפעוליות‬
‫* הערכת איכות וזמינות הנתונים‬
‫* הכנת תוכניות הגזירה למחסן משנה‬
‫‪41‬‬
‫שלבים בתהליך כריית נתונים‬
‫‪ .4‬ניקוי הנתונים‬
‫)‪(Data Cleaning‬‬
‫‪ .5‬העשרת הנתונים‬
‫)‪(Data Enrichment‬‬
‫‪42‬‬
‫שלבים בתהליך כריית נתונים‬
‫‪ .6‬קידוד הנתונים‬
‫)‪(Data Coding‬‬
‫במה זה תלוי ?‬
‫‪43‬‬
‫שלבים בתהליך כריית נתונים‬
‫‪ .7‬כריית הנתונים )‪(Data Mining‬‬
‫* לב התהליך‬
‫* גילוי‬
‫* יש להחליט ‪-‬‬
‫ טכניקה‬‫ אלגוריתם‬‫ כלים מחשוביים‬‫‪44‬‬
‫שלבים בתהליך כריית נתונים‬
‫‪ .8‬דיווח )‪(Reporting‬‬
‫ ניתוח ממצאים‬‫ סיכום תוצאות‬‫ גיבוש דרכי הצגה‬‫ הצגה למקבלי החלטות‬‫‪45‬‬
‫אינטגרציה בין מחסן הנתונים לכריית‬
‫הנתונים‬
‫‪46‬‬
‫בעיות בכריית נתונים‬
‫רגישות לאיכות נתונים –‬
‫שימוש בנתונים ‪-‬‬
‫* לא אמינים‬
‫* לא שלמים‬
‫* לא איכותיים‬
‫‪47‬‬
‫בעיות בכריית נתונים‬
‫• העדר נתונים מספיקים –‬
‫ השגה ממערכות חיצוניות‬‫ דוגמא‪ :‬נתוני ספירת כדוריות דם‬‫אדומות‬
‫נתוני הכנסה‬
‫‪48‬‬
‫בעיות בכריית נתונים‬
‫• העדר היכולת להסביר את‬
‫התוצאות‬
‫‪49‬‬
‫בעיות עיקריות בכריית הנתונים‬
‫• מבנה נתונים ייחודי –‬
‫ כלים לא פועל ישירות על מחסן‬‫‪ -‬הזדקקות למבנים מיוחדים‬
‫‪50‬‬
‫בעיות‬
‫ביצועים‬
‫ כלים מוגבלים בגודל קבצי הקלט‬‫‪ -‬מדגם קטן מביא לאי דיוק‬
‫‪51‬‬
‫בעיות‬
‫• קושי בהצדקת עלות הפרויקט‬
‫קושי להתחייב מראש לגבי תוצאות‬
‫התהליך‬
‫‪52‬‬
‫סוף דבר‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫כריית נתונים ‪ -‬מקום כבוד‬
‫כריית נתונים ‪ -‬בפסגת התהליכים‬
‫האנליטיים‬
‫ככל שנפח הנתונים יגדל כך יגדל הצורך‬
‫בכריית נתונים‬
‫כריית הנתונים משלימה את טכניקות‬
‫ מחוללי שאילתות ומוצרי ‪OLAP‬‬‫כריית נתונים מוסיף ליכולת ניתוח המידע‬
‫‪53‬‬
Related documents
1. מבוא לכריית מידע
1. מבוא לכריית מידע