היווצרותחינוך ובתי ספר תיכוניים

שיטת השכן הקרוב ביותר: למשל עבודה

שיטת השכן הקרובה ביותר היא המסווג מטרי הקלה אשר מבוסס על ההערכה של הדמיון של חפצים שונים.

אובייקט נתח משתייך אליה הם משתייכים בנושאים של מדגם אימונים. בואו לגלות שהוא השכן הקרוב ביותר. נסה להבין את העניין המסובך, דוגמאות של טכניקות שונות.

שיטת שערה

שיטת השכן הקרוב ביותר יכול להיחשב האלגוריתם הנפוץ ביותר בשימוש עבור הסיווג. Object עוברת סיווג משתייכת y_i, שאליה האובייקט הקרוב למידה מדגם x_i.

סגולי של שיטות שכנות הקרוב ביותר

k שיטת שכן קרובה יכול לשפר את הדיוק של סיווג. אובייקט נתח שייך באותה הכיתה כמו רוב שכנותיה, כלומר, k הקרוב אליו אובייקטים של x_i המדגם נתח. בפתרון בעיות עם שתי כיתות של מספר שכנים יהיו מוזר כדי למנוע מצב של עמימות, אם אותו המספר של שכנים יהיה שייך לסוגים שונים.

הטכניקה של שכנים מושעים

שיטה-נתח PostgreSQL tsvector שכנים הקרוב ביותר משמשת כאשר מספר הכיתות לפחות שלוש, ואתה לא יכול להשתמש מספר אי זוגי. אבל העמימות נובעת גם במקרים אלה. ואז, השכן-ה i מקבל משקל w_i, אשר מקטין בדרגת השכן i. זה מתייחס למעמד של האובייקט, אשר יהיה משקל כולל מרבי בין שכנים קרובים.

ההשערה של קומפקטיות

בליבה של כל אחת מהשיטות הנ"ל הוא ההשערה של קומפקטיות. הוא רומז על קשר בין מידת הדמיון של חפצים השייכים שלהם באותה הכיתה. במצב זה, את הגבול בין הסוגים השונים הוא צורה פשוטה, וליצור כיתות של אובייקטים באזור נייד קומפקטי החלל. תחת בתחומים כגון ניתוח מתמטי כאילו כוונתו קבוצה חסומה סגורה. השערה זו אינה קשורה לתפיסה היומיומית של המילה.

הנוסחה הבסיסית

הבה נבחנו שכן קרוב יותר. אם סוג מדגם האימון המוצע "חפץ-תגובה» X ^ מ = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; אם ריבוי של עצמים להגדיר את Rho מרחק הפונקציה \ (x, x "), מיוצג בצורה של דמיון מודל נאות של אובייקטים על ידי הגדלת הערך של הפונקציה יורד דמיון בין עצמי x, x".

עבור כל אובייקט, u בנה מדגם הכשרת אובייקטי x_i עם הגדלת מרחקי u:

\ Rho (u, x_ {1; u}) \ leq \ rho (u, x_ {2; u}) \ leq \ cdots \ leq \ rho (u, x_ {m; u}),

איפה x_ {i; u} שמאפיין המדגם למידה האובייקט, אשר הוא חפץ מקור השכן i-ה u. סימון ושימוש כאמור להשיב i-ה השכן: y_ {i; u}. כתוצאה מכך, אנו מוצאים כי כל אובייקט u מעורר מספור מחדש מדגם משלו.

קביעת k מספר שכנים

שיטת שכן קרובה כאשר k = 1 הוא מסוגל לתת סיווג מוטעה, לא רק על אובייקטים-פליטות, אלא גם עבור שיעורים אחרים כי הם קרובים.

אם ניקח k = m, האלגוריתם יהיה כמו יציבה יידרדר עד ערך קבוע. לכן האמינות חשובה להימנע k מדדים קיצוניים.

בפועל, כמו k המדד האופטימלי קריטריון המשמש זזה מלאה.

פליטת הקרנות

האובייקטים של מחקר הם שלרוב אינם שווים, אך ביניהם יש כאלה שיש להם את המאפיינים של כיתה מכונים סטנדרטים. בשעת הקרב של הנושא למודל האידיאלי של הסתברות הגבוהה של השתייכות למעמד הזה.

איך rezultativen שיטת השכנים הקרובים ביותר? דוגמא לכך ניתן לראות על פי קטגוריות פריפריה ולא אינפורמטיבי של אובייקטים. ההנחה היא סביבה צפופה של נציגים חפצו האחרים של המעמד הזה. כאשר אתה מסיר אותם מסיווג הדגימה באיכות לא תסבול.

קבל לתוך מספר מסוים של דגימות רשאיות התפרצויות רעש כי הם "על הקרקע" של כיתה. הסרת השפעה חיובית משמעותי על איכות הסיווג.

אם המדגם שנלקח חפצים רעש אינפורמטיבי ו לחסל, אתה יכול לסמוך על כמה תוצאות חיוביות בעת ובעונה אחת.

הראשון שיטת אינטרפולציה של סיווג השכן הקרוב מאפשרת לשפר את האיכות, להפחית את כמות נתונים מאוחסנים, לצמצם את הזמן של סיווג, אשר בילה על הבחירה של הסטנדרטים הבאים.

שימוש דגימות אולטרה-גדולות

שיטת שכן קרובה מבוססת על האחסון האמיתי של אובייקטים למידה. כדי ליצור דוגמאות מאוד בקנה מידה גדול באמצעות בעיה טכנית. המטרה היא לא רק כדי לחסוך כמות משמעותית של מידע, אלא גם את הסכום המינימלי של פעם שיהיה לי זמן למצוא כל אובייקט u k בקרב השכנים הקרובים.

כדי להתמודד עם משימה זו, שתי שיטות משמשות:

  • מדגם דליל באמצעות חפצים שאינם נתונים פריקים;
  • מבנה נתונים מיוחד ויעיל לשימוש וקודים עבור חיפוש מיידי של השכנים הקרובים ביותר.

כללים של שיטות בחירה

הסיווג מעל נחשב. שיטת השכן הקרובה ביותר נמצאת בשימוש בפתרון בעיות מעשיות, אשר ידוע מראש את Rho \ פונקצית המרחק (x, x "). בשנת חפצי המתאר וקטורים מספריים להשתמש בערך אוקלידית. אין ברירה זו הצדקה מיוחדת, אך כרוכה מדידת כל הסימנים "באותה המידה." אם גורם זה אינו נלקח בחשבון, אז מטרי יהיה דומיננטי תכונה שיש ערכים המספריים הגבוהים ביותר.

אם יש כמות משמעותית של תכונות, חישוב המרחק כסכום של סטיות על סימפטומים ספציפיים מופיעים מימד בעיה רצינית.

בחלל גבוה ממדי רחוק זה מזה יהיה כל האובייקטים. בסופו של דבר, כל מדגם יהיה שליד האובייקט נלמד k שכנים. הנבחרת מספר קטן של תכונות אינפורמטיבי לחסל את הבעיה הזו. אלגוריתמים לחישוב אומדנים לבנות על הבסיס של קבוצות שונות של סימנים, וכן כל אדם לבנות פונקצית הקרבה שלהם.

מסקנה

חישובים מתמטיים קרובות כרוכים בשימוש במגוון טכניקות כי יש מאפיינים משלהם, יתרונות וחסרונות ייחודיים. שיטת השכן הקרוב ביותר נצפו יכול לפתור די בעיה רצינית, בשל המאפיינים של אובייקטים מתמטיים. הקונספט הניסיוני, המבוסס על השיטה נתחה נמצא בשימוש פעיל בבינה מלאכותית.

במערכות המומחה זה הכרחי לא רק כדי לסווג עצמים, אלא גם להראות למשתמש הסבר על הסיווג מדובר. בשיטה זו, הסבר לתופעה זו בא לידי ביטוי ביחס לאובייקט מסוג מסוים, כמו גם את מיקומו ביחס המדגם המשמש. מומחים בתעשייה משפטיים, גיאולוגים, רופאים, לקחת היגיון "תקדים" זה פעיל להשתמש בו במחקריהם.

על מנת לנתח בשיטה הייתה הכי אמין, יעיל, נותן את התוצאות הרצויות, אתה חייב לקחת k הנתון מזערי, בעוד גם למנוע פליטה בין האובייקטים נתחו. לכן השימוש בסטנדרטים ואת שיטת הבחירה, כמו גם מדדי אופטימיזציה.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 iw.atomiyme.com. Theme powered by WordPress.