המרדף אחר יצירתיות יכול להפוך את האלגוריתמים לחכמים הרבה יותר


אפשר לראות את הפוטנציאל של אבן המדרגה על ידי אנלוגיה להתפתחות ביולוגית. בטבע, לעץ החיים אין מטרה כללית, ותכונות המשמשות לפונקציה אחת עשויות למצוא את עצמן מתגייסות למשהו אחר לגמרי. נוצות, למשל, התפתחו ככל הנראה לבידוד ורק לאחר מכן היו שימושיות לטיסה.

האבולוציה הביולוגית היא גם המערכת היחידה לייצר אינטליגנציה אנושית, שהיא החלום האולטימטיבי של חוקרי AI רבים. בגלל הרקורד של הביולוגיה, סטנלי ואחרים האמינו שאם אנו רוצים אלגוריתמים שיכולים לנווט בעולם הפיזי והחברתי באותה קלות – או יותר טוב! – עלינו לחקות את הטקטיקות של הטבע. במקום קידוד קשה של כללי ההיגיון, או שהמחשבים ילמדו להבקיע טוב מאוד על מדדי ביצועים ספציפיים, הם טוענים, עלינו לתת לאוכלוסיית הפתרונות לפרוח. תן להם לתעדף חידוש או מעניין במקום את היכולת ללכת או לדבר. הם עשויים לגלות שביל עקיף, קבוצה של אבני מדרכה, ולסיים את ההליכה והדיבורים טוב יותר מאשר אם היו מחפשים את הכישורים האלה ישירות.

חדש, מעניין, מגוון

אחרי Picbreeder, סטנלי התכוונה להפגין כי התפתחות עצבית יכולה להתגבר על הטענה הברורה ביותר נגדה: "אם אני מנהל אלגוריתם יצירתי במידה כזו שאני לא בטוח מה זה יניב," הוא אמר, "זה מאוד מעניין מבחינה מחקרית, אבל זה קשה יותר למכור מבחינה מסחרית. "

הוא קיווה להראות שעל ידי פשוט לעקוב אחר רעיונות לכיוונים מעניינים, האלגוריתמים לא יכולים רק לייצר מגוון של תוצאות, אלא לפתור בעיות. באופן נועז יותר, הוא התכוון להראות שהתעלמות מוחלטת מיעד יכולה להביא אותך לשם מהר יותר מאשר לרדוף אחריו. הוא עשה זאת באמצעות גישה שנקראה חיפוש חידוש.

המערכת התחילה עם רשת עצבית, שהיא סידור של אלמנטים מחשוביים קטנים הנקראים נוירונים המחוברים בשכבות. הפלט של שכבה אחת של נוירונים מועבר לשכבה הבאה באמצעות חיבורים עם "משקולות" שונות. בדוגמה פשוטה, נתוני קלט כמו תמונה עשויים להזין לרשת העצבית. ככל שהמידע מהתמונה מועבר משכבה לשכבה, הרשת מוציאה מידע מופשט יותר ויותר על תוכנו. בסופו של דבר, שכבה סופית מחשבת את המידע ברמה הגבוהה ביותר: תווית לתמונה.

עבור קנת סטנלי, מדען מחשבים במעבדות Uber AI ובאוניברסיטת מרכז פלורידה, עקרון המדרגות מסביר חדשנות.צילום: אסא מתת

בהתפתחות עצבית מתחילים בהקצאת ערכים אקראיים למשקלים בין שכבות. פירוש אקראיות זה שהרשת לא תהיה טובה מאוד בעבודה שלה. אבל ממצב סליחה זה, אתה יוצר קבוצה של מוטציות אקראיות – רשתות עצביות צאצאים עם משקולות שונות במקצת – ומעריכים את יכולותיהם. אתה שומר על הטובים ביותר, מייצר יותר צאצאים וחוזר על עצמו. (אסטרטגיות נוירו-התפתחות מתקדמות יותר יכניסו גם מוטציות במספר וסידור הנוירונים והחיבורים.) Neuroevolution הוא מטה-אלגוריתם, אלגוריתם לעיצוב אלגוריתמים. ובסופו של דבר האלגוריתמים מקבלים די טוב בעבודתם.

כדי לבחון את עקרון המדרגה, סטנלי ותלמידו ג'ואל להמן צייצו את תהליך הבחירה. במקום לבחור את הרשתות שהביאו את הביצועים הטובים ביותר במשימה, חיפוש חידושים בחר בהן עד כמה הן שונות מאלה עם ההתנהגויות הדומות ביותר לשלהן. (בפיקבריידר אנשים גמלו עניין. כאן, כמתנה למעניין, חיפוש חידושים גמל חידוש.)

למד עוד

בבדיקה אחת הם הציבו רובוטים גלגלים וירטואליים במבוך ופיתחו את האלגוריתמים השולטים בהם, בתקווה שאחד ימצא דרך ליציאה. הם ניהלו את האבולוציה מאפס 40 פעמים. תוכנית השוואה, בה נבחרו רובוטים לכמה קרובים (ככל שהעורב עף) הם הגיעו ליציאה, פיתחה רובוט מנצח רק 3 מתוך 40 פעמים. חיפוש חידושים, שהתעלם לחלוטין מכמה קרוב כל בוט ליציאה, הצליח 39 פעמים. זה עבד מכיוון שהבוטים הצליחו להימנע ממבוי סתום. במקום להתייצב מול היציאה ולהכות את ראשן בקיר, הם חקרו טריטוריה לא מוכרת, מצאו דרכים לעקיפת הדרך וניצחו במקרה. "חיפוש חידושים הוא חשוב מכיוון שהוא הפנה את הכל על ראשו," אמר ג'וליאן טוגליוס, מדען מחשבים מאוניברסיטת ניו יורק, "וביסודו שאל מה קורה כשאין לנו מטרה."