התנהגות | בבלי

עוד כתבות על התנהגות:

ללא תכונות שליליות. הדמיית רובוט ידידותי

הקץ לאנטישמיות בבינה מלאכותית?

חוקרים הציגו "חיסון התנהגותי" המונע מהבינה המלאכותית לאמץ תכונות מזיקות

אבישי לוי|05.08.25

מחקר חדש של חברת Anthropic חושף שיטה חדשנית המאפשרת "להנדס" אישיות של מודלים מתקדמים באמצעות וקטורים ייעודיים – ובכך למנוע מראש התבססות של תכונות כמו רשעות, חנופה או הזיות בתחומי הבינה המלאכותית. השיטה מספקת הגנה כפולה: היא מאפשרת לנטר שינויים מסוכנים באישיות המודל, לאתר מוקדם בעיות בתהליך הלמידה – ולמתן בעיות לפני שהן גולשות לעולם האמיתי (טכנולוגיה)

לעוד כתבות

אולי יעניין אותך

פנו אלינו

כל הזכויות שמורות לבבלי בע״מ

מדיניות פרטיות תנאי שימוש נגישות אתר