Exit cross icon

במרכז המערכת האקולוגית של AI של ימינו נמצאים דגמי יסוד ומערכות AI גנרטיביות (GenAI) היוצרות תפוקות חדשות על ידי למידה ממערכי נתונים מסיביים. מערכי נתונים אלה כוללים טקסט, תמונות, וידאו ומוזיקה, המאפשרים ל- GenAI ליצור תגובות דמויות אנושיות, הפניות תרבותיות וידע ספציפי לנושא.

בניגוד ללמידה אנושית, עם זאת, אימון AI כרוך בקליטת כמויות עצומות של תוכן המוגן בזכויות יוצרים. זה מעלה חששות גדולים לגבי הפרת זכויות יוצרים, רישוי ופיצוי כאשר דגמי AI משחזרים או מחקים מקרוב חומר מקורי.

אתגר זכויות היוצרים עבור בינה מלאכותית בקוד פתוח

יוצרי תוכן ובעלי זכויות יוצרים חוששים שהעבודה שלהם משמשת ללא רישיון או תשלום. מצד שני, רבים בתעשיית הבינה המלאכותית טוענים כי יש לאפשר אימון AI על תוכן זמין לציבור, מכיוון שבני אדם לומדים גם על ידי קריאת ספרים, צפייה בתוכניות וצריכת תרבות.

המתח טמון באופן שבו דגמי GenAI יכולים לרמיקס או לפעמים לשחזר תוכן המוגן בזכויות יוצרים. בעוד שבינה מלאכותית בדרך כלל אינה מפיקה נתוני הדרכה מילולית, יכולתו לזכור קטעים מאתגרת הנחות משפטיות לגבי שימוש הוגן ודיני זכויות יוצרים.

מדוע בינה מלאכותית בקוד פתוח חשובה

תוכנת קוד פתוח חוללה מהפכה בתעשיית הטכנולוגיה בכך שאפשרה שיתוף פעולה, חדשנות ותרומות כישרונות עולמיות. באופן דומה, מודלים של AI בקוד פתוח יכולים להאיץ חדשנות בין חברות סטארט-אפ, חברות קטנות ובינוניות וקהילות מחקר.

אבל דגמי ה- AI בעלי הביצועים הטובים ביותר כיום מאומנים בדרך כלל בנתונים המוגנים בזכויות יוצרים. אם הגישה למודלים ומערכי נתונים אלה תהיה מוגבלת למערכות סגורות וקנייניות, ההתקדמות של חדשנות בינה מלאכותית פתוחה עלולה להיחנק.

רישוי, שימוש מסחרי ותקני OSI

יוזמת הקוד הפתוח (OSI) עובדת על הגדרת רישיון AI המבטיחה שימוש מסחרי. עם זאת, יש מחסום מרכזי: אם מודלים של AI בקוד פתוח מאומנים ביצירות המוגנות בזכויות יוצרים, הם עשויים להיחשב יצירות נגזרות - מה שמגביל את האופן שבו ניתן להשתמש בהם באופן מסחרי.

  • חברות קטנות ובינוניות וסטארט-אפים: חסרים להם משאבים כדי לתת רישיון בנפרד למיליוני נקודות נתונים.
  • חברות טכנולוגיה גדולות: הן עשויות לתת רישיון לתוכן לשימושם האישי אך לא להרחיב זכויות אלה למשתמשים במורד הזרם.

זה יוצר מגרש משחק לא אחיד שבו מודלים של קוד פתוח מסתכנים ליפול מאחורי מודלים סגורים ומסחריים.

לקחים מפטנטים ותעשיית המוזיקה

מערכת הפטנטים בתוכנה נפתרה בחלקה באמצעות יוזמות כמו רשת ההמצאות הפתוחות, שם חברות איחדו פטנטים והציעו התחייבויות ללא קביעה להגן על פיתוח קוד פתוח. אך בניגוד לפטנטים, נתונים המוגנים בזכויות יוצרים הם בדרך כלל בבעלות צדדים שלישיים מחוץ לתעשיית הטכנולוגיה.

אנלוגיה קרובה יותר מגיעה מתעשיית המוזיקה. במשך עשרות שנים ארגוני זכויות ניהלו תמלוגים לביצועים באמצעות רישוי חובה. פלטפורמות סטרימינג כמו Spotify, Apple Music ו- YouTube משלמות כעת תמלוגים באמצעות מערכות מרכזיות. Content ID של YouTube מזהה חומר המוגן בזכויות יוצרים בקנה מידה גדול, ומבטיח כי התשלומים מופצים בצורה הוגנת.

מסגרת ניהול זכויות דומה לנתוני הדרכה של AI יכולה להבטיח שבעלי תוכן יקבלו פיצוי בכל פעם שמודלים שהוכשרו בעבודתם מייצרים הכנסות.

לקראת עתיד בינה מלאכותית בקוד פתוח בר קיימא

כדי ש- AI בקוד פתוח ישגשג, התעשייה זקוקה ל:

  • מסגרות רישוי ברורות לנתונים המוגנים בזכויות יוצרים.
  • מערכות תמלוגים או פיצוי הקשורות לשימוש במודל AI.
  • סטנדרטים גלובליים המאזנים בין חדשנות לבין הגנה על זכויות יוצרים.

ללא אלה, בינה מלאכותית בקוד פתוח מסתכן בצידה בעוד מודלים סגורים בבעלות תאגידית שולטים. פתרון הוגן יכול לשקף את המערכת האקולוגית של זכויות המוזיקה, ולקשר בין פיצויים לשימוש ולהכנסות במקום לחסום את הגישה לנתונים לחלוטין.

ד"ר עופר הרמוני

מייסד ומנהל AI ראשי

דוד אדלסון

מייסד ומנהל AI ראשי