פרק חדש ברגולציית הבינה המלאכותית
צילום: DALL=E
ה EU AI Act, הצעת החוק המשמעותית ביותר בעולם כעת הנוגעת לבינה מלאכותית, עברה ביום שישי שלב אישור קריטי נוסף, כשנציגי מדינות האיחוד האירופי אישרו אותה פה אחד, בדרך לאישורה הסופי הצפוי במחצית אפריל. הצעת החוק, לכשתאושר, ככל הנראה תהפוך את האיחוד האירופי לנותן הטון העולמי בכל הנוגע לרגולציית בינה מלאכותית; בדומה לחקיקה האירופית בתחום הפרטיות (GDPR) שבאופן מעשי "כיילה" את רוב העולם להתיישר אליה, גם אם היא לא חלה במישרין.
בחודשים ובשבועות האחרונים לפני ההצבעה שלשום הדרמה התנהלה מאחורי הקלעים. בקרב מדינות האיחוד, שמייצגות יחדיו כוח כלכלי של 450 מיליון תושבים, קיים מתח בין השאיפה להוביל את סדר היום האתי העולמי לבין החשש מכך שרגולציה נוקשה מידי עלולה להוביל לניוון ולהשתרכות מאחור של אירופה בכל הנוגע לבינה מלאכותית.
התוכן באדיבות עו"ד ורד חורש. מומלץ בחום להצטרף לקבוצת העדכונים השקטה שלה
צרפת וגרמניה, שתי הכלכלות הגדולות ביותר באיחוד, הובילו את הקריאה לרגולציה מקילה, בפרט בכל הנוגע למודלי הבסיס – foundation models. לכל אחת מהן יש נציגה במרוץ החימוש של החברות המפתחות מודלי בינה מלאכותית כלליים – Mistral היא נציגת צרפת ואילו Aleph Alpha היא נציגת גרמניה.
את הקטגוריה מובילה ללא עוררין OpenAI האמריקאית, אבל נציגות צרפת וגרמניה הן מתחרות סופר ראויות ואין ספק שעוד נשמע עליהן. כפשרה, מקדם האיחוד תכנית הטבות שנועדה לתמוך בסטארטאפים בתחום ביד רחבה במימון, גישה למשאבי מחשוב, דאטה וטאלנט אקדמי.
אגב, גם OpenAI, לא טמנה ידה בצלחת והשתתפה באופן אקטיבי מאוד במאמצי הלובי לצמצם את ההגבלות של החקיקה האירופית על מודלים. המאמצים המשולבים של השלוש הובילו לכך שישנה התייחסות נפרדת ומקילה יותר למודלי בינה מלאכותית כלליים.
בכל הנוגע למודלי בינה מלאכותית גנרטיבית, ההצעה קובעת חובות גילוי בנוגע לדאטה ששימש לאימון המודלים הללו, בפרט דאטה שמוגן בזכויות יוצרים.
בתחילת השנה OpenAI התלוננה לבית הלורדים באנגליה שאם יגבילו אותם לשימוש בחומרים חופשיים בלבד זה יוביל לכך שלציבור לא יהיו מודלים מתקדמים ושזה "בלתי אפשרי" לפתח מודלים מהסוג הזה ללא שימוש בחומרים מוגנים בזכויות יוצרים. הכוונה שימוש ללא רשות וללא תשלום, כן? מחברה שמגייסת כעת בין 8 ל 10 מיליארד דולר לפי שווי של 100 מיליארד דולר.
לאחרונה, הודיעה ממשלת אנגליה כי לא תוסיף לקדם חקיקה שנועדה להחריג איסוף דאטה לצורך אימון מודלים מדיני זכויות יוצרים. במקום זאת, ממשלת אנגליה מקדמת קוד התנהגות לחברות AI שנועד לאזן בין חדשנות להגנה על זכויות ביצירות. שינוי המגמה הגיע בעקבות לחץ כבד מצד הסקטור הקריאטיבי.
ועד שיסיימו לעבוד באנגליה על הקוד החדש, הוכרז במהלך חודש ינואר על סטנדרט, ראשון מסוגו – Fairly Trained. מדובר בתו תקן שבודק האם מודלי בינה מלאכותית אומנו על דאטה שבעלי הזכויות בו התירו את השימוש בו. אד ניוטון-רקס שעומד מאחורי היוזמה הזו, וגייס אליה ועדת היגוי מרשימה, הוביל בעבר את פיתוח מודל המוסיקה של Stability AI (החברה שהמודל הידוע ביותר שלה הוא מודל התמונות Stable Diffusion). הוא גם מלחין ויזם הייטק שרשם אקזיט מוצלח בעבר. מודל המוסיקה של החברה היה חריג בין שלל המודלים שהיא מפתחת, בכך שאומן רק על יצירות מוסיקליות ברישיון. ניוטון-רקס התפטר בהתפטרות קולנית מהחברה בסוף השנה שעברה, לאחר שלא הצליח להוביל שינוי במדיניות החברה מבפנים והיא הוסיפה לעשות שימוש ללא רשות בדאטה מוגן בזכויות יוצרים לאימון כל שאר המודלים שלה. אשתף בגאווה ש BRIA AI (החברה שאני סמנכ"ל השותפויות שלה) עמדה בתנאי התקן המחמירים והיא החברה היחידה שמפתחת מודלי תמונות שזכתה להיכלל ברשימה.
מכה נוספת ספגוOpenAI ומיקרוסופט כאשר רגע לפני סוף השנה הגיש הניו יורק טיימס תביעה נגדן בגין הפרת זכויות במאמרים שלו באימון המודלים של החברה. יחד עם התביעה של גטי אימג'ס נגד סטאביליטי AI לפני כשנה, מדובר כנראה בתביעה שיושבת על אדנים משפטיים המוצקים ביותר שהיתה לי הזכות לעיין בה. התביעה של הניו יורק טיימס מציגה דוגמות רבות לתוצאות של ChatGPT שחוזרות מילה במילה על חלקים שלמים ממאמרים של העיתון. לטענת העיתון, שוויה של מיקרוסופט צמח בטריליון דולר כתוצאה משילוב המודלים של OpenAI במוצריה ואילו רווחיה של OpenAI עצמה האמירו ל 80 מיליון דולר בחודש. זאת בשעה שהעיתון ספג נזקים כבדים של אבדן הכנסות מרשיון לתוכן ותנועת גולשים לאתריו.
בד בבד אנו מוסיפים לשמוע על עסקות לרישוי דאטה לאימון, לרבות כאלו ש OpenAI מבצעת בעצמה. כך למשל התפרסם שהחברה סגרה עסקה עם ענקית המדיה הגרמנית, Axel Springer. יצוין כי היו גם שמועות על כך שנוהל מו"מ בין החברה לניו יורק טיימס. ככל הנראה המו"מ עלה על שרטון, מה שהוביל להגשת התביעה שהזכרתי. גטי אימג'ס אף היא הכריזה על מודל וידאו פרי שיתוף פעולה עם Runway AI וישנו מודל התמונות שאימנה בשיתוף פעולה עם נבידיה. וכמובן, המודלים שאנו מאמנים ב BRIA AI שכולם מבוססים רק על דאטה ברשיון.
נשאלת השאלה כיצד יכולה חברה שבאופן אקטיבי פועלת להשיג רישיונות לשימוש בדאטה לאימון, לטעון שמותר לה לעשות שימוש בדאטה אחר שלא עלה בידה להשיג רישיון לשימוש בו, משום שמדובר ב"שימוש הוגן"? יש כאן מן הסתירה.
לסיכום, לצד האמירות של מחוקקים, ישנה גם תמורה בשוק ביחס לנושא הרישוי. זה מאוד הגיוני לנוכח העובדה שאין מודלים גנרטיביים ללא חברות AI, משאבי מחשוב ותרומות קריאטיביות. קשה מאוד לקבל כהוגן מצב שבו רק שני הראשונים יקטפו את הרווחים, כשיש מספיק הוכחות למודלים שמצליחים לקבל רישיון בצורה מנומסת.
התוכן באדיבות עו"ד ורד חורש. מומלץ בחום להצטרף לקבוצת העדכונים השקטה שלה