מה חדש בבינה המלאכותית 1.7.23
צילום: Midjourney
1. אז בואו נתחיל מהכיף!
זוכרים את DragGAN ? אז הוא בדיוק שלשום שוחרר לגיטהב!
למי שלא זוכר,מדובר בסוג של פאפט-ראפ על סטרואידים.
הכלי מאפשר בעזרת נקודת עיגון ונקודת הזזה לעשות דברים שבעבר היינו צריכים ללמוד ממש קשה פוטושופ בשבילם.
בצורה הזו אנחנו מקבלים שליטה ממש מדויקת בזווית של כל אובייקט בתוך תמונה בצורה שמדגישה לגמרי את היכולות שיש לבינה מלאכותית להבין מה קורה בכל מקום.
דרך אגב, השילוב בין מידג׳ לבין ג׳נרייטיב-פיל (פוטושופ) לבין DragGAN, הולך לעשות לנו המון כיף בתקופה הקרובה, אז תתכוננו.
בגיט תוכלו למצוא מלא דוגמאות שיסבירו בדיוק מה ואיך.
https://github.com/XingangPan/DragGAN
סיכום השבוע בשיתוף חברת Zero21. אם אתם מעוניינים להכניס מערכות מבוססות בינה מלאכותית לעסק או לארגון, מוזמנים להשאיר פרטים ויחזרו אליכם בהקדם
2.בקרוב מאוד תוכלו ליצור משחקי תלת מימד מלאים בעזרת פרומפטים!
את ההכרזות האלה אנחנו שומעים כבר חודשים, אבל עכשיו חברת Unity הכריזה על Muse, עוזרת מופעלת בינה מלאכותית ליצירת משחקי וידאו.
הפלטפורמה תהיה מחוברת באופן הדוק לעורך ה-Unity, ותאפשר הנחיות טקסט וסקיצות, במקום קידוד ידני מסורתי.
חברת Unity הציגה שני כלים חדשים.
הראשון, Sentis שהוא כלי שיכול להטמיע מודלים בכל פרויקט של Unity מבלי לגרום לעיכובים, מה שמקל על היוצרים לשלב AI בעבודתם.
השני הוא Muse שהיא חבילת כלים שהופכת את יצירת תוכן 3D בזמן אמת (RT3D) לקלה ויעילה יותר.
הוא עוזר למשתמשים למצוא מידע ותשובות לשאלות תמיכה על ידי הקלדת הנחיה בתיבת צ'אט.
כלים אלו הם חלק מהמאמצים של Unity להפוך את כלי הבינה המלאכותית לנגישים יותר ולהגדיל את הפרודוקטיביות בפיתוח משחקים. Unity גם מתכננת להשיק שוק AI ייעודי המציע מגוון כלים שיסייעו ביצירת משחקים. הכלים הללו נמצאים כעת בבדיקות בטא סגורות, אך הם יושקו ברחבי העולם בהמשך השנה.
https://blog.unity.com/engine-platform/introducing-unity-muse-and-unity-sentis-ai
3. עוד בגזרת האמנות, תכירו את MVDiffusion.
תעשו סיבוב רגע עם הראש בחדר, נכון ראיתם אותו מזוויות שונות אבל הכל מתחבר יפה יחד, לחדר אחד…
יופי אז MVDiffusion יכול לעשות משהו בערך כזה.
אם תספרו לו איך נראה מקום, הוא יכול לצייר תמונות של המקום מהרבה נקודות מבט שונות! כמו אם הייתם עומדים במקומות שונים בחדר.
הקטע המגניב הוא שהוא לא מצייר תמונה אחת בכל פעם, אלא הוא חושב על כל התמונות בבת אחת, כך שכולן משתלבות ממש טוב, או במילים פשוטות Text-To-3D.
תיאור פשוט, כמו "חדר עם ספה כחולה וחלון גדול", הופך לתמונה מפורטת ומציאותית. https://mvdiffusion.github.io/
4.חברת Baidu, חברת טכנולוגיה בסין, יצרה צ'טבוט חדש בשם Ernie Bot.
לאחרונה הם בדקו את זה מול ChatGPT ו-GPT 4, ונמצא כי Ernie 3.5, הגרסה העדכנית ביותר של מודל הבינה המלאכותית שלהם, פעלה טוב יותר מ-ChatGPT בבדיקות מסוימות.
בחלקים מסוימים הוא אפילו עלה על GPT-4 במבחני השפה הסינית.
עם זאת, ארני 3.5 לא היה טוב כמו GPT 4 במבחני השפה האנגלית.
חברת Baidu מתחרה עם חברות טכנולוגיה אחרות כדי לפתח מודלים מתקדמים, הם עובדים על שיפור היכולות של ארני בוט בתחומים כמו כתיבה יצירתית, מענה על שאלות, נימוקים ויצירת קוד, קיצר ChatGPT סיני.
הם גם הוסיפו תכונה המאפשרת לארני בוט לגשת לאפליקציות שונות, בדומה לאופן שבו אנו משתמשים באפליקציות בטלפונים שלנו, וזה כבר הופך להיות מעניין וגם מסוכן באותה נשימה.
5.חברת MosaicML (למי שלא מכיר MosaicML מספקים פלטפורמה שמאפשרת למשתמשים לאמן או להתאים מודלים על פי דרישות מקצועיות ומאפשרת שליטה מלאה על הנתונים) הציגה את MPT-30B, מודל מתקדם, קוד פתוח, כחלק מסדרת ה-Foundation שלהם, שנועדה לעלות על ה-GPT-3 המקורי ודגמי שפות דומות אחרות (LLM) כגון LLaMa-30B ו-Falcon-40B.
המודל MPT-30B, יחד עם הגרסאות המכווננות שלו, MPT-30B-Instruct ו-MPT-30B-Chat, אומנו באמצעות חלון הקשר מורחב של 8k, מה שמקנה לו יכולות קידוד מעולות והופך אותו ליעיל הן לאימון והן להסקה.
מעניין לציין ש-MPT-30B הוא הדגם הציבורי הראשון שהוכשר על NVIDIA H100s (הצ׳יפ החדש) מה שמגביר משמעותית את מהירות העיבוד שלו והוא זמין כעת ללקוחות
6. קלמנט דלאנג, מנכ"ל Hugging Face, עלה גם הוא לנאום מול הקונגרס האמריקאי והדגיש את החשיבות של דמוקרטיזציה בתחום הבינה המלאכותית באמצעות מודלים ומערכי נתונים של קוד פתוח!
הוא הדגיש כי טיפוח חדשנות בטוחה, מצריך גישה למשאבים הפתוחים הללו ושיתוף פעולה בהם כדי לקדם מחקר, להפחית סיכונים ולחשוף יישומים בעלי ערך גבוה.
המתח בין מערכות פתוחות לחלוטין וסגורות הוכר, כאשר Hugging Face דווקא נוקטים בגישה מאוזנת תוך שימוש במדיניות מוסדית, אמצעי הגנה טכניים ומתינות קהילתית.
דלאנג דוגל בשיטות תיעוד קפדניות עבור מערכות AI ופיתוח אמצעי הגנה כדי להבטיח פיתוח אחראי והפחתת סיכונים, הוא גם הדגיש את הצורך בהשקעה בתשתיות ובמחקר, טיפול בפער המשאבים בין האקדמיה לתעשייה, וקידום מחקר בין-תחומי.
מסקנתו הדגישה את הפוטנציאל של AI לשפר חיים והזדמנויות, בהינתן שיתוף פעולה חוצה מגזרים, גישה למערכות והשקעה בבטיחות.
אישית אני מאוד שמח לראות כל פעם את הדחיפה החזקה שיש מצד הגופים הגדולים לכיוון הרגולציה, כמובן שיש על הנושא הרבה ספקולציות פוליטיות אבל זה כבר דיון למסגרת אחרת.
https://twitter.com/ClementDelangue/status/1673348676478025730?utm_source=alphasignalai.beehiiv.com&utm_medium=newsletter&utm_campaign=deepmind-s-new-gemini-and-the-1-3-billion-acquisition
7.מתאמנים? רוצים לבנות אימון חדש? אולי לתת אינטרפרטציה חדשה לריקוד של אגם הברבורים..
אז יופי הינה MotionGPT.
מדובר בתוכנת מחשב מיוחדת שיכולה להבין את הדרך שבה אנשים נעים וגם את המילים שהם אומרים.
הוא משלב את שני הדברים האלה כדי לעזור בפעילויות שונות הקשורות לתנועה, כמו יצירת תנועות על סמך טקסט, תיאור תנועות, חיזוי תנועות ומילוי הפערים בין תנועות שונות.
הוא לומד מהרבה דוגמאות ומשתמש בטכניקה מיוחדת שנקראת למידה מהירה כדי להיות ממש טוב בהבנה ובעבודה עם תנועה.
https://huggingface.co/papers/2306.14795
8. נכון שכשמרימים מגדל של קלפים או קוביות, צריך להוסיף בזהירות עוד ועוד חלקים כדי להפוך אותו גבוה יותר מבלי להפיל אותו?
זה קצת דומה למה שעשו המדענים ב-Salesforce עם תוכנה חדשה בשם XGen.
הם אימנו אותו לקרוא ולהבין תוכן ארוך מאוד, בערך בגודל של ספר הארי פוטר, אבל מהגדולים.
הם התחילו עם תוכן קצר יותר ואז אימנו בהדרגה את XGen להתמודד עם תכנים ארוכים יותר ויותר, ממש כמו להוסיף עוד חלקים למגדל.
ונחש מה? XGen עשה עבודה נהדרת! ועכשיו זה לא רק שהוא טוב בהבנת תוכן באורך הגלות, אלא גם בכתיבת הוראות,קידוד ועוד דברים קלאסים שאנחנו כבר מכירים ממודלי שפה שונים, אבל הפעם למול המון תוכן!
משתמשי Salesforce, תתכוננו לחידושים מרשימים בקרוב.
https://blog.salesforceairesearch.com/xgen/
9. לסיום, מהיום אפשר להשתמש בBing גם באפליקציה של ChatGPT שבנייד.
כדי להשתמש, עדכנו את האפליקציה דרך החנות ותפעילו את Browsing with Bing בהגדרות של האפליקציה. לאחר מכן כנסו ל GPT-4 ותהנו. (כמובן שצריך להיות לקוח + בשביל שזה יעבוד)
זהו להפעם חברים.
נשתמע שוב בשבוע הבא