מה חדש בבינה המלאכותית 24.6.23
צילום: LEONARDO
1.מודל חדש בשם "Voicebox" הוא מודל AI חדשני שנוצר על ידי Meta, (שלא מפסיקה בחודש האחרון להוציא מאמרים ומי שבקטע אני ממליץ לו להיכנס לטוויטר שלהם) שמאפשר יצירת קטעי שיחה באיכות גבוהה בשישה שפות שונות!
הקטע המטורף הוא שהמודל הזה מצליח לבצע משימות של יצירת דיבור שהוא לא הוכשר עליהן מראש! (AGI מישהו?).
המודל משתמש בשיטה בשם "Flow Matching", שמאפשרת לו לעבור באופן משמעותי מודלים אחרים שמובילים בתחום.
המודל "Voicebox" הוכשר עם מעל ל-50,000 שעות של שיחה מוקלטת ותמלילים מספרים הנמצאים באינטרנט.
השימושים הפוטנציאליים של מודל כזה הם לא נגמרים!
כולל יצירת דיבור מהקשרים, תרגום בין שפות, הסרת רעשים, עריכת תוכן ועוד מלא דברים שעדיין לא חשבנו עליהם ושאפשר לייצר דרך שימוש בקול.
כנראה שמהסיבה הזאת ומשום שהטכנולוגיה מביאה איתה את הפוטנציאל לשימוש לרעה, המודל או הקוד של "Voicebox" אינם זמינים לציבור בשלב זה אבל רק הוכחת היכולת פותחת דלתות למקומות מרהיבים חדשים!
https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/
סיכום השבוע בשיתוף חברת Zero21. אם אתם מעוניינים להכניס מערכות מבוססות בינה מלאכותית לעסק או לארגון, מוזמנים להשאיר פרטים ויחזרו אליכם בהקדם
2.אם כבר קולות, אז ElevenLabs, זאת שמפתחת פלטפורמה ליצירת קולות סינתטיים, גייסה 19 מיליון דולר בסבב A.
למי שלא מכיר, החברה מאפשרת להמיר טקסט לדיבור באמצעות קולות סינתטיים, קולות ״חקיינים״ (יעני קולות של אנשים אמיתיים) או קולות "מלאכותיים" חדשים שמדמים פשוט קולות של אנשים מגילאים, מגדרים ומוצאים שונים. במקביל לסבב המימון, ElevenLabs משיקה את "Projects", מערכת עבודה לעריכה ויצירת תוכן מדובר בצורה ארוכה.
כתגובה לניצול השלילי של הפלטפורמה, ElevenLabs משיקה גם כלי חדש לזיהוי של תוכן שנוצר במערכת שלה עצמה ובמסגרת התכנים להרחבה, החברה מתכננת להרחיב את מודלי ה-AI שלה לדיבוב קולות, כאשר המטרה היא להעביר רגשות ואינטונציה משפה אחת לאחרת.
https://techcrunch.com/2023/06/20/voice-generating-platform-elevenlabs-raises-19m-launches-detection-tool/
3.מרצדס מוסיפה את ChatGPT לעוזרת הקולית שלה, תחת הקריאה המקורית, "היי מרצדס", כחלק מתוכנית בטא בארצות הברית.
עכשיו, עלידי קריאה לסירי של האוטו, תקבלו שליטה קולית אינטואיטיבית שתגרום לכם להרגיש כמעט כמו אירון מן וג׳רביס. הנוסעים יכולים להיות מעורבים בשיחה טבעית, לקבל תשובות לשאלות, לקבל עדכוני מזג אוויר, לשלוט בהגדרות הנוחות של הרכב ואפילו בבתיהם החכמים.
https://media.mercedes-benz.com/article/323212b5-1b56-458a-9324-20b25cc176cb
4. מכירים את Vimeo? בכל מקרה היא התחרות היחידה אולי שיש ליוטיוב, והיא משיקה מספר כלים חדשים מבוססי AI, שמתאימים במיוחד ללקוחות המשלמים שלה.
בין הכלים החדשים, נמצא מחולל תסריטים אוטומטי שמבוסס על טכנולוגיה של OpenAI.
החברה מקדמת את הכלים כדרך ליצור סרטון מפוצץ בתוך דקות, ומדגישה את השימושיות שלהם עבור לקוחות עסקיים.
השימושים האפשריים של הכלים החדשים כוללים יצירת סרטונים קצרים, תכנון אירועים וירטואליים או ישיבות חברה, יצירת קטעי טקסט לסרטוני שיווק קצרים.
בנוסף למחולל התסריטים, נמצאים עוד שני כלים חדשים: מסך תצוגה שמאפשר למשתמשים להתאים את זמני התצוגה וגודל הגופן, ועורך סרטונים מבוסס טקסט שמזהה באופן אוטומטי מילים מיותרות, הפסקות ארוכות, ורגעים מביכים, ומאפשר למשתמשים להסירם בלחיצת כפתור.
לא יודע עד כמה זה ישפיע ברמת התחרות על המונופול שיש היום ליוטיוב אבל אין ספק שזה ישפיע על קבלת ההחלטות שלהם לטווח הקרוב אז לכל יוצרי התוכן, ממליץ לכם לשים עין על הנושא.
https://www.theverge.com/2023/6/20/23766809/vimeo-ai-tools-script-generator-editing
5.אחרי שבשבוע שעבר ראינו שאירופה כבר על הרגליים, הנשיא ג'ו ביידן נפגש עם מומחים שונים כדי לדון בניהול הסיכונים שיש בבינה מלאכותית, כחלק מהמחויבות של הממשל שלו לשמירה על זכויות ובטיחות האמריקאים, (שכוללת הגנה על פרטיות, טיפול בהטיות ודיסאינפורמציה)
בנוסף, סגנית הנשיא קמאלה האריס תארח דיון עם מנהיגי זכויות האזרח וקבוצות הגנת הצרכן על עליית הבינה המלאכותית וההשפעות שלה, יחד עם השקעה של 140 מיליון דולר במרכזי מחקר חדשים בתחום הבינה המלאכותית ושחרור מסגרות עבודה שונות להפחתת הסיכון.
בקיצור, כולם בפאניקה.
https://www.nbcnews.com/news/amp/rcna90136
6. עם זאת, הפאניקה נדרשת כי הטכנולוגיה ממשיכה לטוס לשמים!
והפעם זאת סיסקו שמייצרים חומרה חדשה שמאפשרת לנו להטיס כמות הרבה יותר גדולה של דאטא!
אני אנסה להסביר את זה בצורה פשוטה, תארו לעצמכם שיש לכם חבורה של מכוניות צעצוע מהירות במיוחד (להן נקרא GPUs), והן כולן טסות על המסלולים הקטנים שלהן (להם נקרא שבבים).
כדי להפוך את הדברים למרגשים יותר, אנחנו רוצים שכל המכוניות האלה יטוסו יחד על מסלול ענק!
זה המקום שבו סיסקו נכנסת לתמונה.
סיסקו מייצרת את הכבישים הגדולים והרחבים האלה (שהם השבבים) שמאפשרים לכל המכוניות להתחרות יחד בו זמנית.
לשבבים החדש האלה קוראים G200 ו-G202 והם מהירים פי שניים מהישנים! כלומר הם יכולים להכיל עד 32,000 מכוניות בבת אחת!
מעבר לכך שמדובר בחיסכון ענק באנרגיה, נדרשים גם פחות מתגים (יעני רמזורים) ובכך הנתונים יכולים באמת לטוס!
למה אני מספר לכם את זה? כי אני נגנב פשוט מהמהירות שהטכנולוגיה מתקדמת מתחת למכסה המנוע, עוד מוצר שמייצר עוד תמונה זה מגניב, אבל הדברים האלה הם מה שגורם לזה לקראת!
https://m.economictimes.com/tech/technology/cisco-launches-ai-networking-chips-to-take-on-broadcom-marvell/amp_articleshow/101143728.cms
7.גוגל הציגה תכונה חדשה המאפשרת לקונים באינטרנט להתנסות בצורה וירטואלית בבגדים לפני הקנייה.
הכלי החדש Virtual Try On משתמש במודל AI גנרטיבי כדי לתאר במדויק איך פריט לבוש ייראה במגוון דגמים אמיתיים, תוך התחשבות בגורמים כמו כיסוי, קיפול ומתיחה.
הדגמים מייצגים גדלי גוף שונים, גווני עור, צורות גוף, מוצא אתני וסוגי שיער.
קונים בארה"ב יכולים כעת לנסות חולצות נשים ממותגות ברחבי Google (גברים בקרוב).
לצד זה, גוגל השיקה גם תכונה לצמצום חיפושי מוצרים בהתבסס על קריטריונים כמו צבע, סגנון ודפוס, ומציגה ישר אפשרויות בחירה מתוך קמעונאים שונים ברשת.
אין ספק שחווית הקניה באינטרנט הולכת להשתנות מהר מאוד!
https://blog.google/products/shopping/ai-virtual-try-on-google-shopping/amp/
8.חברת Dropbox מציגה גם היא שני כלים חדשים המונעים בינה מלאכותית, Dropbox Dash ו-Dropbox AI, שמטרתם איך לא, לחולל מהפכה בשליטה בידע ושיפור היעילות.
Dropbox Dash הוא כלי חיפוש אוניברסלי המחבר את כל הכלים, התוכן והאפליקציות לשורת חיפוש אחת, כולל פלטפורמות מרכזיות כמו Google Workspace, Microsoft Outlook ו-Salesforce.
הוא לומד, מתפתח ומשתפר ככל שמשתמשים בו יותר, ובקרוב יוכל לשלוף תובנות מהמידע שלך כדי לענות על שאלות ולהציג תוכן רלוונטי באמצעות AI גנראטיבי. Dropbox Dash כולל גם תכונות כמו Stacks, כלומר אוספים חכמים לקישורים, ודף התחלה שמקל על ניווט.
המוצר השני Dropbox AI מיישם בינה מלאכותית על תצוגות מקדימות של קבצים, מה שמאפשר להבין במהירות רבה יותר מסמכים גדולים או סרטונים מבלי לנתח את כל הקובץ.
זאת אומרת שנוכל לשאול שאלה ולקבל תשובה תוך שניות, ובקרוב, תכונה זו תהיה זמינה עבור כל התיקיות שבכל חשבון Dropbox.
יחד עם המוצרים החדשים הללו, דרופבוקס גם משיקה את Dropbox Ventures, קרן של 50 מיליון דולר לתמיכה בסטארט-אפים ממוקדי בינה מלאכותית.
https://blog.dropbox.com/topics/product/introducing-AI-powered-tools
9.חברת DeepMind הציגה מערכת בינה מלאכותית חדשה בשם RoboCat שנועדה לשפר את עצמה וללמוד להפעיל זרועות רובוטיות שונות.
בניגוד לרובוטים קיימים רבים שמתוכנתים למשימות ספציפיות, RoboCat יכול להסתגל ולבצע מגוון משימות על פני זרועות רובוטיות שונות, והוא מייצר ללא הרף נתוני אימון חדשים כדי לשפר את כישוריו.
ההדרכה הראשונית מבוססת על מערך נתונים גדול המכיל רצפים של תמונות ופעולות מזרועות רובוטים שונות המבצעות מאות משימות.
לאחר מכן, RoboCat נכנסת למחזור שיפור עצמי עבור כל משימה או זרוע רובוטית חדשה: היא אוספת הדגמות, יוצרת סוכן מיוחד, מתרגלת, מייצרת נתונים נוספים ומשלבת נתונים אלה במערך ההדרכה שלה.
(AGI מישהו פעם שניה?)
תהליך זה מאפשר ל-RoboCat ללמוד הרבה יותר מהר מדגמים אחרים.
בנוסף, הביצועים שלו משתפרים ככל שהוא לומד יותר משימות, מראה הבטחה גדולה לעתיד של רובוטיקה לשימוש כללי.
https://www.deepmind.com/blog/robocat-a-self-improving-robotic-agent?utm_source=twitter&utm_medium=social&utm_campaign=robocat
10. ולסיום, מה שבאמת מעיף לי את הפוני כל פעם מחדש זו ההתקדמות בתחום הרפואי!
אז תארו לעצמכם שהייתם יכולים לצלם תמונה של העין שלכם והמחשב היה אומר לכם אם סביר שתסבלו מבעיית לב בשנים הקרובות.
גם כאן מדובר בגוגל.
מסתבר שבחלק האחורי של העיניים שלנו יש הרבה כלי דם שיכולים לספר לרופאים על הבריאות הכללית שלנו.
גוגל אימנה מודל בסריקות עיניים רבות ובנתונים רפואיים מכמעט 300,000 אנשים.
ובדרך הזו, הבינה למדה לראות את הסימנים בעיניים שיכולים לדעת אם לאדם עלול להיות בעיית לב בעתיד, כן, פשוט ככה.
וכל זה פשוט עם סמארטפון ומצלמה פשוטה, כל מה שצריך זה לצלם תמונה של העין, לשלוח אותה ל-AI הזה ולעבור בדיקת בריאות.
דרך אגב, היכולת הזו גם פותרת את כל הנושא של בעיות עור, יש לכם נקודת חן חשודה? הAI כבר יגיד לכם מה לעשות.
https://beamstart.com/news/googles-ai-revolution-predicting-heart-16871608928
זהו להפעם חברים.
נשתמע שוב בשבוע הבא