זה כנראה הבאזוורד הגדול של 2023 – Generative AI. האם מתחיל כאן גל חדש? מהם היישומים העיקריים שלו? לאן הולכת התחרות בין מיקרוסופט לגוגל? ואיך אפשר לעשות מזה כסף? צללנו לעומק ה-ChatGPT ודומיו עם שחר כהן, מייסד ושותף מנהל בלוסיד קפיטל (Lucid Capital), שהתארח אצלנו בעבר בוובינר על תעשיית השבבים; ועם פרופ’ רועי רייכרט, מומחה לעיבוד שפה טבעית (NLP) ולמידה חישובית (Machine Learning) בפקולטה למדעי הנתונים וההחלטות בטכניון.
רועי תיאר שלוש מהפכות בדרך ל-ChatGPT המוכר לנו: הלמידה העמוקה (Deep Learning), עם מודלים שדרך חשיפה להרבה מאוד דאטה מסוגלים ללמוד את עיצוב הפיצ’רים בעצמם – אז גם החל הדיבור על נהיגה אוטונומית ואוטומציה בעיבוד תמונה, בטקסט וב-Voice; הטרנספורמרים – מודלים שלומדים לעשות Attention ויכולים תוך כדי משימה לקלוט את הסטטיסטיקות הפנימיות ולהבין איזה חלק חשוב יותר ללמידה, ומכאן היכולת להשלים צורות ותמונות ואפילו משפט; ו-ChatGPT בגרסאות המוקדמות, שכבר היה מודל חזק בתיקון או שיפוץ אבל עדיין ללא יכולת לחולל דבר מה מאפס. מכאן נתנו לאנשים לשחק איתו ולתת לו פידבקים, מה שאפשר להגדיל את המודל מבחינת הפרמטרים. סייעה גם טכנולוגיית ה-Diffusion – מ”רעש” כמעט מוחלט בחזרה לתמונה המקורית, שתרמה ליכולת לקחת פנים בסיסיות ולהלביש אותן על תקופות וסגנונות שונים. והתוצאה המדהימה לפנינו.
שחר תיאר את הצד הפיננסי של העניין. ChatGPT נולד כהשקעתVC של מיקרוסופט שפיגרה אחר התחרות. הוא התברר כמוצלח הרבה מעבר למצופה, מה שהוביל להחלטה על אינטגרציה שלו לתוך מנוע החיפוש בינג, מערכת Office והדפדפן Edge. מנכ”ל מיקרוסופט סאטיה נאדלה החליט ללכת כאן all-in מול גוגל, שמחזיקה ביותר מ-92% ב-Search לעומת פחות מ-4% שיש לבינג. הוא הצהיר: From now on, the gross margin for search is going to change forever.”” והתובנה הזאת היא שהפילה את מניית גוגל ב-12% תוך יומיים, הרבה יותר מהטעות הזניחה יחסית שביצע ה-AI הגנרטיבי במסיבת העיתונאים המפורסמת של גוגל. גם GPT עושה טעויות, ואם תתעקשו מספיק, הוא יאמין לכם ש-2+2 זה 5. אבל מבנה העלויות הבסיסי מתחיל להשתנות.
שני סוגי העלויות הכבדות ב-Search הם אימון (OpEx) ושאילתות (CapEx). גוגל תצטרך תוספת של 30-40% כהשקעה ראשונית, והשקעה של פי 3-4 בתשתיות המחשוב כתקציב שוטף. זה שינוי דרמטי במודל העסקי. כך שגם אם לא תיווצר הכנסה משמעותית למיקרוסופט – וצריך לציין שבחודש האחרון גדל מספר ההורדות של אדג’ פי 5 – יש כאן בעיקר מתקפה חזיתית על הליבה של גוגל.
אבל ChatGPT רחוק מלהיות מושלם. רועי עמד על כמה מהאתגרים הגדולים שעוד לפניו: Punctuality – הביטחון של המשתמש בנכונות התשובה שיקבל, שהולך ומתערער ככל שנכנסים לדומיינים יותר נישתיים וספציפיים (למשל: על עצמו, או על תשואת השכירות בשכונה ספציפית בניו יורק). גנריות שעדיין ניכרת בטקסטים – ומודלי AI יודעים לזהות זאת בקלות. עלויות גבוהות – אם רוצים להריץ מיליארדי שאילתות (queries) יש צורך במודלי ענק של טריליוני פרמטרים, מה שלאו דווקא מצדיק את העלויות לצורכי החיפוש. ולבסוף: איך יוצרים מכל זה מוניטיזציה? איך עושים מזה כסף? אם בגוגל יש בידינג על מה יוצג בתגובה, ועסקים משלמים על זה, כאן עוד קשה לראות את הפתרון. צריך עם זאת לזכור שגם כשגוגל הציגה את המודל, לא הכרנו אותו. כך שאולי עוד נופתע.
ואולי המרוויחה הגדולה היא בכלל אפל? שחר הזכיר לנו ששורת קוד אחת – רבע שעה של מהנדס – מניבה לאפל 15 מיליארד דולר מגוגל כל שנה: היותה של גוגל ברירת המחדל ב-Search במכשירים. אולי עכשיו אפל תוכל להתמקח ולדרוש להעלות את הסכום. וצריך לציין עוד מרוויחה: אנבידיה, שעל גבי השבבים שלה מריצים את מודלי האימון. רק על אימון ChatGPT היא גרפה כבר כ-200 מיליון דולר, ושחר רואה כאן הזדמנות יפה להשקעה בחברות השותפות לשרשרת הערך שלה. למשל: חברות סמיקונדקטור המסייעות להריץ זיכרון רחב כדי לבצע חישובי ליבה במקביל, או מפתחות שבב לייעול צריכת החשמל בדאטה סנטר. בסוף, כל כרטיס של אנבידיה הוא תנור שמחייב מזגן.
לסיום, רועי נתן לנו כלל אצבע: AI משתלב נהדר במערכות תומכות, למשל: במכירות B2B – מוצר שמקליט את השיחה, מתמלל אותה, מוציא סטטיסטיקות, עושה קואוצ’ינג לאנשי המכירות ומספק למנהל המכירות דשבורד עדכני. או המוצר של סורידאטה (שרועי משמש בה מדען ראשי) המסייע לארגון להבין היכן נמצא המידע הרגיש אצלו. כלומר, הוא לא מחליף את ה-CISO אלא מספק לו כלי תומך החלטה שמציג את תמונת המצב ומזהה או מתעדף פגיעויות. איפה, לעומת זאת, ה-AI “מאכזב” בינתיים? כשמנסים לפתור איתו את הכול וללכת עד הסוף. נהיגה אוטונומית היא דוגמה טובה – שם רמת הדיוק הנדרשת היא הרבה מעבר ל-99%, ופרקטיקות ML פחות בנויות לזה כרגע.