המאמר הזה יושב אצלי תקופה. אחרי שמיקרוסופט הכריזה על כל החידושים שלה, כולל עידכון חדש לווינדוס 11 והשקת ה-Microsoft Copilot, הבנתי שיש פה משהו גדול, אבל מאז פרצה המלחמה והצורך ב-AI הפך לחלק מהותי במאמץ המלחמתי, בייחוד בצד הויזואלי-הסברתי.
נעים להכיר (מחדש) דאלי 3
נתחיל מהרקע: Dall-E 3 מבין הרבה יותר מקודמיו ונותן פייט למתחרים. על פניו, הוא לא מאוד ייחודי והוא די נחות יחסית למתחרים כמו Leonardo.ai ואפילו Midjourney. אין יכולות של תמונה מתמונה, כלומר לקחת תמונה קיימת ולייצר תמונה מג'ונרטת חדשה מבוססת עליה, אבל יכולות הטקסט לתמונה שלו היא בין הגבוהות שראינו, כולל הבנת מצב מורכב, מענה על שאלות, ועוד.
לפי האתר הרשמי של OpenAI "דאלי 3 מבין באופן משמעותי יותר ניואנסים ופרטים מהמערכות הקודמות שלנו, ומאפשר לתרגם בקלות את הרעיונות שלכם לתמונות מדויקות במיוחד."
והוא לא טועה. כבר בפתיח מופיעה התמונה הנ"ל עם הפרומפט המורכב הבא: "איור של אבוקדו יושב בכיסא המטופל ואומר 'אני מרגיש כל כך ריק מבפנים' עם חור בגודל בור במרכזו. המטפל, שהוא כפית, משרבט הערות".
התמונות באיכות גבוהה מאוד, במקרה של האבוקדו מדובר ב-1400*1400 פיקסל, שיכול להתאים למגוון שימושים, סושיאל, באנרים, אתרים, בלוגים, ועוד.
חדי העין גם ישימו לב שיש פה טקסט קריא לפי דרישה. אמנם בעברית הוא עדיין קצת מתקשה, אך מדובר בחידוש שעדיין לא אפשרי בפלטפורמות המתחרות.
איך תקבלו גישה ל-Dall-E3?
מיקרוסופט ו-OpenAI הכינו את הקרקע מראש והיום, נכון לכתיבת שורות אלו, יש לא פחות מ-3 אפשרויות מרכזיות ו-2 מהן בחינם, אבל יש קאץ':
- דרך האתר הרשמי של Image Creator של בינג מיקרוסופט. האתר מאפשר עד כ-100 טוקנים לג'ינרוט מהיר. כשהם ייגמרו, הג'ינרוט עדיין יתבצע, אבל הרבה יותר לאט. כלומר תקבלו פחות קדימות ב"תור" לתמונות.
- דרך מנוע החיפוש של בינג - יש לבחור במצב "Creative" וניתן לרשום לו לייצר תמונות כמו שאנחנו מכירים. עובד כמו האתר של אימג' קריאטור, רק שהוא בלי הגבלת טוקנים.
- דרך ChatGPT Plus - משתמשי פרימיום של ChatGPT יכולים להפעיל את Dall-E3 דרך ההגדרות של לפני כתיבת הפרומפט, עם הגבלה הוגנת למדי של עד 50 הודעות בשעה.
והנה הקאץ': ב-ChatGPT Plus ניתן לעשות שימוש מסחרי בתמונות, ואילו בשאר האופציות, עד כמה שבדקנו לא ניתן. בכל שימוש בתוכנה חדשה, מומלץ לבדוק מראש את תנאי השימוש.
נראה שמיקרוסופט מהמרת פה על כל הקופה ומשחקת את המשחק הארוך. לפי ה-Wall Street Journal מיקרוסופט מפסידה 20$ על כל משתמש, אבל היא עשויה להרוויח את הכסף בחזרה עם יכולות ה-AI של קופיילוט למיקרוסופט 365. כלומר, מיקרוסופט מוכנה כרגע להפסיד על כל משתמש בשביל לתפוס נתח שוק ולהרוויח, בתקווה, מהם את הכסף בהמשך עם שירותים נלווים או העלאת מחירים למוצרי פרימיום.
ולכן, החברה הולכת ראש בראש מול המתחרים המובילים ופותחת אותו כמעט בחינם לכולם. ציינתי שהוא גם מבין שפות כמו עברית והקשרים?
הסברה ישראלית? דאלי 3 לא מת עליה
למי שרץ עכשיו ללינקים שצירפנו ורוצה לייצר "חייל ישראלי חזק עם נשר מתנופף מאחורה ודגל ישראל ברקע" עלול להיתקל בחומה, או יותר נכון "נו נו נו", כאשר הפלטפורמה אומרת שהיא לא רוצה לייצר תמונות שמהוות קונפליקט.
לכך יש כל מיני מעקפים - במקום דגל להגיד מלבן לבן, במקום מגן דוד, שני משולשים ועוד. נראה שלפעמים זה עוזר ולפעמים לא. בינג נוטה להיות יותר ציוני מאחרים. הישראלים יודעים מאוד להתחכם, כאשר אחת הקבוצות העוסקת בתמונות וטקסט מדברת על לא להגיד לו לייצר בפרומפט, או לשאול שאלה "איך חייל ישראלי היה נראה לך?" או משהו כזה, וגם יש שאומרים שאפשר לשנות מדינה ל"לא ישראל", כדי להטעות את ה"אויב" במקרה הזה, מדובר בדאלי עצמו.
כך או כך, העם היהודי מביא פתרונות ואנחנו בטוחים שגם הפיד שלכם בפייסבוק או לינקדאין מלא בתמונות של עוצמה, כוח והסברה שנעשו עם דאלי 3. היכולת להוסיף טקסט פשוט נהדרת, אפשר לייצר פרסומות, קמפיינים, ובאנרים בשנייה. ובמקרה הכי גרוע יש את לאונרדו או מידג'רני שהם יותר נינוחים בנושא קונפליקטים.
ועדיין, כשהתבקש להציג כיצד תיראה ישראל אחרי רעידת אדמה, הדור הקודם של Dall-E לא נרתע והפיק את התמונות הבאות:
מי הבא בתור?
עולם ה-AI היום מתקדם מהר מאוד וכאילו "מחכה" למהלך גדול של אחת החברות הגדולות בשביל ללמוד ממנו ולהשוות. למשל, בתחילת אפריל 2022 הוכרז Dall-E 2. בחודשים העוקבים לאט לאט עוד משתמשים קיבלו גישה עד שבסוף ספטמבר הוא הגיע לכולם וכולם חיכו לדבר הבא. במקביל אליו צמח Midjourney ואיפשר גישה מוגבלת למודל תמונות חזק יותר דרך דיסקורד, עד שדאלי 3 הדביקו את הפער.
מה עכשיו? לפי החישובים שלנו, הבאה בתור עם מודל תמונות מרשים צריכה להיות גוגל, ולפי ההתקדמות של Google Photos אנחנו קרובים לזה, כאשר היום אפשר באמצעות AI לייצר מידע חדש מתמונות חדשות, לשפר את איכותן ועוד.
נסיים בנימה אישית: אני לא יודע איך המלחמה תיגמר, אני כן יודע שאנחנו חזקים ויש לנו יכולות נהדרות. חלקם ראינו למשל ממש פה עם דאלי 3 והדרכים לעקוף את מגבלות הפלטפורמה. צריך לזכור שאנחנו עדיין סטארט אפ ניישן עם המוחות הכי מבריקים שראיתי ובעזרת טכנולוגיה מתקדמת והון אנושי מדהים אנחנו יכולים לנצח כל אתגר. בהצלחה לכולנו ושיהיה לנו רק טוב ושקט.
אבי צדקה הוא מומחה לינקדאין לחברות וארגונים ומנכ"ל חברת ד"ר לינקדאין.