כולנו מכירים את מידגרני/צ'אט גיפיטי/ג'ימיני ועוד.
אבל יש כלים שמעט פחות מוכרים והם לא פחות וואו מבחינת היכולות שלהם.
במדריך זה אתן סקירה על ElevenLabs, בינה מלאכותית בכל מה שקשור לקול ושמע.
אז מה זה ElevenLabs?
ElevenLabs זו פלטפורמה שעושה קסמים עם קול ושמע.
פיתוח הדגל של החברה היא טכנלוגיה שיודעת להפוך טקסט לקול אנושי ממש, כזה שקשה להבדיל בינו לבין קול של אדם אמיתי. מי שמכיר את התחום יודע שזה הישג רציני - רוב הקריינויות של טקסט לדיבור נשמעות כמו רובוט. לא כאן.
אך מלבד זאת יש להם מגוון פיתוחים נוספים הקשורים לקול.
אז בואו נצלול לתוך הממשק ונראה מה אפשר לעשות איתו, ואיפה יש מגבלות לדוברי עברית.
הרשמה לממשק:
1.
ניכנס לקישור הזה
2. נלחץ על Try for free (משתמש חינמי מקבל 10,000 קרדיטים לחודש)
3. נירשם עם חשבון גוגל (או עם כתובת מייל וסיסמא).
4. נבחר ערכת נושא
5. נזין פרטים כמו שם ותאריך לידה
6. נסיים את תהליך ההרשמה.
7. בצד שמאל יופיע תפריט צידי.
מה בתפריט:

Voices - קולות
עמוד הקולות מאפשר לכם לנהל את הקולות השונים שאיתם תעבדו. יש כמה לשוניות כאן:
-
My Voices: הקולות שאתם משתמשים בהם
-
Library: ספריית הקולות של ElevenLabs עם אלפי קולות שאפשר לבחור מהם
-
Collections: אוספים של קולות שארגנתם לפי קטגוריות
בחלק העליון יש אפשרות ליצור קול חדש או לשבט קול קיים. שיבוט קול זו טכנולוגיה שמאפשרת להקליט את עצמכם למשך כמה דקות, והמערכת יוצרת "תאום דיגיטלי" של הקול שלכם. כן, העתיד כבר כאן.
כל קול בא עם תגיות כמו "Narration" (הקראה), "News" (חדשות), "Characters" (דמויות) או "Social media" (מדיה חברתית), שמציינות למה הקול מתאים. אפשר גם לראות את הכפתורים "Use" (להשתמש בקול) ו-"View" (לצפות בפרטי הקול).
אבל בינתיים אין תמיכה מלאה בעברית במנוע שמאחורי השיבוט והקולות. זה אומר שהתוצאה תישמע די גרועה ולא רלוונטית בעברית לעומת שפות אחרות שכן נתמכות.
אזור Playground (סביבת משחק)
Text to Speech - המרת טקסט לדיבור
זה הכלי המרכזי והשימושי ביותר באתר לאלו שלא זקוקים לעברית. הממשק די פשוט - צד ימין מציג את האפשרויות, ובמרכז אפשר להקליד את הטקסט שרוצים להמיר לדיבור.
בצד ימין יש מספר אפשרויות חשובות:
-
Voice: בחירת הקול.
-
Model: המודל שיעבד את הטקסט.
-
Speed: מהירות הדיבור.
-
Stability: יציבות הקול (פחות שינויים בטון).
למרות שניתן לכתוב עברית, איכות התוצאה תהיה גרוע ממש כי העברית לא נתמכת באופן מלא במודלים של ElevenLabs כרגע.
Voice Changer - משנה קול
כאן אפשר להעלות הקלטה קיימת (לחצן "Click to upload"), או להקליט ישירות דרך המיקרופון ("Record audio").
האפשרויות בצד ימין דומות לאלו של Text to Speech:
-
Voice: איזה קול יחליף את הקול המקורי
-
Model: המודל שיעבד את הטקסט.
-
Stability: יציבות הקול
-
Style Exaggeration: עד כמה להדגיש את הסגנון של הקול החדש
-
Remove Background Noise: הסרת רעשי רקע
-
Speaker boost: הגברת קול הדובר
הכלי הזה מעולה אם יש לכם הקלטה באנגלית ואתם רוצים להמיר אותה לקול אחר. גם כאן אין עדיין תמיכה בעברית.
Sound Effects - אפקטי קול
פה הרעיון פשוט - מקלידים תיאור של האפקט שרוצים (אפשר גם בעברית), ומקבלים קובץ שמע מתאים.
בתחתית המסך יש אפשרות לשלוט על משך האפקט ועל יצירתיות האפקט.
ניתן להזין טקסט בעברית, אבל לתוצאות הטובות ביותר, רצוי להשתמש באנגלית לכתיבת התיאור.
אזור Products (מוצרים)
Studio
זה כלי יעודי ליצירת תוכן ארוך יותר כמו אודיו בוקים, פודקאסטים או מאמרים. יש מספר אפשרויות התחלה:
-
Start from scratch: התחלה מאפס
-
Create an audiobook: יצירת ספר אודיו
-
Create an article: יצירת מאמר מוקרא
-
Create a podcast: יצירת פודקאסט
זה הכלי המושלם אם אתם רוצים להפוך ספר שלם לאודיובוק, או להקליט פודקאסט מורכב עם כמה דמויות. אבל שוב, גם הכלי הזה לא תומך בעברית.
Dubbing - דיבוב
הכלי הזה מיועד ספציפית לדיבוב סרטונים מאנגלית לשפות אחרות (או משפות אחרות לאנגלית).
הכלי מאפשר לוקליזציה של תוכן ל-29 שפות שונות. בדף יש מספר חלקים:
-
Learn: מדריכים ללמידה על איך להשתמש בכלי
-
Create a Dub: אפשרות ליצור דיבוב חדש
התהליך כולל העלאת וידאו, ואז המערכת מזהה אוטומטית את הדיבור, מתמללת אותו, ומאפשרת לכם לתרגם ולדבב לשפה אחרת תוך שמירה על הטון והסגנון המקורי של הדובר. גם כאן עברית עדיין לא כאן.
Conversational AI (בינה מלאכותית שיחתית) -
יצירת סוכני קול אינטראקטיביים: בניית סוכנים קוליים חכמים, הגדרת התנהגות ואישיות, מאפשר שילוב עם מערכות טלפוניה או ממשקי צ'אט.
אלו אפשרויות למתקדמים שלא זקוקים למדריך הזה
Speech to Text - המרת דיבור לטקסט
והנה הכלי שכן עובד עם עברית! בניגוד לרוב הכלים האחרים, שירות ה Speech to Text של ElevenLabs (נקרא Scribe) תומך בעברית באופן מלא. המערכת מסוגלת לקחת הקלטה בעברית ולהפוך אותה לטקסט מדויק. מנסיוני זה מנוע הSTT המדויק ביותר לעברית שקיים היום.

Audio Tools (כלים לעיבוד אודיו)
-
Audio Native: כלי שמאפשר להוסיף נגן אודיו אוטומטי לאתרי אינטרנט, שיכול להקריא את התוכן של העמוד
-
Voiceover Studio: סביבת עבודה ליצירת קריינות איכותית לסרטונים ותוכן אחר
-
Voice Isolator: כלי מדהים להסרת רעשי רקע מהקלטות קיימות
-
AI Speech Classifier: כלי לזיהוי האם קובץ אודיו נוצר על ידי בינה מלאכותית
כמה זה עולה?
ElevenLabs מציעה כמה תוכניות כפי שניתן לראות
בדף הזה, ביניהן תכנית חינמית עם מכסה חודשית מוגבלת, שעדיין מאפשרת גישה לרוב הכלים הבסיסיים, נדיב מספיק בשביל לנסות ולהתרשם.
אז לסיכום,
אם אתם עובדים באנגלית או בשפות נתמכות אחרות, יש פה מכונת פלאים שיכולה לחסוך לכם המון זמן, כסף ומאמץ בהפקה של תוכן קולי איכותי.
למי שעובד עם עברית, יש מגבלה משמעותית כרגע. רק שירות הSpeech to Text (דיבור לטקסט) תומך בעברית באופן מלא, יש גם את אפשרות יצירת האפקטים ואפשרות ההסרת רעשי רקע. בעוד שכל השירותים האחרים עדיין לא. בתקווה שבעתיד הקרוב הם יוסיפו תמיכה מלאה גם בעברית.
והשורה התחתונה והכי חשובה:
אם אתם מעוניינים בתמלול של קבצי אודיו בעברית, הSpeech to Text שלהם הוא אחד הטובים בשוק. מנסיון!.

Reactions: אסתר אייזנבאך, איילה לב ו-גיטריסט בנשמה3 //