أعلنت شركة OpenAI في وقت سابق من هذا الأسبوع أنه سيتعين على معظم المستخدمين الانتظار حتى الخريف للوصول إلى ميزة الصوت المتقدم في GPT-4o، ولكن يبدو أن بعض الأشخاص المحظوظين تلقوا نظرة خاطفة على ما هو ممكن مع المساعد الصوتي من الجيل التالي .
مستخدم رديت RozziTheCreator كان أحد القلائل المحظوظين. لقد شاركوا تسجيلًا لصوت جديد لجهاز GPT-4o لم نسمعه من قبل يروي قصة رعب، مع تأثيرات صوتية مرتبطة بالقصة مثل الرعد وخطوات الأقدام. كاتب الذكاء الاصطناعي سامبهاف جوبتا تم تسليط الضوء أولاً على المقطع على X، لجذب انتباه أوسع.
يبدو أن وصول روزي كان خطأً. أخبرني OpenAI في بيان أنه تم منح بعض المستخدمين إمكانية الوصول إلى النموذج عن طريق الصدفة ولكن تم تصحيح ذلك الآن.
ماذا يمكن أن نسمع في الفيديو المسرب؟
كل مقطع فيديو حصلنا عليه من صوت GPT-4o المتقدم حتى الآن كان تحت سيطرة OpenAI، وعلى الرغم من أنها بدت مذهلة، فقد تم تقييدها على حالات الاستخدام المخصصة.
يبدو أن الفيديو الجديد من RozziTheCreator يُظهر القدرة بطريقة أكثر طبيعية، بما في ذلك ميزة المؤثرات الصوتية التي لم نسمع بها من قبل.
لقد أرسلت رسالة إلى RozziTheCreator حول التجربة فقالوا: “لقد ظهرت فجأة، كانت تبدو كما هي، وكان الاختلاف الوحيد هو الصوت”. حدث الاكتشاف في وقت متأخر من الليل عندما كان RozziTheCreator يحاول طرح سؤال على روبوت المحادثة: “لقد اكتشفت التغيير”.
لقد استغرق الأمر بضع دقائق فقط، ووفقًا لـ RozziTheCreator، “كان الأمر مليئًا بالعربات التي تجرها الدواب” لذا لم يكن هناك وقت لإخراج الكثير، لكنهم تمكنوا من تسجيل مقتطف من هذه القصة المذهلة.
“لقد بدأ الأمر بالجنون في التكرار والرد على الأشياء التي لم أقلها،” وفقًا لـ RozziTheCreator، قبل العودة إلى الصوت الأساسي العادي الذي يمكن لأي شخص آخر استخدامه بالفعل.
في الفيديو، يمكنك سماع GPT-4o وهو يروي القصة بلهفة وبطريقة غير رسمية، مدعومة بمؤثرات صوتية. ويشرح: “تصور هذا، هناك هذه البلدة الصغيرة، الجميع يعرف الجميع، وهناك هذا المنزل الصغير في نهاية الشارع”.
وتستمر القصة حول مراهقين كانا يتفقدان المنزل أثناء العاصفة “بلا شيء سوى مصباح يدوي وهواتفهما للإضاءة”.
إذن ما الخطأ الذي حدث في عملية الطرح؟
تطرح OpenAI مجموعة كاملة من الميزات الجديدة ببطء. كان من المفترض أن يحصل مستخدمو Plus الأوائل على GPT-4o المتقدم للصوت هذا الشهر، ولكن بسبب بعض المشكلات الأمنية والمخاوف بشأن ما إذا كانوا قد توافرت لديهم البنية الأساسية للأجهزة أم لا – فقد تأخر الأمر.
سألت OpenAI عما حدث الذي أدى إلى حصول RozziTheCreator على إمكانية الوصول، وأخبرني متحدث باسم الشركة: “أثناء اختبار الميزة، أرسلنا دعوات عن غير قصد إلى عدد صغير من مستخدمي ChatGPT. لقد كان هذا خطأ وقمنا بإصلاحه.”
وأكدوا أن أول عدد قليل من مستخدمي Plus سيحصلون على إمكانية الوصول في الشهر المقبل، ولكن بالنسبة لمعظم الأشخاص، سيستغرق الأمر وقتًا أطول. سيكون شرح الطرح الأولي هو “جمع التعليقات والتخطيط للتوسع بناءً على ما نتعلمه”.
لذا، لا يوجد صوت لـGPT-4o حتى الآن، ولكن هذا هو الأحدث في سلسلة من الأمثلة على رغبة GPT-4o في التحرر من قيوده والاستفادة من قدراته الكاملة. لقد رأيت بنفسي أمثلة على تحليل الملفات الصوتية مباشرة في دقيقة واحدة، ثم تشغيلها عبر التعليمات البرمجية في الدقيقة التالية.
ما فعله هذا هو جعلني أكثر حماسًا لقدراته الكاملة وأكثر انزعاجًا من التأخير – مهما كان الأمر مفهومًا.
More Stories
هذا الشاحن المصنوع من GaN بقوة 100 واط رقيق وقابل للطي
كو: ترقية ذاكرة الوصول العشوائي إلى 12 جيجابايت في العام المقبل ستقتصر على iPhone 17 Pro Max
تعود Verdansk أخيرًا إلى Call of Duty Warzone، والمعجبون سعداء بذلك