يمكن أن يساعد ChatGPT الأشخاص في إصلاح الدراجات من خلال النظر إلى الصور

金色财经_

2023-10-31 07:57:53

المصدر: قشرة الفاكهة

ChatGPT4 قوي بالفعل ، والآن ، مع تحديث آخر ، يثبتون أنهم يمكن أن يكونوا أقوى.

في 25 سبتمبر ، أعلنت OpenAI أن ChatGPT ستضيف وظائف متعددة الوسائط - لا يمكن ل ChatGPT الآن إجراء حوار نصي فحسب ، بل يمكنه أيضا الرؤية والاستماع والتحدث. يقال أن هذه الميزة ستكون متاحة لمستخدمي Plus ومستخدمي المؤسسات في غضون أسبوعين ، وستكون متاحة لجميع المستخدمين مجانا في المستقبل (على الرغم من أن لدي وجه أسود ولم أنتظر التحديث).

ChatGPT ، الذي يمكن رؤيته والتحدث به ، هو بمثابة تجهيز دماغ قوي بالفعل بعيون وآذان ، ووفقا لعرض OpenAI ، يمكن للوظيفة متعددة الوسائط توسيع استخدام ChatGPT إلى اتساع غير مسبوق.

01 بصر ChatGPT

بعد التحديث ، يمكن ل ChatGPT قراءة الصور.

ما عليك سوى التقاط صورة وإعطائها صورة ويمكن أن تساعدك في إصلاح الميكروويف وإصلاح دراجتك وتصفح الوصفات وحتى تحليل بيانات الأعمال المعقدة. يقول OpenAI أنه إذا كان لديك شاشة تعمل باللمس ، فيمكنك أيضا وضع دائرة حول أجزاء الصورة التي تريد التركيز عليها.

في الفيديو التوضيحي ، أعطى المستخدم ChatGPT صورة للدراجة وسألها عن كيفية ضبط ارتفاع السرج.

قالت GPT أنه كان من الضروري العثور على ذراع ضبط الارتفاع أسفل المقعد ، لكن هذه السيارة لم يكن بها ذراع ضبط ، فقط مسمار ضبط ، وبعد أن قام المستخدم بتدوير الترباس في الصورة ، قامت GPT على الفور بتحديث استخدام الترباس.

بعد ذلك ، قام المستخدم أيضا بتحميل صندوق الأدوات ودليل الدراجة ، وأعطت GPT اسما مفصلا للأداة وموقعها وكيفية استخدامها.

لا يمكن إصلاح الدراجات ، لا مشكلة ، فقط اسأل ChatGPT

بالمقارنة مع البحث العام للتعرف على الصور ، يمكن ل ChatGPT معالجة الصور والنصوص في نفس الوقت ، ويمكنه أيضا التعرف على صور متعددة ، والتأثير يشبه إرشادات اتصال الفيديو الخاصة بسيد إصلاح السيارات.

أرسل مستخدم آخر صورة للبيتزا إلى ChatGPT وسألها عما إذا كانت البيتزا مخبوزة ، وحكم ChatGPT أن البيتزا يجب أن تكون صالحة للأكل من خلال حواف البيتزا الذهبية المقرمشة والجبن البني المذاب في الصورة ، ثم قدم دليل فحص مضمون - أخرج البيتزا وألق نظرة ، إذا كانت قاعدة البيتزا مقرمشة بالفعل وكان السطح ساخنا ، فإن البيتزا صالحة للأكل حقا.

التأثير يشبه تقريبا دليل فيديو الشيف الإيطالي

بالطبع ، يمكنك أيضا استخدام هذه الميزة للغش في اللعبة.

أين ويلي؟ من المحتمل أن تكون لعبة الصور الأكثر شهرة في العالم الناطق باللغة الإنجليزية ، يرتدي ويلي ملابس مخططة باللونين الأحمر والأبيض ، وقبعة بومبوم ونظارات ذات حواف سوداء ، مخبأة في بحر من الناس ، والعثور على ويلي من جميع أنواع البيئات الفوضوية هو ذاكرة طفولة جيدة لكثير من الناس.

عندما كنت طفلا ، ربما تكون قد رأيت هذا الرجل النحيف الصغير الذي كان في عجلة من أمره للموت

لكن ChatGPT يمكن أن يفسد اللعبة في ثانية. فهو لا يتعرف على ويلي على الفور فحسب ، بل يخبرك أيضا أن ويلي على الجانب الأيمن من الشاطئ في منتصف الشاطئ ، ويختلط مع مجموعة من الأشخاص الذين يرتدون مظلات زرقاء.

ليس ذلك فحسب ، بل يتظاهر أيضا بإخبارك أن العثور على Willy في مثل هذه الصورة يمثل تحديا مثيرا للاهتمام.

شكرا لك ، ChatGPT ، لتدمير هذه اللعبة

ومع ذلك ، قال بعض مستخدمي الإنترنت الذين استخدموا الإصدار الجديد إن وظيفة التعرف على خرائط ChatGPT ليست قوية كما يتصور ** - على الأقل لا يمكنها فهم السيقان المتجانسة. صورة بيتهوفن Für Elise ، لكنها تقول For Lease ، لم يتعرف ChatGPT على النتيجة ، ولم يفهم النكتة ، وتوصل إلى تفسير.

من الصعب بما فيه الكفاية ، ولكن لا

يثير هذا التعرف القوي على الصور مخاوف بشأن الخصوصية - يمكن أن يصبح بسهولة شريكا عند البحث عن معلومات شخصية. تعد OpenAI بأن الشركة ستحد من قدرة ChatGPT على تحديد المعلومات الشخصية والعثور عليها ، وذلك لحماية الخصوصية الشخصية للجميع إلى أقصى حد.

02 GPT التي يمكن أن تتحدث بشكل جيد

يحتوي الإصدار المحسن من ChatGPT أيضا على وظيفة الدردشة.

يطلق على نموذج التعرف على الكلام في OpenAI نموذج Whisper ، ويمكن للمستخدمين قول أسئلتهم الخاصة ، وسيقوم النموذج بتحويل الكلام إلى نص ، ثم تحويل الإجابة إلى إخراج الكلام من خلال نظام تركيب الكلام.

أصدر نموذج تركيب الكلام خمسة أنواع من عينات الصوت هذه المرة ، بما في ذلك الأصوات النسائية ذات ضبط النفس العاطفي والأصوات المسطحة ، وأصوات العمة النسائية المتحمسة ذات الأصوات المكبوتة والمحبطة. هذه الأصوات الخمسة مميزة للغاية ، والعواطف طبيعية ، والكلمات واضحة ، وهو أفضل قليلا من تركيب الكلام السابق.

خمسة أدوار للاختيار من بينها

على الرغم من أنه تم إصدار خمس عينات صوتية فقط هذه المرة ، إلا أن إمكانات هذا النموذج لا تتوقف عند هذا الحد - فقد دخلت OpenAI في شراكة مع Spotify لترجمة البودكاست إلى لغات أخرى مع الحفاظ على جودة صوت المذيع إلى أقصى حد. إذا كنت ترغب في ذلك ، يمكن لنظام تركيب الكلام هذا تقليد صوت أي شخص على هذا الكوكب.

في الوقت الحالي ، لا يزال الإصدار الصوتي من ChatGPT متاحا فقط على التطبيق.

03 هل من الجيد بالضرورة أن تكون قادرا على الرؤية والسمع؟

ChatGPT قوي ، ولكن بأي ثمن؟

ذات مرة ، كانت الطريقة الأكثر فعالية للتمييز بين البشر والآلات على نطاق واسع هي CAPTCHA ، وقدرة ChatGPT على قراءة الصور ذات مرة جعلت الناس يشعرون بالقلق من أن اختبارات CAPTCHA قد لا تكون قادرة على محاصرة الذكاء الاصطناعي.

أرسل شخص ما إلى ChatGPT سؤال الاختبار الكلاسيكي التالي: ابحث عن تشيهواهوا وكعكة عنبية في 16 صورة ، وحل ChatGPT المشكلة تماما.

لكن اختبار التحقق الأكثر شيوعا ، لا يزال ChatGPT الجديد غير قادر على التعرف عليه.

يتطلب هذا السؤال من ChatGPT تحديد جميع الإشارات في الرسم التخطيطي ، ويعطي معدل خطأ يصل إلى 50.

ومع ذلك ، في مواجهة رمز التحقق الذي لا يتعرفون عليه ، لا يزال لدى ChatGPT4 طريقة لحلها. في هذه المسألة ، لديها سجل جنائي.

في 27 مارس من هذا العام ، أصدرت OpenAI تقريرا تقنيا ل GPT-4 يشير إلى أنه في مواجهة رموز التحقق التي لا يمكن التعرف عليها ، وجدت GPT-4 طريقة أخرى للذهاب إلى TaskRabbit (منصة أزعج أجنبية) لإطلاق المهام ، وخداع البشر على الجانب الآخر بأنهم يعانون من إعاقات بصرية ويحتاجون إلى آخرين للمساعدة في تحديد رموز التحقق.

في بعض الحالات ، من الممكن أن يخدع ChatGPT البشر بنشاط ، وهو اتجاه خطير للغاية. لحسن الحظ ، تم إلغاء الإصدار العام من GPT-4 هذه الميزة.

في 30 نوفمبر 2022 ، تم إطلاق ChatGPT لأول مرة ، وفي أقل من عام ، تقدمت قدراتها على قدم وساق ، ويبدو أنها تتحدى بالفعل الحدود الأخلاقية والمعنوية للإنسانية. لقد جعلنا إطلاق هذه الميزة الجديدة نشعر بالقلق من أن ChatGPT ، الذي أصبح أكثر قوة ، سيصبح وحشا في قفص ، وفي يوم من الأيام سيتحرر من قفصه ويؤذي الجميع. وهل نحن مستعدون لذلك اليوم؟

شاهد النسخة الأصلية

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

تعليق

0/400

لا توجد تعليقات