تم تطوير أداة "AudioCraft" من قبل شركة "ميتا" بهدف تسهيل عملية إنتاج الصوت باستخدام تكنولوجيا الذكاء الاصطناعي. تتضمن هذه الأداة ثلاثة نماذج للذكاء الاصطناعي التوليدي، وهي: "AudioGen" التي تساعد في إنشاء تأثيرات صوتية، و"MusicGen" التي تقوم بتوليد الموسيقى، و"EnCodec" التي تقوم بضغط الصوت للحصول على جودة عالية.
تهدف "ميتا" من خلال تلك الأدوات إلى تلبية احتياجات الموسيقيين ومصممي الأصوات في عملية تأليف الأعمال الموسيقية باستخدام =الذكاء الاصطناعي.
ويمكن للباحثين والمحترفين تدريب تلك النماذج باستخدام بياناتهم الخاصة، كما يمكن استخدام نماذج التدريب المسبق التي تكون متاحة عامة أو مملوكة لـ "ميتا"، مما يسهل الأمر ويزيل المخاوف المتعلقة بحقوق الطبع والنشر.
إضافة إلى ذلك، ستساعد «AudioCraft» مطوري الألعاب في إدخال تأثيرات صوتية واقعية وضوضاء محيطة في الألعاب.
كما تفيد أصحاب الأعمال الصغيرة في إضافة تأثيرات صوتية إلى مقاطع الفيديو التي يشاركونها مع الجمهور.
«AudioCraft» ليست الأداة الوحيدة المتاحة لتحويل النص إلى صوت بواسطة الذكاء الاصطناعي، بل إن هناك أيضا «MusicLM» التي طورتها «غوغل».
يختبر موقع الفيديوهات الشهير "يوتيوب" ميزة جديدة تقوم على توفير ملخص عن الفيديوهات، وذلك عبر توظيف تقنية الذكاء الاصطناعي، وهو ما سيختصر وقت المستخدمين.
وذكر موقع "The Verge" التقني أن هذه الميزة موجودة بشكل تجريبي على عدد محدود من الفيديوهات في "يوتيوب" ومخصصة لعدد محدود من المستخدمين.
من خلال هذه الميزة الجديدة، يأمل "يوتيوب" أن يساعد المشاهدين في اختيار المحتوى الذي يرونه بسهولة.
حاليًا، تظهر الملخصات فقط باللغة الإنجليزية في صفحات البحث وفي Youtube Watch. ولكن الهدف الأساسي من هذه الميزة، المدعومة بالذكاء الاصطناعي، هو أن تعطي الجمهور فكرة عامة عن المحتوى المتوقع، دون أن تحل محل وصف الفيديوهات التي يقدمها البشر.
كما تساعد هذه الملخصات الجمهور في تحديد ما إذا كان المحتوى مناسبًا لهم بسرعة.
يتوفر الآن أداة جديدة في برنامج تحرير الصور الشهير "فوتوشوب" من شركة البرمجيات الأميركية (Adobe) تسمى "التوسيع التوليدي".
تمكن هذه الأداة المستخدمين من ملء أجزاء من أي صورة باستخدام صور تم إنشاؤها باستخدام الذكاء الاصطناعي.
حسب الشركة، تتيح خاصية التوسيع التوليدي استخدام أداة قص الصور في "فوتوشوب" وإضافة صورة جديدة خارج حدود الحجم الأصلي لأي صورة.
بإمكان المستخدمين أيضًا استخدام خاصية الملء التوليدي لتوليد صور استنادًا إلى أوامر نصية مثل "أضف صورة غابة". وإذا لم يرغب المستخدم في كتابة أي شيء، فإن البرنامج يستطيع تخمين أفضل إضافة ممكنة استنادًا إلى مكونات الصورة الأصلية.
كما يمكن استخدام الأداة الجديدة لإضافة مشهد جديد إلى الصور أو توسيع الصورة أو إضافة سياق تخيلي إلى الصورة الحقيقية.
وأشارت الشركة إلى أن برنامج "فوتوشوب" يمثل أداة أساسية لعمل الكثيرين من المبدعين، وإضافة الذكاء الاصطناعي التوليدي إليه يعد تغييرا مهما للبرنامج، مع التحفظ على البيانات التي تستخدمها لتدريب تقنية الذكاء الاصطناعي، من خلال الابتعاد عن المناطق الحرجة مثل الشخصيات الشهيرة والعلامات التجارية المعروفة.
أعلنت شركة غوغل اليوم عن إضافة اللغة العربية إلى Bard، وهو روبوت دردشة تفاعلي يعتمد على الذكاء الاصطناعي التوليدي، ويهدف لتعزيز الإبداع من خلال تقديم أفكار جديدة واستكشاف المواضيع من زوايا مختلفة، وتسهيل الوصول إلى المحتوى المعقد من خلال تبسيطه.
يعتمد Bard على نموذج PaLM 2 اللغوي الحديث من غوغل، الذي تم تصميمه خصيصًا لفهم المعلومات بلغات متعددة.
ويمكن لـ Bard الآن فهم الأسئلة بأكثر من 16 لهجة عربية، مثل اللهجة المصرية والسعودية، ولكنه يستجيب عادةً باستخدام اللغة العربية الفصحى.
بالإضافة إلى ذلك، يمكن لـ Bard فهم الطلبات التي تحتوي على كلمات باللغة العربية ولغة أخرى في نفس الوقت، ويدعم واجهة المستخدم الكتابة من اليمين إلى اليسار.
ميزات روبوت Bard من غوغل:
إمكانية الاستماع إلى ردود Bard بصوت عالٍ من خلال تقنية تحويل النص إلى كلام.
إمكانية حفظ المحادثات السابقة مع Bard وتنظيمها وتعديلها.
إمكانية مشاركة ردود Bard مع الأصدقاء باستخدام روابط قابلة للمشاركة.
إمكانية تصدير رموز Python البرمجية إلى منصة Replit التفاعلية لتسهيل عملية البرمجة، ومنصة Google Colab وهي تساعد المطورين في كتابة وتنفيذ كود بلغة Python عبر المتصفح، لمساعدة المطوّرين في الترميز.
إمكانية الاستفادة من (عدسة غوغل) Google Lens – وهي منتج من غوغل يتعرّف الصور والنصوص ويحللها – ليتمكّن المستخدمون من تحميل الصور ضمن طلباتهم في Bard (ولكن هذه الميزة تتوفر باللغة الإنجليزية فقط حتى الآن).
إمكانية تغيير ردود Bard من حيث الأسلوب، مثل: جعلها أكثر مرحًا أو أكثر بساطةً أو أطول أو أقصر أو أكثر احترافية أو أقل رسمية (تتوفّر هذه الميزة باللغة الإنجليزية فقط حتى الآن).
يجدر الإشارة أن Bard تم إطلاقه أولاً باللغة الإنجليزية في مارس/ آذار من هذا العام كتجربة تتيح للمستخدمين التفاعل مع تقنيات الذكاء الاصطناعي التوليدي. واليوم، أصبح Bard متوفرًا بأكثر من 40 لغة، ومنها: الصينية والألمانية والهندية والإسبانية.
قامت شركة يوتيوب بالإعلان عن دعم خدمة Aloud المبتكرة، و تعتمد هذه الخدمة على تقنية الذكاء الاصطناعي في دبلجة مقاطع الفيديو إلى لغات أخرى. وكشفت الشركة عن تجربة الأداة مع مئات من منشئي المحتوى خلال مؤتمر "فيد كون"، حيث تدعم بضع لغات، ومنها: الإنجليزية والإسبانية والبرتغالية، ومع وعد بدعم المزيد من اللغات قريبًا.
وتتيح الأداة نسخ ما يقال في الفيديو إلى نص يمكن تحريره و مراجعته، ثم تقوم الأداة بترجمة النص ودبلجته.
كما تجري يوتيوب حالياً اختبارًا لميزة جديدة تدعى "اختبر وقارن"، حيث يمكن للمنشئين إرفاق ثلاث صور مصغرة لمقطع الفيديو، ليُساعد يوتيوب في اختيار الصورة المثلى.
بالإضافة تعمل يوتيوب على جعل الصوت في المسارات الصوتية المترجمة شبيهاً بصوت المنشئ الأصلي. ومن المتوقع إطلاق إصدار تجريبي من "اختبر وقارن" في الأشهر المقبلة، قبل إطلاقها للجمهور العام خلال العام المقبل.
يعمل مشرفون على أحد أحواض السباحة في ألمانيا على اختبار نظام مراقبة جديد يستخدم تطبيقا للذكاء الاصطناعي بهدف إنقاذ حياة السباحين عند تعرضهم للخطر.
وقد بدأ الفريق بإستخدام هذا التطبيق كتجربة منذ شهر أغسطس/آب 2020، ويتكوّن النظام الجديد من 4 آلات تصوير تنقل المعلومات المتعلّقة بحركات السباحين إلى شاشةٍ مثبّتة في السقف فوق حوض السباحة، الذي يبلغ طوله 25 مترًا وعرضه 15 مترًا.
كما يشرح توماس باوم، مدير العمليات في شركة "ماتياكوا" المشغّلة لحمّام السباحة في المدينة:"الكاميرات ترصد أشكال الحركات للسبّاحين، وتسجّلها، ثم يقوم الذكاء الاصطناعي بتحليلها".
وفي حال اعتبار الحركات غير طبيعية، يُنبّه النظام طاقم العاملين في حمام السباحة ويخطرهم بوجود مشكلة عن طريق ساعاتهم الذكية، وتنطلق من الساعة الذكية صفارةٌ عاليةٌ، كما يتم عرض نقطةٍ حمراءٍ على الشاشة الذكية لإظهار الوضع الدقيق للشخص الذي يتعرّض للمشكلة، مع عرض 3 صور له.
بالإضافة كان قد تعلَم الذكاء الاصطناعي بمرور الوقت نوعية الحركات الطبيعية للسباحين، ومتى يكون الشخص في مشكلة.
وفي نهاية المراحل التجريبية، يتطلّع المسؤولون في شركة "ماتياكوا" إلى استخدام هذا النظام في حمامات سباحة أخرى في المدينة.
من المزايا الجانبية لهذه التقنية هو تتبّع بعض المخاطر التي يتعرّض لها الصغار أثناء السباحة، علاوة على إمكانية التنبيه لفريق الإنقاذ داخل المياه.
تُعرض في أحد المتاحف السويدية منحوتة مستوحاة من أعمال خمسة من أبرز النحاتين العالميين بينهم ميكيلانجيلو وأوغوست رودان، جرى ابتكارها حصراً بفضل برامج للذكاء الاصطناعي وأُطلقت عليها تسمية "التمثال المستحيل".
وفي حديث إلى وكالة فرانس برس، قالت الناطقة باسم شركة "ساندفيك" التي صممت التمثال بوليينا لوندي "إنه تمثال فعلي صنّعه خمسة من معلّمي النحت ما كانوا ليتعاونوا في الحياة الواقعية".
ويُعرض التمثال المصنوع من فولاذ مقاوم للصدأ والذي يبلغ ارتفاعه 150 سنتمتراً ووزنه 500 كيلوغرام، في متحف التكنولوجيا في ستوكهولم، في خطوة تشكل مؤشراً إلى التغيير الحاصل في المفاهيم التقليدية للفن.
كما يمثّل هذا العمل امرأة نصف جسدها السفلي مغطى بسترة، وتحمل كرة من البرونز بيدها اليسرى.
وتكمن الفكرة من هذا التمثال في ابتكار مزيج من أنماط النحاتين الخمسة الذين طبع كلّ واحد منهم مجال النحت في عصره، وهم ميكيلانجيلو (إيطاليا، 1475-1564)، أوغوست رودان (فرنسا، 1840-1917)، كاثي كولفيتس (ألمانيا، 1867-1945)، كوتارو تاكامورا (اليابان، 1883-1956)، أوغوستا سافاج (الولايات المتحدة، 1892-1962).
بالإضافة تشير جوليا أولديريوس، وهي مسؤولة عن الابتكار في المتحف "ثمة شيء في التمثال يشعرك بأنّه ليس من ابتكار بشر".
ولإنجاز المنحوتة، قام مهندسو "ساندفيك" بتغذية أنظمة الذكاء الاصطناعي بصور كثيرة من منحوتات أنشأها هؤلاء الفنانون.
ثم قدّمت برامج الذكاء الاصطناعي مجموعة من الصور الثنائية الأبعاد تعكس بحسب أولديريوس الطابع الخاص بكلّ نحات.
أضافت أولديريوس "دمج مهندسونا هذه الصور الثنائية الأبعاد في نموذج ثلاثي الأبعاد، ومن هنا بدأنا تصنيع التمثال".
لكن هل تُعدّ هذه المنحوتة عملاً فنياً أم مجرّد إنجاز تقني؟ تجيب أولديريوس "نعم، أعتقد أن هذا عبارة عن فنّ"، معتبرةً أنّ الحكم يعود في هذا الخصوص للجمهور.
المصدر:info3