كشفت شركة "شينجشو تكنولوجي - Shengshu Technology" الصينية، عن أداة جديدة مدعومة بالذكاء الاصطناعي يمكنها توليد مقاطع فيديو عن طريق الجمع بين الصور.
أوضحت الشركة في بيان نقلته شبكة "سي إن بي سي"، أن لديها بالفعل أداة ذكاء اصطناعي تدعى "فيدو - Vidu" لتوليد مقاطع فيديو مدتها 8 ثوانٍ بناء على أوامر نصية، وهي بذلك تحاكي نموذج "سورا" من "أوبن إيه آي" الأمريكية الذي يمكنه توليد مقاطع مدتها دقيقة واحدة بنفس الطريقة، لكن الشركة لم تطرحه للعامة بعد.
وذكرت "شينجشو" أن الميزة الجديدة في أداة "فيدو" تجعلها قادرة على الجمع بين 3 صور، مثل شخص وقميص ودراجة نارية، ومن ثم توليد فيديو لشخص يرتدي قميصاً ويقود دراجة نارية.
تدعي شركات أخرى متخصصة في مجالات الذكاء الاصطناعي قدرة نماذجها على تحويل النصوص والصور لمقاطع مصورة، لكن جودة المنتج النهائي تختلف من نموذج لآخر.
في حين قالت الشركة الصينية إن التطور في أداتها الجديدة يتمثل في قدرتها على دمج 3 صور مميزة، ودمجها في سياق بصري متناغم لتوليد مقطع الفيديو.
وأشار "فان باو" كبير مسؤولي التكنولوجيا في الشركة إلى أن مسألة السياق البصري كانت هي المشكلة التي تؤثر على جودة الفيديو المولد، واستطاعت "شينجشو" التغلب عليها.
أطلقت الشركة إصداراً من أداة توليد الفيديو عبر الصور في أبريل الماضي، وتعتمد على الجمع بين صورتين وتحويلهما إلى مقطع قريب من الواقع، وانتشر فيديو لأشخاص يعانقون بعضهم البعض مولداً بواسطة الأداة عبر تطبيق التواصل الاجتماعي "تيك توك" ولاقى شهرة واسعة.
التعليقات {{getCommentCount()}}
كن أول من يعلق على الخبر
رد{{comment.DisplayName}} على {{getCommenterName(comment.ParentThreadID)}}
{{comment.DisplayName}}
{{comment.ElapsedTime}}