China stellt fortschrittliche Text-zu-Video-KI-Modelle vor
China pr?sentiert mit Vidu und Ying zwei fortschrittliche Text-zu-Video-KI-Modelle, die den Wettbewerb mit dem amerikanischen Sora aufnehmen und die rasante Entwicklung des Landes im KI-Sektor unterstreichen. Diese Innovationen bieten beeindruckende Videoerzeugungskapazit?ten und k?nnten die globale KI-Landschaft nachhaltig ver?ndern.
Im Rahmen einer neuen Entwicklung im Bereich der künstlichen Intelligenz (KI) hat China mehrere einheimische Text-zu-Video-KI-Modelle vorgestellt und damit einen Meilenstein für den raschen Fortschritt des Landes in wichtigen neuen KI-Bereichen gesetzt. Diese Modelle sollen mit Sora konkurrieren, einem bekannten KI-Modell, das von der US-amerikanischen Firma OpenAI entwickelt wurde.
Am Donnerstag wurde das chinesische Text-zu-Video-KI-Modell Vidu den Nutzern zur Verfügung gestellt, das die Kernfunktionalit?ten der Generierung von Videos und Bildern aus Text bietet. Es bietet den Nutzern die Wahl zwischen Vier-Sekunden- und Acht-Sekunden-Videoclips mit einer Aufl?sung von bis zu 1080P.
Vidu, das erstmals auf dem Zhongguancun-Forum im April 2024 angekündigt wurde, gilt als das erste chinesische Produkt, das mit den F?higkeiten von Sora vergleichbar ist.
Darüber hinaus hat ein anderes chinesisches KI-Unternehmen, ChatGLM, vor kurzem sein Text-zu-Video-KI-Modell Ying auf den Markt gebracht, das auf der Grundlage von Texteingaben Videos mit einer Aufl?sung von 1440x960 erzeugen kann.
Das Ying-Modell basiert auf der neuesten Generation von CogVideoX und wurde auf der Grundlage dieses Modells weiterentwickelt. Nach den Informationen, die ChatGLM der Global Times mitteilte, kann Ying jetzt einen Sechs-Sekunden-Videoclip innerhalb von 30 Sekunden erstellen.
Medienberichten zufolge hat Vidu nach mehr als dreimonatigen Verbesserungen nun neue Funktionen wie die Konsistenz von Zeichen zu Video, Anime-Stil und die Erzeugung von Videos mit Text und Spezialeffekten. Au?erdem kann Vidu innerhalb von 30 Sekunden einen Vier-Sekunden-Clip erstellen.
Die F?higkeiten von Vidu reichen in Bezug auf Komposition, Erz?hlung und Beleuchtung fast an das Niveau von Kinofilmen heran. Darüber hinaus kann es filmreife Spezialeffekte wie Rauch, schillernde Lichteffekte und CG-Effekte erzeugen.
Die schnelle Entwicklung Chinas im aufstrebenden KI-Sektor wurde von Wang Jingtao, dem stellvertretenden Direktor der chinesischen Cyberspacebeh?rde, auf der 12. Internet-Sicherheitskonferenz und KI-Konferenz am Mittwoch unterstrichen. Er erkl?rte, dass es in China inzwischen über 180 ?ffentlich verfügbare generative KI-Modelle gibt und die Zahl der registrierten Nutzer 564 Millionen übersteigt.
Die Entwicklung dieser KI-Modelle wird in China tatkr?ftig unterstützt. So wird zum Beispiel die Rechenleistung von ChatGLMs Ying-Modell von der Beijing AI Public Computing Platform unterstützt. Die Regierung unterstützt die Forschung und Entwicklung von ChatGLM umfassend, einschlie?lich industrieller Investitionen, Rechenleistung, Demonstrationsanwendungen und Fachkr?ften.