Seite 1 von 1

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Do 18 Apr, 2024 10:51
von slashCAM

Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Do 18 Apr, 2024 12:09
von Frank Glencairn
Mit Ton:


Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Do 18 Apr, 2024 17:15
von 7River
Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Do 18 Apr, 2024 19:07
von Frank Glencairn
Was schwebt dir da vor? Sprechende Steckbriefe?

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Do 18 Apr, 2024 19:17
von Tscheckoff
Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Do 18 Apr, 2024 20:08
von 7River
Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Do 18 Apr, 2024 20:51
von MK
7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Fr 19 Apr, 2024 06:17
von Frank Glencairn
7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Verfasst: Fr 19 Apr, 2024 07:21
von 7River
Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.