Generaal

Met hierdie nuwe tegnologie kan u klank net soos teks redigeer


Ingenieurs van die Princeton Universiteit het die Photoshop vir klankversorging ontwikkel. Dit word aangekondig as die kopie en plak van die klank. Hierdie nuwe sagteware kan woorde byvoeg of woorde vervang in die klankopname van 'n menslike stem.

[Beeldbron: Pixabay]

Klankingenieurs kon al jare lank klankgrepe verwyder deur die transkripsie van die snit te redigeer. Hulle kon egter nog nooit 'n woord byvoeg of vervang om dit duidelik te maak nie. Hierdie nuwe sagteware - VoCo - sintetiseer die nuwe woorde met gemak in die spreker se stem, selfs al kom die woord nêrens anders in die opname voor nie.

"VoCo automatiseer die soek- en stikwerkproses en lewer resultate wat gewoonlik nog beter klink as dié wat deur klankdeskundiges handmatig geskep word," het Adam Finkelstein gesê. Finkelstein dien as professor in rekenaarwetenskap aan Princeton.

Hoe die sagteware werk

Die sagteware gebruik 'n algoritme wat die hele opname skandeer en 'n kombinasie van woordklanke saamvat. Daardie klanke, wat foneme genoem word, loop uit op die nuwe woord in die oorspronklike stem. Die algoritme kan selfs die woord in 'n sin plaas. Dit neem die konteks van die woord in ag en voeg die gepaste klem by.

"VoCo bied 'n blik op 'n baie praktiese tegnologie vir die redigering van klanksnitte, maar dit is ook 'n voorbode vir toekomstige tegnologieë wat die menslike stem op merkwaardige maniere kan laat sintetiseer en outomatiseer," het Finkelstein gesê.

In werklikheid het verskeie mense reeds die ingenieurs genader om hulle te help om weer hul stem te kry. Die nagraadse student Zeyu Jin bied die navorsing in Julie aan. Jin het opgemerk dat die VoCo-sagteware die stemloses kan stem.

"Ons is genader deur 'n man wat 'n neurodegeneratiewe siekte het en slegs kan praat deur middel van 'n teks-na-spraakstelsel wat deur sy ooglede beheer word," het Jin gesê. "Die stem klink robotagtig, soos die stelsel wat deur Steven Hawking gebruik is, maar hy wil hê dat sy jong dogter sy regte stem moet hoor. Dit is miskien eendag moontlik om opnames uit die verlede van hom te ontleed en 'n hulpmiddel te skep wat in sy eie stem spreek. . "

Etiese vrae

Die tegnologie stel ook interessante etiese vrae. Die navorsers besef dit en wil moontlike kwessies aanspreek.

"Vandag aanvaar ons dit as vanselfsprekend dat foto's geredigeer kan word, en ons beoordeel foto's met 'n bietjie meer skeptisisme," het Finkelstein gesê. "Ons verstaan ​​dat daar 'n joernalistieke verantwoordelikheid by foto's is."

Sou dit toegelaat word om in nuusgrepe woorde in te voeg wat dikwels ontbreek soos 'a', 'en' en 'die'? Hierdie woorde kan soms ter wille van die duidelikheid in die teks gevoeg word. Hulle kan egter die hele betekenis van 'n stelling verander. Neil Armstrong was byvoorbeeld van plan om 'Een klein stap vir 'n man' te sê eerder as 'Een klein stap vir die mens'. Hoe kan hierdie tegnologie 'n invloed hê op die manier waarop ons klankgrepe hoor en onthou? 'N Nog meer paranoïese vraag kan waarheid in die algemeen beskou. Kan die bestaan ​​van hierdie tegnologie in 'n era waar feite subjektief word, die skuld kry dat dit die waarheid verdraai?

Vir nou verwag die ingenieurspan 'n wyer bespreking van die gebruik van die sagteware.

'Hierdie instrument sal byna seker die gesprek oor klank aanwakker wat voorafgegaan is deur 'n gesprek oor foto's,' het Finkelstein gesê. "Dit sal binnekort gevolg word deur 'n gesprek oor video."

Die volledige navorsingsprojek kan in die tydskrif gevind word Transaksies op grafika. U kan meer oor die projek uit die voorafdruk van die vraestel op die Princeton-webwerf lees.

SIEN OOK: Hierdie klein toestel kan besoedelde lug in waterstofbrandstof omskakel


Kyk die video: Sigwoorde Graad 1 (Augustus 2021).