Lær at lave en digital klon med AI

Lav en digital klon med AI

I denne vejledning lærer du, hvordan du skaber en digital klon ved at benytte teknologier fra ElevenLabs og HeyGen. Resultatet? Ubegrænset videomateriale med dig selv i hovedrollen, helt uden behov for at trykke på optageknappen.

Her er et par eksempler på teknologiens anvendelse:

E-læring og online kurser: Den digitale kloningsteknologi transformerer online uddannelse og kurser. Undervisere og kursusudviklere kan ved at benytte en digital klon eliminere behovet for tidskrævende optagelser. Dette åbner for nye uddannelsesmuligheder, som tidligere var begrænset af tidsmangel – eksempelvis inkludering af videomateriale, som ikke var muligt før.

Social media: På sociale medier vil digitale kloner revolutionere indholdsproduktionen. De muliggør skabelsen af personligt og skalerbart indhold uden behov for konstant fysisk tilstedeværelse. En digital klon kan skabe konsistent, engagerende indhold, som afspejler en persons eller virksomheds brand og kan hurtigt tilpasse sig nye trends for at sikre indholdets relevans.

Personaliserede salgsvideoer: En spændende anvendelse af digital kloning er skabelsen af personaliserede salgsvideoer. Ved at integrere oplysninger oplysninger fra prospected, kan man automatisk generere skræddersyede salgsvideoer. Denne metode tillader virksomheder at skabe personligt tilpasset indhold baseret på kundens interesser og behov, hvilket kan øge engagement og konverteringsrater i marketingkampagner.

Tools til at skabe vores digitale klon:

ElevenLabs
ElevenLabs er en førende aktør inden for stemmekloningsteknologi. Platformen tilbyder en imponerende palette af professionelle stemmer, inklusiv muligheden for at klone din egen stemme. En stærk fordel ved ElevenLabs er deres brugervenlige interface, hvilket gør det nemt for brugere at generere stemmer med høj troværdighed. For kun 1 dollar i den første måned, giver ElevenLabs adgang til at klone op til 10 stemmer. Processen er utroligt enkel: Du skal blot levere en lydoptagelse på cirka 60 sekunder af din egen stemme. Den lave pris og det brugervenlige interface gør ElevenLabs til en tilgængelig løsning for alle, uanset erfaring med stemmeteknologi.

HeyGen
HeyGen er banebrydende inden for skabelsen af video-avatars, som imponerer med deres realisme og næsten menneskelige præcision. Selvom HeyGen også tilbyder stemmekloning, skiller ElevenLabs sig ud med sin markante præcision og kvalitet i stemmegengivelse. En vigtig fordel ved HeyGen er deres problemfri integration med ElevenLabs, hvilket giver mulighed for at kombinere højkvalitets stemmer med visuelt realistiske avatars. HeyGen’s gratis plan inkluderer 1 kredit, svarende til en 1-minuts video, hvilket giver en fremragende mulighed for at teste deres service. For dem, der ønsker yderligere credits, tilbyder HeyGen en betalt plan til 29 dollars pr. måned

Klon din stemme med ElevenLabs

Opret en ‘Starter’ Konto hos ElevenLabs
Start med at oprette en ‘Starter’ konto på ElevenLabs’ platform. Prisen er 1$ for den første måned, hvilket gør det økonomisk overkommeligt for alle.

Naviger til VoiceLab og Vælg Instant Voice Cloning
Når du er logget ind, skal du navigere til VoiceLab sektionen. Her vælger du ‘Instant Voice Cloning’, som giver dig muligheden for at uploade op til 25 stemmeprøver.

Forberedelse og Airdrop af Lydklip
Når du skaber en AI-drevet avatar med ElevenLabs, er en nøglekomponentet at levere en lydoptagelse af din stemme. Denne optagelse er afgørende for at skabe en præcis digital klon af din stemme. Følg disse trin for at sikre, at dine lydklip er af den højeste kvalitet:

Optagelseskrav:

  • Varighed: Optag mindst 60 sekunders lyd. Ideelt set bør dine prøver variere mellem 60 og 120 sekunder for at give systemet tilstrækkeligt materiale at arbejde med.
  • Konsistent toneleje: For at opnå den bedste genskabelse af din stemme, skal alle optagelser holdes i samme toneleje. Dette er vigtigt, da teknologien endnu er begrænset i at håndtere varierende tonelejer.

Optagelsestips:

  • Vælg en app: Brug en pålidelig optageapp, såsom ‘Memoer’ på iPhone.
  • Stille miljø: Optag i et miljø med minimal baggrundsstøj. Dette sikrer, at optagelsen fanger din stemme uden forstyrrelser.
  • Tilpasset talestil: Det er vigtigt, at du taler på en måde, som reflekterer, hvordan du ønsker at din avatar skal lyde. Hvis din avatar er beregnet til TikTok, kan en mere uformel og energisk stil være passende. Til e-læringsindhold kan en mere formel og klart artikuleret talestil være bedre. Optag i en stil, der bedst matcher formålet med din avatar.

Upload din lydfil og acceptér betingelserne
Når du uploader, er det vigtigt at give en beskrivelse af stemmen. Dette hjælper AI-systemet med at forstå og genskabe stemmens nuancer og tonefald mere præcist.

Efter upload af stemmefilerne, skal du acceptere brugsbetingelserne fra ElevenLabs. En afgørende del af disse betingelser er din bekræftelse på, at du har de nødvendige rettigheder til de optagede stemmer.

Det er essentielt, at du kun træner AI med din egen stemme eller stemmer, som du har tilladelse til at bruge. Dette sikrer overholdelse af både juridiske og etiske standarder i brugen af AI-teknologi.

Test din ElevenLabs stemme
Med din digitale stemmeklon er du nu klar til at teste den i praksis. For at gøre dette, skal du først besøge ‘VoiceLab’, som er det sted, hvor din klonede stemme er gemt.

Vælg ‘Use’ for at aktivere stemmen. Når dette er gjort, kan du indtaste tekstprompts for at høre, hvordan din klonede stemme lyder. Under denne test er det essentielt at være opmærksom på stemmens kvalitet – lyder den naturlig? Fanger den de subtile nuancer i din egen stemme? Hvis du ikke er tilfreds med, hvordan din klonede stemme lyder, kan du altid indspille en ny stemmeprøve og gentage processen.

Lav din Avatar på HeyGen

I forbindelse med oprettelsen af en digital videoavatar ved hjælp af HeyGen, er processen forholdsvis ligetil og brugervenlig. Opret dig på HeyGen og klik “Create Avatar”.

Hjemmesiden har en god guide til hvad du skal uploade, men her er nogle af de vigtigste punkter, som du bør overholde:

  • Optagelsens varighed: Sørg for at optage mindst 2 minutters video.
  • Kamera og belysning: Brug et kamera af høj opløsning(iPhone er fint) og optag i et godt belyst og stille miljø.
  • Optagelsesposition: Det er vigtigt at kigge direkte ind i kameraet under optagelsen og at holde en kort pause mellem hver sætning med lukket mund.
  • Bevægelser: Undgå store håndbevægelser, især dem der går over brysthøjde. Hold dine bevægelser generiske og inden for synsfeltet for at undgå forstyrrelser i avatarens animation.

Efter at have uploadet din video, skal du bekræfte din identitet med endnu en video, hvor du mundtligt bekræfter, at det er dig og at du har rettighederne til at generere en Avatar.

Efter upload at bekræftelsesvideoen begynder træningsprocessen, som tager omkring 5 minutter. Når din avatar er klar, vil modtage en kort test-video på omkring 10 sekunder, som viser din digitale klon. Hvis du ikke er tilfreds med resultatet, kan du genskabe din Avatar. Du kan genskabe indtil du er tilfreds med resultatet – men kan altså kun vurdere resultatet på 10 sekunders test-video, du får når træningsprocessen er færdig.

Integrer ElevenLabs med HeyGen Avatars

Når du har optaget og bekræftet tilfredsheden med din video, er det næste trin at integrere din unikke stemme fra ElevenLabs. Denne proces kan ses i videoen nedenfor, men her følger en trin-for-trin guide:

  • Oprettelse af video i HeyGen: Når du er tilfreds med din testvideo genereret af HeyGen, klik på “Create Video”. Typisk vil HeyGen automatisk have tilføjet din HeyGen-stemme, men da målet her er at bruge din egen ElevenLabs stemme, kræver det nogle ekstra trin.
  • Valg af ElevenLabs stemme: Klik på stemme-boksen til højre. Vælg her “Integrate 3rd party voice”. Dette vil åbne et vindue, hvor du kan indtaste din unikke API-nøgle fra ElevenLabs.
  • Find ElevenLabs API-nøgle: Log ind på din ElevenLabs-konto og naviger til ‘Profile’ i øverste højre hjørne af skærmen. Her vil du finde din personlige API-nøgle.
  • Integrering af stemme: Indtast din ElevenLabs API-nøgle i det angivne felt i HeyGen. Dette vil gøre det muligt at vælge og anvende din personlige stemme fra ElevenLabs til din video

Generer videoer med din digitale klon

Når din digitale klon – komplet med avatar og syntetisk stemme – er klar, kan du begynde at skabe personlige videoer.

Processen er enkel og brugervenlig:

  • Start videooprettelse: Klik på “Create Video” for at påbegynde.
  • Vælg stemme: Klik på stemmeboksen, og vælg din ElevenLabs stemme.
  • Indtast script: Skriv teksten, som din avatar skal sige.
  • Forhåndslyt: Lyt til stemmen for at sikre, at den lyder som ønsket. Du finder tips til optimering i næste afsnit.
  • Start generering: Når du er tilfreds med stemmen, tryk på “Submit” for at skabe videoen.
  • Se resultatet: Din færdige video vises, hvor du kan se, hvordan din skrevne tekst bliver levendegjort.

For at illustrere denne proces yderligere, kan du se videoen herunder der demonstrerer disse trin. I videoen:

  • Første halvdel: Jeg viser, hvordan man vælger stemme, indtaster teksten “Det betyder altså, at jeg fra nu af ved blot at skrive lidt tekst altid kan generere en klon af mig selv.”, og indsender den til generering.
  • Anden halvdel: Her ser du resultatet.

Optimering af script til AI-genereret Avatar

For at skabe en overbevisende og naturlig AI-genereret avatar, er det essentielt at finjustere dit script, så det reflekterer den ønskede udtale og rytme.

Her er nogle konkrete tips til at optimere dit script:

Brug af pausetegn:

  • Bindestreger (-): Brug bindestreger til at dele stavelser og ændre ordets prosodi.
  • Kommaer (,): Indsæt kommaer for at skabe naturlige, kortere pauser i talen.
  • Punktummer (.): Anvend punktummer for at indikere længere pauser og et faldende tonefald i slutningen af sætninger.

Fonetisk stavning:

  • Ord: For at forbedre udtalen, brug fonetisk stavning eller bindestreger. F.eks., “fotograf” kan skrives som “fo-to-graf”.
  • Tal: Skriv tal som ord eller i fonetisk form for at styre udtalen, såsom “15” ændres til “femten/fæmten”.
  • Tegn og tal: Indsæt mellemrum for at få hvert tegn eller tal udtalt separat, eksempelvis “test” til “t e s t” og “12345” til “1 2 3 4 5”.

Forkortelser:

  • Stav forkortelser, som de lyder. For eksempel, “AI” bør skrives som “a-eye” for en korrekt udtale.

Ved at anvende disse metoder sikrer du, at din digitale avatar taler på en måde, der føles både naturlig og letforståelig. En autentisk og overbevisende AI-stemme opnås gennem nøjagtig og kreativ bearbejdning af dit script, som godt kan tage et par forsøg.

Tips til at optimere din stemme

For yderligere at finjustere din klonede stemme, er det vigtigt at kende til fire nøglevariabler: stability, similarity, style, og speed. Disse indstillinger er afgørende, da de tilpasser stemmen til forskellige formål – fra en uformel TikTok-video til en mere formel e-læringspræsentation. Ved at justere disse variabler kan du skabe en stemme, der passer perfekt til din usecase.

En kort gennemgang af begreberne:

Stability:

  • Mere variabel: Variabilitet giver liv til stemmen, idet den ændrer sig ved hver generering. Dette kan dog føre til en uforudsigelig og ustabil lydkvalitet.
  • Mere stabil: Højere stabilitet sikrer ensartethed i stemmen over tid. Men pas på, en for stabil stemme kan virke monoton. Balance er nøglen, især for længere tekster.

Similarity:

  • Lav: Brug lave værdier i miljøer med baggrundsstøj. Dette hjælper med at minimere forstyrrelser i stemmegengivelsen.
  • Høj: Højere værdier forbedrer stemmens klarhed og gør den mere tro mod den ønskede taler. Men vær opmærksom på, at for høje værdier kan føre til uønskede lydeffekter.

Style:

  • Lav style: En lav/neutral indstilling er standard og giver en balanceret, naturlig tale.
  • Høj style: Brug dette for at forstærke bestemte taleaspekter. Vær dog opmærksom på, at for høje indstillinger kan påvirke stabiliteten. Et tip er at starte med en lav værdi og gradvist øge for at finde et perfekt punkt til din usecase

Speed:

  • Justering af hastigheden . En langsommere hastighed forbedrer forståeligheden, især i uddannelsesmæssige eller formelle indstillinger. En hurtigere hastighed passer til mere dynamiske eller energiske præsentationer. Personligt synes jeg ofte at speed på 1x er for langsomt, og genererer mest med 1.2x

Prøv dig frem og leg lidt med indstillingerne, indtil du rammer plet for netop dit formål. Når du finder den perfekte opsætning, er det blot et spørgsmål om at gemme den, så du i fremtiden kan producere dit content uden yderligere tests.

Afsluttende tanker

Denne guide har vist os, hvordan ElevenLabs og HeyGen kan bruges til at skabe digitale kloner. Fra stemmekloning til videoavatars, giver disse teknologier os mulighed for at producere indhold på en helt ny måde.

Som du har set er processen med at oprette en digital klon mere tilgængelig end nogensinde. Ved at følge de enkle trin og bruge de forskellige værktøjer, som ElevenLabs og HeyGen tilbyder, kan enhver skabe en overbevisende digital version af sig selv. Dette åbner op for mange muligheder, hvad enten det er til professionelt brug eller personlig kreativ udfoldelse.

I sidste ende giver ElevenLabs og HeyGen os en chance for at udforske den digitale verden på nye og innovative måder. Med lidt øvelse og eksperimentering kan vi alle udnytte disse teknologier til at skabe unikt og personligt indhold til en bred kam af usecases.