Signalbehandling.pdf

Full Transcript

Grundläggande signalbehandling av media Zoé Magnusson Kursansvarig: Ole Norberg 2023-01-17 1. Introduktion - Vad är en signal? - Exempel: EKG (hjärtats puls), valutakurs, ljud… - Ett värde som förändras över tiden eller spatiellt,...

Grundläggande signalbehandling av media Zoé Magnusson Kursansvarig: Ole Norberg 2023-01-17 1. Introduktion - Vad är en signal? - Exempel: EKG (hjärtats puls), valutakurs, ljud… - Ett värde som förändras över tiden eller spatiellt, ex. över sträckor, ytor - Alla signaler har sina egenskaper - Parametrar - Amplitud A - Hur mycket den svänger - Periodtiden T - Hur snabbt den svänger 1 - Frekvensen 𝑓 = 𝑇 (mäts i Hz) - Tidsplanet beskriver hur signalen varierar över tid - Frekvensplanet - För att gå från tidsplanet till frekvensplanet används Fouriertransform - Egenskaper - I en periodisk signal återkommer samma mönster med ett visst intervall - Tidskontinuerliga signaler har alltid en signal - Tidsdiskreta signaler har endast värden i vissa definierade punkter Kodning - Source coding - Koda informationen på ett smart sätt - Ex: istället för att skicka 7000 nollor, skicka info att det ska vara 7000 nollor - Channel coding - Kodning som säkerställer att informationen är korrekt - Modulation - Information mixas i en bärvåg - Sedan filtreras signalen ut Begrepp - Filterkärna där summan av dess innehåll ska vara 1 - Faltning är att ta filterkärnan och jämföra den med värdena i frekvensplanet steg för steg - Ger en mer avrundad “kurva” - Information plockas bort - Filtret tar ut den första frekvensen i datat Fouriertransform - Periodiska signaler kan byggas upp med en serie av sinus- och cosinusvågor - Ex. en fyrkantspuls kan beskrivas med hjälp av en sådan serie - Signalerna byggs upp med vågor som är multiplar av grundfrekvensen, f: 2f, 3f, …, nf - För att återskapa signalen adderas de olika sinus- och cosinusvågorna - Ju fler multiplar som adderas desto mer lik originalsignalen blir den återskapade signalen 2. Tema 1 - Fouriertransform - Typer av signaler - Periodiska - Tidskontinuerliga - Diskreta - Icke-periodiska - Tidskontinuerliga - Diskreta - Tidsplanet och frekvensplanet 3. Tema 1 - Fouriertransform i två dimensioner - Signaler kan återskapas med sinusvågor i samma frekvens + dess multiplar - Det krävs många komponenter (multiplar) för att få till skarpa kanter - Längden på en puls påverkar längden på frekvensspektrat - En kort puls ger ett brett spektrum - En lång puls ger ett smalt spektrum - Magnituden är storleken på vektorn (som har en reell och imaginärdel) - Fasen är hur signalen är förskjuten i sidled (storleken på vinkel) 4. Tema 2 - Sampling och kvantisering Digitalisering - En dator kan inte representera analoga signaler - Signaler måste därför digitaliseras - Analog signal → sampling → kvantisering → digital signal - Kvantisering handlar om hur många nivåer det finns - Nivåer ex. i en gråskala - Antingen en jämn gråskala eller gråskala med tydliga steg - Påverkar toningen - Sampling handlar om antalet pixlar och storleken på pixlarna - Påverkar skärpan Sampling - Hur noga man kan mäta efter tidsaxeln - Matematisk representation av sampling - Samplingsfrekvens är tiden mellan efterföljande mätpunkter - Samplingsteoremet - Gränsen för frekvenserna som kan ingå i analysen är halva samplingsfrekvensen, Nyquistfrekvensen - Aliasing, spegling, vinkling - Vid sampling kan signaler med olika frekvenser få samma mätvärden och därför inte gå att urskilja - Allt med högre frekvens än Nyquistfrekvensen dyker upp som en spegling - 441 000 Hz är standard vid sampling av musik - Subsampling - Sampla upp eller ner en signal - Gör signalen kortare eller längre - Det som ligger ovanför den nya samplingsfrekvensen viks in - Spatial vikning - Om pixlarna är för stora blir det en vikning som ger en överlagd sinusvåg - Zooma ut och in - Förstora genom - Lägga till nearest neighbour - Bilinjär - Bicubic tar med fler pixlar - Samplingshastigheten bestäms av insignalens bandbredd - Totala samplingstiden bestämmer upplösningen i frekvensspektrumet - En längre signal ger bättre upplösning Kvantisering - Anger hur noga amplituden återges - Definition - Kvantisering innebär att en signals värden, valda ur en stor mängd, ersätts med andra värden, valda ur en mindre mängd - Ex. skostorlekar - Hur många minnesbitar tar vi upp? - Fler bitar ger högre noggrannhet - Bilder 8 bitar = 256 nivåer (färger) - CD 16 bitar = 65536 nivåer - Kvantiseringsfel eftersom värden avrundas till närmaste nivå - Distortion (brus) - Bitupplösning (R) är det genomsnittliga antalet bitar som behövs för att representera - Maximala felet är halva steglängden - Distorsionen (msqe) går att beräkna genom att jämföra punkt för punkt - Likformig kvantisering - Likformig är de vanligaste kvantiseringen - Men det finns även olinjär där stegen behöver inte vara lika - Olinjär kvantisering - Man kan ha tätare steg i vissa intervall 5. Tema 2 - Sampling och kvantisering 2023-01-31 Dynamiskt omfång - Ett histogram kan visa hur många pixlar det finns av varje färg i gråskalan - Ett dynamiskt omfång är från lägsta värdet till högsta värdet - HDRI - High Dynamic Range - Teknik för att ta överexponerade bilder och lägga ihop med mörka bilder - Ökar det dynamiska omfånget Tryckning - När foto ska återges i tryck (4 färger) - Grafisk produktion - Tryckpunkter som kan varieras hur tätt de ligger - Ju närmare punkterna ligger desto mörkare blir färgen 6. Repetition tema 1 och 2 2023-02-02 Ole Norberg 7. Tema 3 - Bildbehandling 2023-02-07 Ulrik Söderström Innehåll - Grundläggande bildbehandling - Fouriertransformering - Filtrering - Spatialdomän - Frekvensdomän - Frekvenser i en bild handlar om skillnader - Från vitt till svart ger störst kontrast, alltså högst frekvens Vad är bildbehandling? - Kan delas upp i tre delar - Förbättring - Image enhancement - Återställning - Image restoration - Analys - Image analysis - Vad är en digital bild? - Ett 2-dimensionellt fält som innehåller värden - En svartvit bild har en färgkanal - En färgbild har tre färgkanaler, RGB Pixel - Innehållet i en bild - 14 Mpixel = 14 miljoner pixlar - Gråskala - 8 bitar (0 - 255) - 0 är svart, 255 är vit - Färg - 24 bitar - 3 × 8 bitar 24 - 2 = 16, 78 miljoner färger - Svartvitt är binärt, inte samma som gråskala Färgsystem (färgrymder) - Komponenter - Färgkomponenter - Trefärgssystem - Luminanskomponenter - Gråskala - Intensitetskomponenter - Färg - Olika sätt att representera färg - RGB - HSV (färgton, intensitet, mättnad) - YCbCr - I det mänskliga ögat finns det tappar för tre olika färger - Genom dessa tre kan alla färger representeras - Därför används trefärgssystem - Färger är ljus med olika våglängd - Vår upplevelse av färg handlar om hur mycket ljus som reflekteras till våra ögon RGB - Additiv färgrymd - Ingenting är bara svart, alla färger blir vitt - Vanligaste färgrymden - Används i kameror 24 - 8 bitars upplösning ger 2 = 16, 78 miljoner färger - Mer än vad mänskliga ögat kan urskilja - 16 bitars upplösnings ger i princip obegränsat antal färger CMYK - Subtraktiv färgrymd - Ingenting är vitt, alla färger blir svart - Cyan (ljusblå), Magenta (lila), Gul, Svart - Används i skrivare eftersom papper är vitt - Varför lägga till svart? - En blandning av CMY är inte riktigt svart - Det mesta som skrivs ut är svart - Tre färger kan göra pappret vått YUV - Y är luminans (gråskala) - U och V är färginformation - Y är viktigare än U och V för det mänskliga ögat - Olika subsamplingar använder mindre data av U och V - Återger ändå de viktigaste delarna - Vanligaste är 4:2:0 HSV - Hue - Färgton - 0-360O - Saturation - Mättnad - 0-100% - Value - Intensitet - 0-100% - Kan gå mellan HSV och RGB utan att förlora information Färgblandning - Färger genereras genom att blanda grundfärger - Additiv färgblandning - Subtraktiv färgblandning - Blandning av små tätt placerade färgelement - Bildskärm, TV, utskrift Photon spectrum - Olika våglängder för olika färger - Det synliga spektrumet är relativt litet - Infrarött och UV-ljus är utanför vårt spektrum Bildbehandling Närhet (Adjacency) - Håll koll på vilka håll det finns grannar - En granne kan definieras på två olika sätt - 4 adjacency - 8 adjacency Avstånd - Euklidiska avståndet = fågelvägen - Det vanligaste sättet att mäta avstånd mellan grannar - Matematiskt problem - D4 avstånd - D8 avstånd - “Schackbrädeavstånd” - Alla D8-grannar (x, y) har avstånd 1 - Kvartersavstånd (City block distance) - Antal “hus” på vägen Fouriertransform - Fouriertransform är komplex även om originalbilden har reella värden - Vid fouriertransform får en bild två matriser - Reell del = magnitudmatris - Imaginär del = fasmatris - Smal signal i spatialplanet ger brett spektrum i frekvensplanet och tvärtom - För att göra något smalt krävs fler och högre frekvenser - För att göra något brett krävs färre och lägre frekvenser Filtrering i spatialdomän vs frekvensdomän - I spatialdomänen görs filtrering av pixlar - Frekvenseffekt omöjligt att skapa i spatialdomänen - I frekvensdomänen görs filtrering av frekvenser - Kan ha samma effekt, men olika effektivitet beroende på domän - Ibland mer effektivt i frekvensplanet men då krävs fouriertransform och dess invers - Faltning vs multiplikation - Storleken på filterkärnan påverkar effektiviteten - Stora filter - Ineffektivt med faltning - Multiplikation är effektivare - Snabbare, mindre operationer, mindre energiåtgång - Små filter - Färre antal operationer i spatialdomänen - Faltningsteoremet - Filtrering i frekvensdomänen motsvarar faltning med filtrets invers i spatialdomänen Spatial filtrering - Operation på pixlar - Områden av pixlar - 5 × 5 filterkärna = 25 pixlar - Ska ha en pixel i mitten, alltså ojämnt antal pixlar - Linjära filter - Har samma effekt på hela bilden - Olinjära filter - Effekten beror på innehållet i bilden - Adaptiva filter - Ofta mer effektivt men kräver mer beräkningar - Effekten förändras - Bild, yttre förutsättningar Filterkärnor - Varje fält i filtret har ett värde - Summan av alla värden blir 1 - Delar med antalet fält för att inte ändra medelvärdet Faltning - Filterkärnan faltas med bilden - Spegelvänd filtret - Bilden kan även speglas - Flytta filtret över alla pixlar i bilden - Beräkna ett nytt värde för den mittersta pixeln - Vid kanterna gör man “zero-padding” Linjära filter - Lågpassfilter - Släpper igenom låga frekvenser och filtrerar bort höga - Gör bilden suddigare - Minskar effekten av brus (är oftast högfrekvent) - Medelvärdesfilter - Ett exempel på en typ av lågpassfilter - Alla pixlar i kärnan har lika stort värde - Stora förändringar förminskas - Små förändringar ändras inte - Filterkärnans storlek bestämmer effektens storlek - Fler värden ger suddigare bild - Högpassfilter - Släpper igenom höga frekvenser och filtrerar bort låga - Framhäver brus - Summan ska bli noll till skillnad från ett medelvärdesfilter - Högpassfilter är kantdetekteringsfilter - Vissa filter hittar kanter i bara en riktning - Sobel-filter lägger större vikt på den mittersta pixeln - Gx-filtret hittar kanter i x-led (horisontellt) - Gy-filtret hittar kanter i y-led (vertikalt) - Prewitt-filter är inte lika bra - Andra filter hittar kanter i båda riktningar - Laplace-filter - Öka skärpan (Sharpening) - Addera originalet med ett filter som ger skarpare kanter - Olika medelvärdesfilter - Aritmetiskt medelvärdesfilter - Summerar ihop alla värden och tar medelvärdet - Geometriskt medelvärdesfilter - Multiplicerar och upphöjer - Får bort mer brus - Gör att svarta delar blir större (pga multiplikation med 0) - Brukar förlora mindre bilddetaljer än aritmetiskt filter Olinjära filter - Filter vars svar baseras på pixlarna som finns i området av filtret - Sorterar upp pixlarnas värden i storleksordning Medianfilter - Tar värdet i mitten - Tom filterkärna - Effekten beror på pixlarna i bilden - Tar bort små förändringar men behåller det stora - Tar bort smått brus utan att ta bort kanterna på bilden - Bra på att ta bort brus som är små vita och svart korn (salt och peppar) - Bättre än medelvärdesfilter på att ta bort brustoppar Andra linjära filter - Max- och minfilter - Ett maxfilter gör en bild ljusare - Sorterar alla pixelvärden och väljer det högsta värdet - Höga värden är ljusa och låga värden är mörka - Eftersom höga värden väljs så blir bilden ljusare - Ett minfilter gör en bild mörkare - Väljer det lägsta värdet - Eftersom låga värden väljs blir bilden mörkare - Mittpunktsfilter - Beräknar mittpunkten på pixlarnas värde genom att ta genomsnittet av det lägsta och det högsta värdet - Alfa-trimmade medelvärdesfilter - Radar upp alla värden och tar bort de högsta och lägsta och tar sedan medelvärdet Filtrering i frekvensdomänen - Dämpa vissa frekvenser - Lämna andra oförändrade - Multiplicera med ett filter - Elementvis multiplikation - Filtrera både reell och imaginär del - Ändrar inte fasen LP- och HP-filter - Idealt lågpassfilter - Behåller låga frekvenser och tar bort höga frekvenser - Men transformer kan inte hantera skarpa kanter - Tydliga ringningseffekter - Faltningsteoremet: “Filtrering i frekvensdomänen motsvarar faltning med filtrets invers i spatialdomänen” - Gaussiskt LP- och HP-filter - Ger en mjukare övergång så att det inte blir några skarpa kanter som transformen inte kan hantera - Får inga ringningseffekter - Bandspärrfilter - Spärrar vissa frekvenser och släpper igenom resterande - Ett idealt filter som ger problem med ringningseffekter - Ett icke-idealt bandspärrfilter har inte skarpa kanter - Bandpassfilter - Som ett inverterat bandspärrfilter - Släpper igenom vissa frekvenser och spärrar resterande - Notch-filter - “Tar bort” en frekvens - Lätt att ta bort vissa frekvenser - Frekvensberoende brus kan tas bort i frekvensplanet, men ej i spatialplanet Bildkvalitet - Peak Signal-To-Noise Ratio (PSNR) - Mått på hur lika två bilder är - Används i all typ av forskning - Objektiv - Baserad på pixellikhet - Mean Square Error, MSE 8. Tema 3 - Komprimering Ulrik Söderström 2023-02-09 - Nästan all digital information är komprimerad - Varför? - All data lagras på hårddiskar och andra lagringsmedier i form av filer, så utrymmet är alltid begränsat - Vid överföring av data (mediesignaler) är kanalens bredd begränsad - Bra komprimering minskar datats storlek utan att kvaliteten blir märkbart försämrad Lossless och lossy komprimering - Icke förstörande (lossless) - Bevarar all information - När man packar upp en komprimerad fil är det en exakt kopia av originalet - Används vid komprimering av data och programfiler - Komprimering 1-4 ggr - Zip är den vanligaste - Förstörande (lossy) - Vid komprimeringen förloras information - Kan aldrig återställas till sitt exakta original - Används vid medieapplikationer - Komprimering 10-100 ggr Redundans - Spatialredundans - Likheter mellan närliggande pixlar - 250 252 249 - 250 2 -3 är - Lossless komprimering (datat kan återskapas) - Tidsredundans - Likheter mellan närliggande bilder - Musik, videor - 250 252 249 - 250 2 -1 - Lossless komprimering Informationsteori - Källa - En uppsättning av symboler 𝐴 = {𝑎1, 𝑎2, …, 𝑎𝑗} - Varje symbol kan inträffa med en viss sannolikhet - Den finita samlingen (𝐴, 𝑧) beskriver källan helt och hållet - Själv-information - Hur mycket information innehåller en bild? - En slumpmässig händelse 𝐸 som inträffar med sannolikhet 𝑃(𝐸) innehåller ett visst antal enheter energi: - 𝐼(𝐸) kallas själv-information - Osannolika händelser har högre själv-information - Ju mindre sannolikt att något ska hända desto mer information innehåller det - Entropi - Anger en källas genomsnittliga information i varje tecken - Motsvarar genomsnittligt antal bitar som går åt för att optimalt koda en händelse i källan - Entropin avser den totala informationen i källan - Entropin beskriver valfriheten (osäkerheten) i källan - Stor valfrihet motsvarar hög entropi - Stor slumpmässighet ger hög entropi - Informationskanal - En informationskanal ansluter källan till användaren - Själv-information överförs mellan informationskällan och användaren Teorem om felfri kodning - Det är möjligt att göra kodlängden Lavg/n godtyckligt nära entropin H(z) genom att koda oändligt långa kodstycken av källan - Om man har en viss entropi i en källa så kan man inte felfritt komprimera den till att lägre än entropin Variabel längdkodning - Beroende på hur sannolikt något är så tilldelar man kodlängd utifrån det - Sannolika kodord får kortade kodlängd (genom att tilldela färre bitar) - Detta komprimerar data Kvalitetskriterier - Hur kan vi bedöma om en komprimering är bra? - Objektiv kvalitet - Jämför pixel för pixel i originalbilden med den komprimerade bilden - MSE (Mean Square Error) - Litet värde innebär bra kvalitet - Men det är svårt att veta om ett enskilt värde är bra eller dåligt - PSNR (Peak Signal-to-Noise Ratio) - Jämför MSE med högsta möjliga värde - Ett högt värde är bra - Detta mått används oftast eftersom det är objektivt - Subjektiv kvalitet - Utmärkt, fin, tveksam, marginell, sämre, oanvändbar - Fråga personer vad de tycker Felfri komprimering - Ger 2-10 gångers komprimering - Fungerar lika bra på alla sorters bilder - Binära, gråskala, färg - Består av två delar 1) Alternativ representation av bilden som minskar interpixelredundansen - Minskar skillnad mellan olika pixlar - Strukturerar om en bild för att det ska bli mer effektivt att komprimera den felfritt 2) Kodning som minskar kodningsredundans Huffmankodning - Optimal för ett bestämt antal kodord - Minsta möjliga antal kodsymboler per källsymbol - Koden skapas från början - Behöver inte veta något om bilden innan den komprimeras - Unik avkodning som inte går att blanda ihop - Använder binära Huffmankoder 1) Skriv upp sannolikheter för varje symbol 2) Sortera symbolerna i storleksordning utifrån deras sannolikheter 3) Slå ihop de två minsta sannolikheterna och sortera igen 4) Upprepa tills det bara finns ett värde kvar 5) Gå tillbaka och tilldela koder Medelkodordslängd och effektivitet - Beräkning: - Medellängden på kodorden 𝑀 𝑁 = ∑ 𝑃𝑖 · 𝑁𝑖 1=1 - 𝑃 är sannolikheten och 𝑁 är kodordslängden - Anges i antal bitar - Entropin 𝐽 𝐻(𝑋) =− ∑ 𝑃𝑗 · 𝑙𝑜𝑔2(𝑃𝑗) 𝑗=1 - Kodningseffektiviteten - Jämför medellängden på kodorden och entropin - Medellängden på kodorden kan inte bli mindre än källans entropi Run-Length kodning - Utvecklad på 50-talet - Standardkomprimering för fax - Kodning - Starta med första pixelns värde - Koda antalet pixlar som kommer - Eftersom det är binärt behöver man sedan endast skriva hur många av varje - Variabel längdkodning ger ytterligare komprimering - Ingen nytta för fax eftersom det bara behövs två tecken - Exempel: - Vit =1, svart = 0 - 113213 Transformkodning - Innebär att man flyttar till en annan domän - Metod 1) Kodning - Dela upp bilden i delar - Transformera - Kvantisera - Komprimera genom kodning av symboler 2) Avkodning - Avkoda symboler - Inverstransform - Sätta ihop delbilderna - Olika transformer - Fouriertransform - Fouriertransform och invers fouriertransform är väldigt lika - Det enda som skiljer är ett minustecken - Diskret cosinustransform (DCT) - En matematisk transform från tidsdomänen till frekvensdomänen - Används ofta för komprimering - Omvandlar block av ingångsvärden till en linjärkombination av dessa mönster - DCT använder endast reella tal till skillnad från Fouriertransformen JPEG - Bildkomprimering - DCT-beräkning - Kvantisering - Använder en kvantiseringsmatris - Innehåller ett värde som motsvarar steglängden i kvantiseraren - Sedan delar man med steglängden - Variabel längdkodning - 8x8 delbilder - Vänster till höger, uppifrån och ner - Vi ser mindre skillnader i höga frekvenser jämfört med låga frekvenser - Därför kan höga frekvenser komprimeras hårdare - Både Run-Length och Huffmankodning Waveletkodning - Bilden delas inte upp i delbilder - Huvudsakliga skillnaden mellan waveletkodning och transformkodning - JPEG2000 MPEG - Är för video - Huvudkomponenter - Block (8 × 8 pixlar) - Makroblock (2 × 2 block, 16 × 16 pixlar) - Skiva (en rad av makroblock) - Bild (en hel bildruta) - Grupp av bilder (GOP) - Videosekvens (en eller flera GOP:er) - YUV-komprimering - YUV-komprimering innebär subsamplingen 4:2:0 - Antalet pixlar i färgraderna minskas utan att resultatet blir märkbart sämre - 4:4:4 är originalet (okomprimerad sampling) - Första 4:an är konstant är står för ljuset som aldrig komprimeras - De två andra 4:orna anger antalet pixlar i första respektive andra färgraden - Blockkomprimering - Samma som JPEG - Temporal komprimering - Intilliggande bilder har stora likheter - Temporal komprimering kan uppnås på två sätt: 1) Kasta bilder (minska bildfrekvens) - 15 bilder per sekund upplevs som video - Inte en jättebra metod 2) Genom motion estimation - Rörelseuppskattning och rörelsevektorer - Beräkna positionen för makroblocket i den nya bilden - Spara förflyttningen (rörelsevektorn) och skillnaden i utseende - Ger väldigt hög komprimeringsgrad MPEG - Grupp av bilder (GOP) - MPEG använder tre typer av bilder - I-bilder (intrakodade) - P-bilder (prediktivt kodade) - B-bilder (dubbelriktat kodade) - Eftersom det är lossy komprimering så kan det uppstå komprimeringsfel - Speciellt randiga mönster kan ge fel 9. Tentarepetition Föreläsning 2023-03-14 Kompendiet “Signaler och system i frekvensplanet” från Chalmers: https://www.cse.chalmers.se/~svenk/dig_sign.tl/kompendium/grundbok/kap4.pdf Tema 1 - Fouriertransform Ole Norberg Periodisk signal - Återupprepas i perioder - Återkommer till samma utgångsläge efter en viss tid - En signal som innehåller två sinussignaler - Minsta gemensamma nämnaren blir grundfrekvensen Vad är en fourieranalys? - En beskrivning av frekvensinnehållet i signalen - Dess viktigaste egenskap - Stöd för beräkning av utsignalen från ett system - Ett hjälpmedel för reduktion/komprimering Vad är en fourierserie? - Om vi har en periodisk signal kan vi använda fourierserie - Signalen är uppbyggd av sinus- och cosinuskomponenter - Första frekvensen är signalens grundfrekvens, sedan kommer multiplar av den - Kallas även grundton och övertoner - Alla multiplarna gör ett helt antal perioder under signalens periodtid - Ex. den första övertonen (𝑘 = 2) som gör exakt två perioder under originalsignalens periodtid 1 - Grundfrekvensen är omvänt proportionell mot periodtiden, 𝑓0 = 𝑇0 - Fourierserien ger ett ändligt antal frekvenskomponenter → diskret frekvensspektrum Icke-periodiska funktioner - Icke-periodiska funktioner kan betraktas som periodiska med en oändlig periodtid - Vi kan ej göra Fourierserie, men istället fouriertransform - Olika fouriertransformer: - Fouriertransform - Ger ett kontinuerligt frekvensspektrum - (Pga att periodtiden är oändligt lång → oändligt antal sampel → komponenterna ligger oändligt tätt → kontinuerligt spektrum) - Kräver ett oändligt antal sampel - Kan därför inte användas i praktiken - Fouriertransform kan betraktas som en generalisering av Fourierserier - Diskret fouriertransform (DFT) - Ger ett diskret spektra - Ett mellanting mellan fourierserie och fouriertransform - Gör samma beräkning som vanlig fouriertransform, fast med ett ändligt antal sampel - Fler sampel ger bättre upplösning (mer detaljerat frekvensspektrum) men tar längre tid - Fast Fourier Transform (FFT) - FFT ger samma resultat som DFT, fast den är mycket snabbare Mer om Fourieranalys Signal Beräkning Frekvensspektrum Periodisk Fourierserie Diskret Periodisk Fouriertransform Diskret Icke-periodisk Fouriertransform Kontinuerligt Båda Diskret fouriertransform Diskret Skalningar av signaler - Amplitudskalning - Om amplituden skalas så skalas magnituden i frekvensspektrat på samma sätt - Tidsskalning (ändring av periodtid) - För icke-periodisk signal så skalas magnituden i frekvensspektrat på samma sätt - För Fourierserier (periodiska signaler) påverkar tidsskalning ej magnituden Tidsförskjutning av signaler - Om signalen förskjuts i tiden så påverkas endast fasdelen hos transformen, inte frekvenskomponenterna - 𝑥(𝑡 − 𝑎) - Ett minustecken innebär förskjutning till höger - Ett plustecken innebär förskjutning till vänster Faltning i tidsplanet/frekvensplanet - Faltning mellan två signaler i tidsplanet är samma som multiplikation av signalernas fourierkoefficienter i frekvensplanet - Multiplikation mellan två signaler i tidsplanet ger faltning mellan signalernas fourierkoefficienter i frekvensplanet Linjäritet - Fouriertransform är linjär - Om en signal kan delas upp i delsignaler så kan Fouriertransformen beräknas för varje delsignal för sig och sedan addera resultaten 2D Fouriertransform - Separabel i x- och y-riktning Tema 2 - Sampling och kvantisering - Samplingshastighet - Tidsintervall som definierar hur ofta signalen mäts (vilka värden på x-axeln där signalen är definierad) - Kvantisering - Vilka nivåer som signalens värde kan ha - Anger hur noga vi återger signalens värde (vilka värden som finns på y-axel) Aliasing, spegling, vikning - Samplas en kontinuerlig signal kommer resultaten att bli en tidsdiskret signal - Endast frekvenser upp till halva samplingsfrekvensen kommer att återskapas korrekt - Resterande frekvenser kommer att speglas/vikas in - När man samplar kan man få samma resultat för olika signaler - En högfrekvent signal kan överlappa med en lågfrekvent signal i vissa punkter - Vid vissa samplingsfrekvens kan man då ej urskilja mellan dessa två signaler Kvantiseringsfel - Distorsionen beräknas - MSE (Mean Square Error) Tema 3 - Bildbehandling Ulrik Söderström Färgrymder - RBG - Additiv färgrymd - Vanligt upplösning är 8 bitar, som ger 16,7 miljoner färger - CMYK - Subtraktiv färgrymd - Svart läggs till för att det är bättre än att använda tre färger för att skriva ut Fouriertransform - Smalt i tidsplanet blir brett i frekvensplanet - En smal signal kräver högre frekvenser - Brett i spatialdomänen blir smalt i frekvensdomänen - En bred signal innehåller lägre frekvenser Filter - Linjära filter - Olinjära filter - Hur filtret fungerar beror på vad bilden har för innehåll - Medianfilter - Tar medianen - Order statistics filter Filtrering i frekvensdomänen - Multiplicera med ett filter - Elementvis multiplikation - Idealt lågpassfilter - Ringningseffekter (upprepningar av mönstret utanför figuren) Tips: Ifall det är två prickar i frekvensspektrat innebär det att signalen är en sinussignal Komprimering - Icke-förstörande (lossless) - Återskapar informationen exakt som originalet - Komprimering 1-4 ggr - Används för data- och programfiler - Förstörande (lossy) - Information förloras - Kan aldrig återställas till sitt exakta original - MPEG, JPEG - Komprimering 10-100 ggr - Används vid medieapplikationer Informationsteori - Beräkna hur mycket information som finns i en källa - Självinformationen 𝐼(𝐸) baseras på sannolikheten för händelsen - Tips: 2 logaritmen finns inte på våra miniräknare, använd formeln för 10 logaritmen - Entropi - Anger den totala information som finns i hela källan - Själv-informationen - Anger informationen i ett budskap - En likformigt fördelat källa har högre entropi än en olikformigt (ex. gaussiskt) fördelad källa. Kvalitetskriterier - Objektiv kvalitet - MSE - Bra kvalitet är ett lågt värde - PSNR - Relaterar MSE till det högsta värdet som pixlarna kan ha - Högt värde innebär bra kvalitet - Subjektiv kvalitet - När människor får avgöra om kvaliteten är bra eller dålig Felfri komprimering - Ger 2 till 10 ggr komprimering - Funkar bra på alla sorters bilder - Exempel - Binära Huffmankoder - Variabel längdkodning - Sannolika händelser får kortare kodord - Ger en komprimering utan att tappa information - Lossless komprimering - Run-length kodning - Räknar hur många värden som kommer - Blockkomprimering - Använder både Huffmankodning och Run-length kodning - Används i MPEG, JPEG - Teorem: Man kan inte felfritt komprimera en källan till lägre än entropin MPEG - Temporal komprimering - Rörelseuppskattning - Skillnad mellan bilder - Kollar på hur bilden har förflyttats och kodar skillnaderna - Ger en jättehög komprimeringsgrad eftersom mycket är exakt lika mellan bilder

Use Quizgecko on...
Browser
Browser