Mi az Autoencoder?

Az autokódoló nagyszerű eszköz a bemenet újrateremtéséhez. Egyszerű szóval a gép mondjuk képet készít, és szorosan kapcsolódó képet képes előállítani. Az ilyen típusú ideghálózatba beírt bemenet nincs bejelölve, ami azt jelenti, hogy a hálózat képes felügyelet nélküli tanulásra. Pontosabban, a bemenet hálózati kódolású, hogy csak a legkritikusabb tulajdonságra összpontosítson. Ez az egyik oka annak, hogy az auto-kódoló népszerű a dimenzió csökkentésében. Ezen kívül autokódolók is használhatók a gyártáshoz generatív tanulási modellek. Például az ideghálózat egy arckészlettel oktatható, majd új arcokat hozhat létre.

Ebben az oktatóanyagban megtudhatja:

Hogyan működik az Autoencoder?

Az autokódoló célja a bemenet közelítésének előállítása, amely csak az alapvető jellemzőkre összpontosít. Gondolhatja, miért nem csak megtanulja, hogyan kell bemásolni és beilleszteni a bemenetet a kimenet előállításához. Valójában az autokódoló olyan megszorítások összessége, amelyek arra kényszerítik a hálózatot, hogy ne csak a kimenetet másolja, hanem új módon is megtanulja az adatokat.

A tipikus autokódolót bemenettel, belső ábrázolással és kimenettel (a bemenet közelítésével) határozzák meg. A tanulás a belső reprezentációhoz kapcsolódó rétegekben történik. Valójában két fő réteg blokk van, amelyek úgy néznek ki, mint egy hagyományos neurális hálózat. A kis különbség az, hogy a kimenetet tartalmazó rétegnek meg kell egyeznie a bemenettel. Az alábbi képen az eredeti bemenet az első blokknak megy kódoló. Ez a belső ábrázolás tömöríti (csökkenti) a bemenet méretét. A második blokkban a bejárat rekonstrukciója zajlik. Ez a dekódolási szakasz.

példa

A modell frissíti a súlyokat, minimalizálva a veszteség funkciót. A modell büntetést kap, ha a rekonstrukció kimenete eltér a bemenettől.

Pontosabban képzeljen el egy képet, amelynek mérete 50 × 50 (azaz 250 képpont), és egy neurális hálózatot, egyetlen rejtett réteggel, amely 100 neuronból áll. A tanulás egy jellemző térképen történik, amely kétszer kisebb, mint a bemenet. Ez azt jelenti, hogy a hálózatnak meg kell találnia a módját 250 pixel rekonstrukciójára, csak 100 neuronvektorral.

Halmozott Autocoder példa

Ebben az oktatóanyagban megtanulhatja, hogyan kell használni a halmozott autokódolót. Az architektúra hasonló a hagyományos neurális hálózathoz. A bemenet egy rejtett réteghez kerül tömörítésre vagy méret csökkentésére, majd eljut a rekonstrukciós rétegekhez. A cél egy olyan kimeneti kép készítése, amely olyan közel van, mint az eredeti. A modellnek meg kell tanulnia a feladat teljesítésének módját korlátok alatt, vagyis alacsonyabb dimenzióval.

Manapság az automatikus kódolókat főleg kép retusálásához használják. Képzeljen el egy képet karcolásokkal; az ember még mindig képes felismerni a tartalmat. Az autokódoló dekódolásának az a célja, hogy zajt adjon a képhez, hogy a hálózatot arra kényszerítse, hogy megtanulja az adatok mögött álló mintát.

Az autókódolók másik hasznos családja a variációs autoenkódoló. Ez a típusú hálózat új képeket generálhat. Képzelje el, hogy férfi képével hálózatot képez; egy ilyen hálózat új arcokat produkálhat.

Hozzon létre egy autókódolót a TensorFlow segítségével

Ebben az oktatóanyagban megtanulhatja, hogyan kell felhalmozott autokódolót készíteni egy kép rekonstruálásához.

Használja a CIFAR-10 adatkészletet, amely 60 000 32 × 32 színes képet tartalmaz. Az adatkészlet már 50 000 képre van felosztva a képzéshez és 10 000 kép a teszteléshez. Legfeljebb tíz osztály létezik:

  • Repülőgép
  • Autó
  • Madár
  • Macska
  • Szarvas
  • Kutya
  • Béka
  • Küld
  • Kamion

Le kell töltenie a képeket erre az URL-re: https://www.cs.toronto.edu/

kriz/cifar.html és csomagolja ki. A for-10-batches-py mappa öt adatköteget tartalmaz, 10 000 képpel, véletlenszerű sorrendben.

A modell felépítése és oktatása előtt alkalmaznia kell néhány adatfeldolgozást. Az alábbiak szerint jár el:

  1. Importálja az adatokat
  2. Konvertálja az adatokat fekete-fehér formátumba
  3. Csatolja az összes köteget
  4. Készítse el a képzési adatkészletet
  5. Hozzon létre egy képmegjelenítőt

Kép előfeldolgozása

1. lépés) Importálja az adatokat.

A hivatalos honlap szerint az adatokat a következő kóddal töltheti fel. A kód betölti az adatokat egy szótárba a adat és a címke. Vegye figyelembe, hogy a kód egy függvény.