használata

Minden alkalommal, amikor okostelefonunkkal fotózunk, internetes keresést végezünk, közösségi oldalakon teszünk közzé vagy használjuk a mobiltelefon GPS-jét, az ujjlenyomatunkat a világon hagyjuk. Percenként hatalmas mennyiségű adatot állítunk elő, és a számok a következő néhány évben csak növekedni fognak: üdvözöljük a nagyszabású adatok és a hiperinformációk korában.

A vállalkozások számára ez a forgatókönyv aggasztó kihívást jelent: hogyan dolgozza fel rengeteg strukturálatlan információt gyorsan és hatékonyan?

Az elmúlt években a gépi tanulás a digitális innováció stratégiai középpontjába került az üzleti életben, és átalakítja működésüket, automatizálja a folyamatokat és valós idejű betekintést tesz lehetővé. Kezdjük az elején:

Mi a gépi tanulás?

A gépi tanulás a mesterséges intelligencia (AI) területének egyik tudományága, amely képes algoritmusok létrehozására, amelyek lehetővé teszik a számítógépek számára megtanulják az adatok alapján elvégezni a feladatokat, ahelyett, hogy kifejezetten beprogramozták volna. Ezek a "modellek" képesek azonosítani a képzési adatokból (példákból) származó mintákat, és képesek bizonyos magabiztossággal megjósolni a jövőbeli eseményeket és döntéseket hozni emberi beavatkozás nélkül. Ez különösen értékes a nagy adatbázisok feldolgozása és a folyamatok automatizálása szempontjából.

A Spotify számára a Gépi tanulás használata stratégiájuk központi eleme: lehetővé teszi számukra, hogy személyre szabott zenei élményeket kínálhassanak felhasználóiknak, és ízlésük és érdeklődésük alapján új számokat ajánljanak.

A Google a maga részéről blokkolja a SPAM-üzeneteket a felhasználói postafiókokból a Gmailben. A Machine Learning által képzett algoritmusnak köszönhetően több millió üzenetet elemez, és képes felismerni a nem kívánt e-mail mintákat.

Viszont ez a technológia szoros kapcsolatban áll egy másik, az AI-ből származó tanulmányi területtel: a természetes nyelv feldolgozásával (NLP). NLP arra törekszik, hogy a számítógépek képesek legyenek rá megérteni az emberi nyelvet: nemcsak abban a tekintetben, amit egy szöveg vagy egy beszélő mond, hanem - különösen - mit is jelent: a szándékot, az érzést, a témát. Ezen írásos vagy szóbeli üzenetek elemzéséhez az NLP integrálja a gépi tanulás, a nyelvészet és az informatika fogalmait.

Az NLP és a Machine Learning kombinációja lehetővé teszi építsen olyan modelleket, amelyek képesek megtanulni az emberi nyelv értelmezését. Az ehhez kapcsolódó egyik legérdekesebb terület a szövegelemzés: a szöveg automatikus elemzése.

Hogyan használja a Gépi Tanulást a szöveg elemzéséhez?

Az automatikus szövegelemzés általában két speciális technikát alkalmaz: osztályozás és kinyerés.

A szöveges osztályozási modellek úgy működnek, hogy kategóriákat rendelnek az adatokhoz annak tartalma szerint. Ez lehetővé teszi az olyan feladatokat, mint a Sentiment Analysis (a szöveg érzésének észlelése), Topic Analysis (a téma vagy téma azonosítása), a Language Detection (a nyelv felismerése, amelyen írva van) és a Intent Detection (a cikk szerzője által kifejezett szándék azonosítása). a szöveg). Például szöveges osztályozóval elemezhetnénk a márkával kapcsolatos több ezer tweet tartalmát, és az egyes üzenetek hangulatát "pozitív", "negatív" vagy "semleges" kategóriába sorolhatnánk.

A szövegkivonási modellek viszont a szövegben található bizonyos információk azonosításán és megszerzésén alapulnak. Olyan feladatokban használják, mint a Kulcsszókivonás (a szövegben a legrelevánsabb kulcsszavak meghatározása), az Entitásfelismerés (az emberek vagy vállalatok nevének azonosítása) és az Összefoglaló kivonat (összefoglaló szöveg készítése). Ha célunk lenne a cégnevek, a termékleírások vagy más, a szövegben található adatok kinyerése, akkor extrakciós modelleket kell használnunk.

Milyen alkalmazásai vannak az iparban?

A MonkeyLearn * -nél különféle területekről és iparágakból származó ügyfeleink vannak, akik a Machine Learning segítségével automatizálják a folyamatokat, órányi kézi munkát spórolnak meg, értékes információkat szereznek az adatok elemzéséből és jobb üzleti döntések meghozatalához használják fel őket.

Eddig az a terület, ahol a legtöbbet dolgoztunk, az ügyfélszolgálat és az ügyfelek visszajelzése.

Vevőszolgálat

A gépi tanulásnak és az NLP-nek köszönhetően az ügyfélszolgálati csapatok automatizálhatják mindennapi folyamataikat, és értékes információkat szerezhetnek az ügyfelekkel folytatott beszélgetések elemzéséből.

Olyan modellek használatával, amelyek lehetővé teszik a témák vagy témák azonosítását, osztályozásukat a kliens érzelme vagy szándéka szerint, annak észlelését, hogy melyik nyelven találhatók, és - ami ezen a területen nagyon fontos - meghatározzák az üzenet sürgősségét, az ügyfélszolgálat osztálya:

  • A támogatási jegyeket automatikusan megkereséssel vagy panasszal címkézni (valami manuálisan történik),
  • Automatikusan levezeti a jegyeket a legmegfelelőbb csapatoknak a kezelésükhöz (például, ha műszaki vizsgálat érkezik, a technikai csapatot automatikusan továbbítják),
  • Észlelje meg a jegy sürgősségét, és időben fontossági sorrendbe állítsa azt (például, ha egy e-kereskedelmi webhely vásárlója panaszkodik arra, hogy a terméket törve szállították).

Vásárlói visszajelzés

A MonkeyLearn nagyon hasznos mindenféle ügyfél-visszajelzés feldolgozásához, legyen szó többek között elégedettségi felmérésekből, termékismertetőkről és a közösségi médiában tett megjegyzésekről.

Platformunk egyszerű és gyors módon lehetővé teszi, hogy gépi tanulási modelleket hozzon létre, amelyek automatikusan megértik és strukturálják ezt a visszajelzést, és így értékes betekintést nyerhetnek a döntéshozatalhoz. Ezzel elkerülhető az egyes szövegek kézi olvasása, ezáltal időt és erőforrásokat takaríthat meg a vállalatok.

Például az NPS (Net Promoter Score) felmérések az egyik legnépszerűbb mutatója a vásárlói visszajelzéseknek. Lehetővé teszik a felhasználók termékhez vagy szolgáltatáshoz való lojalitásának mérését, és promóterekként vagy becsmérlővé minősítik őket. A numerikus értékelés mellett ezek a felmérések egy további kérdést is tartalmaznak, „miért adtad nekünk ezt a pontszámot?” Stílusban. Ezeket a nyílt válaszokat gyakran nehezebb feldolgozni, és következetlenségeik lehetnek.

Képzeljük el, hogy a felhasználó 6-os pontszámot rendel egy céghez, majd megjegyzést fűz: „A termék nagyszerű, imádom az UX-jét, és nagyon egyszerűen használható. A rossz az ára: túl drága ”. A megjegyzés feldolgozásához kategóriákat vagy címkéket kell rendelni hozzá, például az alábbiak szerint:

  • "A termék nagyszerű, imádom az UX-jét és nagyon egyszerűen használható":
    • Szempontok: UX, Könnyű használat
    • Érzés: pozitív.
  • "A rossz az ára: túl drága":
    • Szempontok: Ár.
    • Érzés: Negatív.

Most képzelje el, hogy 5000 ilyen választ manuálisan feldolgoz. költséges, lassú és unalmas a vállalatok számára.

A Gépi tanulás segítségével a nyitott válaszokat elemezheti, hogy új dimenziót adjon az adatokhoz. Nem csak lehetővé teszi a felhasználók hangulatának automatikus értelmezését (hangulatelemzés), hanem arról is, hogy milyen szempontokról vagy témákról beszélnek (témakeresés), és milyen konkrét kifejezések jelennek meg gyakran ezekhez a témákhoz kapcsolódóan (kulcsszó kivonása). Ezeknek az elemzéseknek az eredményeként olyan betekintést kapnak, amelyek drámai módon javítják a döntéshozatalt, és lehetővé teszik a vállalatok számára, hogy a tapasztalatok javítására összpontosítsanak az ügyfelek számára kulcsfontosságú pontokon

Hogyan alkalmazható a vállalatoknál?

A MonkeyLearn-nél különböző modellopciókat kínálunk a Machine Learning segítségével. A legkényelmesebb kiválasztása az egyes vállalatok vagy területek sajátos igényeitől függ.

Azok számára, akik azonnal el akarják kezdeni, előre kiképzett modelljeink vannak az angol szövegek automatikus elemzésére. Például ez az előre kiképzett hangulatelemző modell a legkorszerűbb eredményekhez közelít.

Másrészt úgy gondoljuk, hogy minden probléma egyedi, és hogy az előrejelzések nagyobb pontosságának elérése érdekében szükség van egy egyedi gépi tanulási modell felépítésére. Ehhez kifejlesztettünk egy grafikus felületet a MonkeyLearn-en belül, amely lehetővé teszi a felhasználók számára, hogy programozás vagy gépi tanulási ismeretek nélkül könnyen létrehozzanak egy osztályozási vagy kinyerési modellt, importálják adataikat, létrehozzák saját címkéiket, és személyes kritériumaikat felhasználják az algoritmus betanításához. A modelleket jelenleg több mint 20 nyelvű szövegek elemzésére lehet képezni, többek között spanyol, angol, portugál, német, olasz, francia, kínai, japán nyelven.

Ügyfeleink általában egy előre betanított modell használatával indulnak, majd továbbhaladnak az egyedi modellek képzésére a nagyobb pontosság és részletesség érdekében.

Tippek az első lépésekhez

Az alapvető ajánlás azoknak, akik a gépi tanulással kezdik, az fokozatosan haladni. Kezdje azzal, hogy csak egy vagy két modellt képez ki konkrét feladatokra, figyelje meg, milyen értéket jelent a vállalat számára, és csak ezután gondoljon új modellekre a többi folyamat egyszerűsítése érdekében.

Könnyű megkísérteni, hogy egyszerre sok folyamatot akar automatizálni. De ez csak elsöprő és frusztráló, időt és értéket pazarol egy vállalkozás számára. Bár a gépi tanulás elérhetőbb, mint valaha, figyelembe kell venni, hogy van egy tanulási görbéje, és hogy általában meg kell változtatni a vállalatok bizonyos belső folyamatait, mielőtt készen állnának az indulásra.

A második tippünk, amikor egy első modellt képezünk a Machine Learning segítségével az adatminőségre összpontosítani. Igaz, hogy minél több példát használnak egy modell képzésére, annál pontosabbak lesznek az előrejelzései. De végül az adatok minőségének van nagyobb súlya.

Célszerűbb 1000 képzési példát használni, de győződjön meg arról, hogy azok jól fel vannak címkézve és reprezentatívak-e azokra a helyzetekre, amelyekre a modellt tanítani szeretné, mint háromszor annyi példát használni, de címkézési hibákkal (a hozzárendelt címke) a példához), vagy amelyek nem nagyon relevánsak a modellezendő probléma szempontjából.

A gépi tanulás használata a szövegek elemzéséhez automatikusan megnyitja a lehetőségeket a végtelen fejlesztési lehetőségek és a versenyelőnyök előtt. Az adatok valódi értéke nem abban rejlik, hogy birtokolják őket, hanem abban, hogy megszólaljanak és képesek legyenek útmutatásként használni a jobb döntések meghozatalához: válság előrejelzése, egy termék fejlesztése, megkülönböztetés a versenytől.

A gépi tanulás kezdete nagyon egyszerű lehet. Ha kíváncsi vagy, és szeretnéd felfedezni a projektben vagy vállalkozásban rejlő lehetőségeket, akkor felkérünk, hogy regisztrálj a MonkeyLearn-nél és próbáld ki a platformot.

* A MonkeyLearn egy Uruguayban született platform, amely megoldásokat kínál a vállalatok számára a szöveges automatikus elemzés gépi tanulással történő elvégzésére.