Fedezze fel a mélytanulást alkalmazó természetes nyelvi feldolgozás alapjait és haladó alkalmazásait. A Mélytanulást alkalmazó természetes nyelvi feldolgozás című kurzus bemutatja a modern technikákat, mint például a szóbeágyazások, a rekurens neurális hálózatok és a generatív modellek, gyakorlati készségeket adva a szövegosztályozáshoz és -elemzéshez.
Ez a tanfolyam gépi tanulási mérnököknek szól.
Ezen a tanfolyamon a hallgatók megismerkednek a legnépszerűbb architektúrákkal, beleértve a visszatérő természetes hálózatokat és a rejtett Markov-modelleket.
A tanfolyamon való részvételhez a hallgatóknak el kell végezniük a Tensorflow/Keras alapszintű gépi tanulási modulját.
A résztvevők számára hasznos az alábbi ismeretek birtokában:
Alapvető mélytanulás
● Neuronok
● Rétegek típusai
● Hálózatok
● Vesztési funkciók
● Optimalizálók
● Túlillesztés
● Tensorflow
Alapvető neurális nyelvi feldolgozás
● Tokenizálás
● Szavak zsákja
● tf-idf
● Származás
● Lemmatizáció
● Nyelvi modellek
● Érzelemelemzés
1. modul: NLP alkalmazások
2. modul: Szóvektorok
- Mik azok a vektorok?
- Szóanalógiák
- TF-IDF és t-SNE
- NLTK
- Kesztyű
- szó2vec
- Szövegosztályozás szóvektorok segítségével
Gyakorlati labor: Alapvető szövegosztályozás végrehajtása több szóvektoros modellek segítségével. Javítsa ezt az alapvető szövegfeldolgozás és nyelvi modellek használatával, hogy az adatok készen álljanak a gépi tanulásra.
3. modul: Nyelvmodellezés
- Biggramok
- Nyelvi modellek
- Neurális hálózat Biggram modell
Gyakorlati labor: Szövegosztályozás végrehajtása neurális hálózatok segítségével nyelvi modellek alapján. Ismerje meg a nyelvi modell valószínűségi modellezését, hogyan javítható egy szó kontextusa, hogyan lehet szinonimákat generálni, és hogyan generálnak az alapvető neurális hálózatok erőteljes nyelvi modelleket.
4. modul: Szóbeágyazások
- CBOW
- Skip-Gram
- Negatív mintavétel
Gyakorlati labor: Ismerje meg a nyelvi modellezés fejlett technikáit, mint például a Skip-Gram és a Negative Sampling ezek megvalósításával, és tanulja meg megjósolni a következő legvalószínűbb szót a beszélgetésben.
5. modul: NLP technikák
- Mi az a POS címkézés?
- POS Tagging Ismétlődő neurális hálózat
- POS-címkézés Rejtett Markov-modell (HMM)
- Elnevezett entitás-felismerés (NER)
- POS vs. NEM
Gyakorlati labor: Használja az NLTK-t és a SCIPY-t az osztályozás javításához nyelvtani szabályok és POS segítségével, majd használja a NER-t a kifejezés legértékesebb tartalmának kiemelésére, majd hajtsa végre az összegzést.
6. modul: Ismétlődő neurális hálózatok
- LSTM
- GRU
- Szöveggenerálás
Gyakorlati labor: Valósítson meg Kerasban egy alapvető RNN architektúrát a szó előrejelzéséhez, a már tanulmányozott szóbeágyazások felhasználásával. Hasonlítsa össze az LSTM teljesítményét a GRU-val és a BiLSTM-mel összehasonlítva.
7. modul: Generatív neurális hálózatok
Gyakorlati labor: Valósítsa meg a Kerasban saját generatív modelljét, amely a Shakespeare-hez hasonló dalszövegeket generál. Tanuljon meg Transzfertanulást szövegen.
Természetes nyelvi feldolgozás a mélytanulás segítségével


