Nyomtatás

Miskolci Egyetem - Gépészmérnöki és Informatikai Kar

TANTÁRGYI TEMATIKA

Szövegbányászat és dokumentum kezelés; Mérnök inf (Nappali)

Tantárgy neve:
Szövegbányászat és dokumentum kezelés
Tantárgy Neptun kódja:
Nappali: GEIAL527M
Tárgyfelelős intézet:
INF - Informatikai Intézet
Tantárgyelem: S_V1
2 tárgy választandó
Tárgyfelelős: Dr. Baksáné Dr. Varga Erika - egyetemi docens
Közreműködő oktató(k): -
Javasolt félév: 3 Előfeltétel:
Óraszám/hét:
Előadás (nappali): 2
Gyakorlat (nappali): 2
Számonkérés módja: kollokvium
Kreditpont: 4Munkarend: Nappali
Tantárgy feladata és célja:
A szövegbányászat feladatának, alapelveinek és módszereinek megismerése szövegbányász szoftverek alkalmazásával.
Tudás: Az informatikai szakmán belül, a specializációtól függően mélyebb elméleti és gyakorlati ismeretekkel rendelkezik az alábbiak közül egy vagy néhány területen: szoftvertervezés, rendszerszimuláció és -modellezés, kommunikációs hálózatok, mobil- és erőforrás-korlátos alkalmazások, számítógépes grafika és képfeldolgozás, kritikus és beágyazott rendszerek, médiainformatika, IT-biztonság, párhuzamos rendszerek, intelligens rendszerek, számításelmélet, adatbázisok.
Képesség: Képes törvényszerűségeket, összefüggéseket feltárni és megérteni. A megszerzett tudást képes alkalmazni és a gyakorlatban hasznosítani. A rutinproblémák felismerésén és megoldásán túl képes eredeti ötleteket felvetni. Az információtechnológia eszközeit és formális módszereit készség szinten használja.
Attitűd: Nyitott és elkötelezett az önművelésre, önfejlesztésre, az egyéni tudás, ismeret elmélyítésére, bővítésére a természettudományok, a mérnöki és informatikai tudományok területén. Munkája során vizsgálja a kutatási, fejlesztési és innovációs célok kitűzésének lehetőségét és törekszik azok megvalósítására. Munkáját kreatívan, rugalmasan végzi, a problémákat felismeri és azokat intuícióra és módszerességre építve oldja meg.
Autonomia és felelősség: Felelősséget érez a határidők betartására és betartatására. Alkalmas csoportban, egy-egy részterület szakértőjeként dolgozni, valamint csoportot felelősséggel irányítani.
Tárgy tematikus leírása:
A szövegbányászat feladata gyengén strukturált vagy strukturálatlan szöveges adatok feldolgozása, elemzése: információkinyerés dokumentumokból, dokumentumok osztályozása, csoportosítása, összegzéskészítés, kereséstámogatás. Ehhez felügyelt és felügyelet nélküli gépi tanulási módszereket, számítógépes nyelvészeti eszközöket és a szemantika reprezentálására alkalmas ontológiákat használunk. A gyakorlatban megismerjünk az R statisztikai elemző nyelv és az Oracle adatbáziskezelő rendszer szövegbányász moduljait.
Félévközi számonkérés módja és az aláírás megszerzésének feltétele (Nappali):
1 szövegelemzési feladat. Az aláírás megszerzésének feltétele a félévközi feladat elkészítése.
Félévközi számonkérés módja és az aláírás megszerzésének feltétele (Levelező):
Gyakorlati jegy / kollokvium teljesítésének módja, értékelése (Nappali):
A vizsga írásbeli, értékelése: 0%-50%: elégtelen
51%-62%: elégséges
63%-75%: közepes
76%-88%: jó
89%-100%: jeles
Gyakorlati jegy / kollokvium teljesítésének módja, értékelése (Levelező):
Kötelező irodalom:
1. Tikk Domonkos (szerk.): Szövegbányászat (Az Informatika alkalmazásai sorozat), Typotex, 2007.
2. D. Jurafsky and J.H. Martin: Speech and Language Processing (3rd Edition), 2017, web.stanford.edu/~jurafsky/slp3/
3. J. Silge and D. Robinson: Text Mining with R (A Tidy Approach), O'Reilly 2017, ISBN 978-1-491-98165-8
4.
5.
Ajánlott irodalom:
1. C.C. Aggarwal and CX. Zhai (eds.): Mining Text Data, Springer, 2012.
2. Srivastava, Ashok and Mehran Sahami (eds.): Text Mining: classification, clustering and applications, Chapman&Hall 2009.
3. C.D. Manning, P. Raghavan and H. Schütze: Introduction to information retrieval, Cambridge University Press, 2008.
4.
5.