Praktiniai skaitmeninių tekstynų analizės mokymai

Mokymai

Tekstynas gali būti suvokiamas kaip žodžių darinys sudarytas iš daugybės elementų. Skirtingų žodžių skaičius skiriasi nuo bendro žodžių skaičiaus tekste ir priklausomai nuo teksto žanro, dalis žodžių pasikartoja daugiau nei vieną kartą. Skirtingų autorių tekstai ar jų žanrai sudarys skirtingus žodžių dažnių sąrašus. Kodėl žinoti tokią informaciją svarbu?

Skaitmeninėje humanitarikoje žodžių dažnių pagrindu yra atliekami žodžių junginių tekste pasikartojimo (angl. word co-occurrence) tyrimai, tekstų autorystės atpažinimas (angl. stylometry), mašininio mokymo skaičiavimo technologijos (angl. machine learning) ir daugelis kitų. Kompiuterinis žodžių dažnių skaičiavimas tapo tekstų tyrimų baze. Skaitmeninių tyrimų linkme žengiantiems tyrėjams pravartu išmanyti žodžių dažnių skaičiavimo metodologiją ir techniką. Viena iš nesudėtingiausių įvaldyti priemonių tokiems procesams – Python.

Kodėl verta mokintis Python? Python yra interpretacinė programavimo kalba, kuri plačiai naudojama moksle ir versle. Pastaruoju metu šios programavimo kalbos naudojimas pralenkė kitas moksle plačiai vartojamas interpretavimo programavimo kalbas ir tapo viena populiariausių. Daugybė mokslininkų, jų tarpe ir skaitmeninių tyrimų, buriasi į virtualias bendruomenes ir kuria bibliotekas išsamesniems tekstynų tyrimams.

Kviečiame Jus į KTU SHMMF DAtA centro SMlab dviejų dienų mokymus, kurių metu ir susipažinsite su Python teikiamomis galimybėmis tekstų analizei bei gautas žinias pritaikysite praktikoje dirbdami su savo sudarytu tekstynu. Mokymai vyks Kauno technologijos universiteto Socialinių, humanitarinių mokslų ir menų fakultete (A. Mickevičiaus g. 37, Kaunas).

Mokymų programa:

2018 lapkričio 29 d. ketvirtadienis (203 Aula)
10.00 – 12.00 Įvadas į Python.
12.00 – 13.00 Pietų pertrauka.
13.00 – 14.00 Įvadas į tekstynų tyrimus su Python: tekstynų nuskaitymas, valymas, paruošimas skaičiavimams, koduotės keitimas, darbas su lietuviškais tekstais.
14.30 – 16.30 Žodžių dažnių tekstynuose skaičiavimas; žodžių debesų atvaizdavimas; žodžių debesų atvaizdavimo galimybės.

2018 lapkričio 30 d. penktadienis (203 Aula) praktika
10.00 – 12.00 Darbas su nuosavu tekstynu. Nuosavo tekstyno paruošimas darbui su Python.
12.00 – 13.00 Pietų pertrauka.
13.00 – 15.00 Turimo tekstyno žodžių dažnių sudarymas ir atvaizdavimas.

Mokymų kaina 30 Eur. KTU SHMMF tyrėjams ir doktorantams mokymai nemokami. Išklausius mokymus, bus išduodamas pažymėjimas.
Kviečiame registruotis čia

Informacija telefonu: +37065778026

Apie lektorių. Rasa Kasperienė yra Vytauto Didžiojo universiteto humanitarinių mokslų doktorantė ir Social Media lab projekto vadovė. Jos mokslinių tyrimų sritys yra virtualių grupių elgsena, virtuali tapatybė, virtuali komunikacija, skaitmeninės humanitarikos ir sociologijos tyrimų metodai. Savo tyrimuose ji analizuoja virtualią komunikaciją taikydama didelių duomenų gavybos ir analizės metodus. Rasa Kasperienė taip pat yra įgijusi programavimo aukštąjį neuniversitetinį išsilavinimą ir daugiau nei 10 metų dirbanti IT įmonėse.

Pastabos:
• šie mokymai skirti programavimo įgūdžių neturintiems vartotojams;
• mokymams turėkite savo asmeninius kompiuterius;
• turėkite tekstyną, kuris gali būti bet kokiame formate (.pdf, .doc, .txt, .csv). Žodžių dažniui skaičiuoti užtenka teksto telpančio į du A4 formato lapus. Neturintiems savo tekstyno darbui bus duodamas kitas tekstynas;
• mokymai lietuvių kalba.

29 lapkričio d., 2018 10:00 - 30 lapkričio d., 2018 15:00

KTU Socialinių, humanitarinių mokslų ir menų fakultetas, 203 Aula

Įtraukti į iCal
Pasiūlyk įvykį!