Mikrokvalifikacije: Jezične tehnologije i digitalna obrada teksta

Podržava: Projekt UNIRI CLASS – A1 Otvoreno personalizirano obrazovanje

“Empowering Language Technology Professionals Through Microqualifications!”

Sažetak projekta

U suvremenom digitalnom društvu obrada prirodnih jezika i teksta čini iznimno bitnu
sastavnicu svakodnevice. Suvremene jezične tehnologije omogućuju dohvaćanja golemih količina tekstova, stvaranje domenskih korpusa, računalno potpomognute obrade i analize, metode strojnog učenja i primjene umjetne inteligencije.
Razvoj jezičnih tehnologija već dugi niz godina temelji se na interdisciplinarnoj naravi
kolaboracije STEM i društveno-humanističkih područja. Međutim, na razini postojećih
obrazovnih programa Sveučilišta u Rijeci suvremena su jezična istraživanja fragmentirana na različitim sastavnicama i odsjecima.
Razvoj mikro-kvalifikacije (tzv. minors) Jezične tehnologije i digitalna obrada teksta kroz strukturirani program koji uključuje ponudu niza kolegija različitih sastavnica Sveučilišta u Rijeci i njihovih studijskih programa (Filozofski fakultet, Odjel za informatiku, Sveučilišni studij Logopedije), uz uključivanje vanjskih akademskih partnera i potporu strukovnih organizacija i subjekata iz realnog sektora omogućuje otvoreni personalizirani pristup oblikovanju znanja i razvijanju vještina usmjerenih na primjenu suvremenih metoda, alata i resursa za empirijsko proučavanje jezika i teksta.
Program se temelji na izbornosti ponuđenih kolegija, pri čemu student odabire kolegije s istaknutim kompetencijama koje želi razviti. Prikupljanjem ECTS-a kroz ponuđene kolegije (do 10 ECTS po mikrokvalifikaciji), student ostvaruje pravo na stjecanje mikrokvalifikacije Jezične tehnolgoije i digitialna obrada teksta.
Predmeti iz opisane mikrokvalifikacije omogućuju studentima stjecanja znanja i
kompetencija koje su im nužne za ravnopravno sudjelovanje na tržištu rada te povezivanje primarnih kompetencija stečenih na studiju sa suvremenim iskoracima u području obrade prirodnog jezika. Na ovaj način Sveučilište u Rijeci obrazuje stručnjake s jedinstvenim profilom kompetencija za kojima postoji velika potreba u suvremenoj znanosti i industriji.

Sadržaj mikro-kvalifikacije

Mikro-kvalifikacija Jezične tehnologije i digitalna obrada teksta objedinjuje obrazovne
sadržaje i/ili programe koji su trenutno fragmentirani na različitim sastavnicama kako bi se studentima Sveučilišta u Rijeci omogućio otvoreni personalizirani pristup oblikovanju znanja i razvijanju vještina iz sljedećih domena:

  • računalno potpomognuto prikupljanje tekstualnih izvora,
  • digitizacija i digitalizacija teksta, tekstualne (pisanepisane baštine)
  • digitalno mapiranje
  • digitalna / virtualna rekonstrukcija, prezervacija i prezentacija rukopisnoga teksta
  • 3D modeliranje rukopisa (manuscript 3D models) / teksta
  • optičko čitanje teksta
  • stvaranje baza znanja,
  • računalna obrada teksta (pisanoga i govorenoga),
  • računalno potpomognuta ekstrakcija informacija iz teksta
  • računalno potpomognuta analiza,
  • računalno potpomognuto označavanje i obogaćivanje tekstova
  • digitalna reprezentacija tekstova
  • multimodalna analiza teksta
  • pretvorba pisanoga teksta u govoreni tekst i govorenoga teksta u pisani tekst
  • stvaranje digitalnih asistenata (transakcijski i konverzacijski AI)
  • razvoj suvremene primjene digitalnih alata i tehnika obrade teksta,
  • računalno potpomognuto prevođenje, s posebnim naglaskom na međujezično i
  • unutarjezično audiovizualno prevođenje

Ponuđeni kolegiji

  • Alati i metode digitalne lingvistike (kolegij je postavljen kao online kolegij svim studentima Sveučilišta u Rijeci te studentima u dolaznoj mobilnosti i YUFE mreži) (Odsjek za kulturalne studije)
  • Umjetna inteligencija i komunikacija (Odsjek za kulturalne studije)
  • Programiranje za humanističke znanosti (Odsjek za kulturalne studije)
  • Organizacija znanja (izlučivanje znanja iz teksta, organizacija znanja u bazama podataka)(Odjel za informatiku)
  • Književnost u prijevodu i digitalna humanistika (Odsjeku za anglistiku)
  • Uvod u analizu i vizualizaciju teksta (analitika teksta i reprezentacija tekst analitike; kolegij će početi s izvođenjem na Odjelu za informatiku u ak. Godini 2022./2023., međutim bit će ponuđen kao online kolegij svim studentima Sveučilišta u Rijeci te studentima u dolaznoj mobilnosti i YUFE mreži; kolegij je dobio potporu za projekt „Razvoj online kolegija Uvod u analizu i vizualizaciju podataka“ u okviru programa „UNIRI CLASS” – programska linija A2 Digitalno građanstvo – inovacije u učenju i poučavanju za 2021. godinu (Odjel za informatiku)
  • Strojno-potpomognuto prevođenje (Katedra za translatologiju, Sveučilišni diplomski prevoditeljski studij)
  • Digitalna humanistika u književno znanstvenim istraživanjima (Odsjek za kroatistiku)

Program podrazumijeva razvoj novih kolegija na matičnim sastavnicama kojima se obogaćuje ponuda domenskog znanja:

  • Digitalna obrada govora za potrebe fonetskih istraživanja (Odsjek za kroatistiku)
  • Od pergamene do digitalnoga kodeksa (digitalna fragmentologija, digitalna paleografija / optičko čitanje rukopisa) (Odsjek za kroatistiku)
  • Virtualni arhivi i knjižnice

Matrica razvoja mikrokvalifikacija

Poveznica na službene dokumente

Cjeloživotno obrazovanje na UNIRI

Objave o projektu razvoja mikrokvalifikacije

Suradne institucije na projektu

  • Filozofski fakultet, Sveučilište u Rijeci
  • Odjel za informatiku, Sveučilište u Rijeci
  • Pomorski fakultet, Sveučilište u Rijeci
  • Studij Logopedija, Sveučilište u Rijeci

Strukovne udruge i europski znanstveni konzorciji

  • Institut za hrvatski jezik i jezikoslovlje (http://ihjj.hr/),
  • Odsjek za tehnologije znanja Instituta Jožef Stefan u Ljubljani (https://www.ijs.si/ijsw )
  • Hrvatski nacionalni konzorcij istraživačke infrastrukture CLARIN ERIC‑a
  • (https://www.clarin.hr/hr/)
  • Digitalna istraživačka infrastruktura za umjetnost i humanistiku u Republici Hrvatskoj
  • (http://dariah.hr/)
  • Icarus
  • ReLDI centar za jezičke podatke, Beograd (https://reldi.spur.uzh.ch)

Industrijski partneri

  • Ericsson Nikola Tesla d.d. – R&D, I&S

Akademski partneri

  • projekt UPSKILLS
  • diplomski program LINGUISTIC DATA SCIENCES, Sveučilište Eastern
  • Finland
  • diplomski program Digital Text Analysis, Sveučilište u Antwerpenu

Srodnost projekta

Projekt razvoja mikro-kvalifikacije komplementaran je programu Razvoj suvremenih
komunikacijskih tehnologija u komercijalnim aplikacijama i industriji
kojim se dodatno potiču studenti na praktičnu primjenu stečenih znanja jezičnih tehnologija i digitalne obrade teksta.

CLARC 2023
Language and Language Data

International Scientific Conference 
28 – 30 September 2023
Faculty of Humanities and Social Sciences
University of Rijeka

Call for Papers

Mikrokvalifikacije: Jezične tehnologije i digitalna obrada teksta

Podržava: Projekt UNIRI CLASS – A1 Otvoreno personalizirano obrazovanje

“Empowering Language Technology Professionals Through Microqualifications!”

Sažetak projekta

U suvremenom digitalnom društvu obrada prirodnih jezika i teksta čini iznimno bitnu
sastavnicu svakodnevice. Suvremene jezične tehnologije omogućuju dohvaćanja golemih količina tekstova, stvaranje domenskih korpusa, računalno potpomognute obrade i analize, metode strojnog učenja i primjene umjetne inteligencije.
Razvoj jezičnih tehnologija već dugi niz godina temelji se na interdisciplinarnoj naravi
kolaboracije STEM i društveno-humanističkih područja. Međutim, na razini postojećih
obrazovnih programa Sveučilišta u Rijeci suvremena su jezična istraživanja fragmentirana na različitim sastavnicama i odsjecima.
Razvoj mikro-kvalifikacije (tzv. minors) Jezične tehnologije i digitalna obrada teksta kroz strukturirani program koji uključuje ponudu niza kolegija različitih sastavnica Sveučilišta u Rijeci i njihovih studijskih programa (Filozofski fakultet, Odjel za informatiku, Sveučilišni studij Logopedije), uz uključivanje vanjskih akademskih partnera i potporu strukovnih organizacija i subjekata iz realnog sektora omogućuje otvoreni personalizirani pristup oblikovanju znanja i razvijanju vještina usmjerenih na primjenu suvremenih metoda, alata i resursa za empirijsko proučavanje jezika i teksta.
Program se temelji na izbornosti ponuđenih kolegija, pri čemu student odabire kolegije s istaknutim kompetencijama koje želi razviti. Prikupljanjem ECTS-a kroz ponuđene kolegije (do 10 ECTS po mikrokvalifikaciji), student ostvaruje pravo na stjecanje mikrokvalifikacije Jezične tehnolgoije i digitialna obrada teksta.
Predmeti iz opisane mikrokvalifikacije omogućuju studentima stjecanja znanja i
kompetencija koje su im nužne za ravnopravno sudjelovanje na tržištu rada te povezivanje primarnih kompetencija stečenih na studiju sa suvremenim iskoracima u području obrade prirodnog jezika. Na ovaj način Sveučilište u Rijeci obrazuje stručnjake s jedinstvenim profilom kompetencija za kojima postoji velika potreba u suvremenoj znanosti i industriji.

Sadržaj mikro-kvalifikacije

Mikro-kvalifikacija Jezične tehnologije i digitalna obrada teksta objedinjuje obrazovne
sadržaje i/ili programe koji su trenutno fragmentirani na različitim sastavnicama kako bi se studentima Sveučilišta u Rijeci omogućio otvoreni personalizirani pristup oblikovanju znanja i razvijanju vještina iz sljedećih domena:

  • računalno potpomognuto prikupljanje tekstualnih izvora,
  • digitizacija i digitalizacija teksta, tekstualne (pisanepisane baštine)
  • digitalno mapiranje
  • digitalna / virtualna rekonstrukcija, prezervacija i prezentacija rukopisnoga teksta
  • 3D modeliranje rukopisa (manuscript 3D models) / teksta
  • optičko čitanje teksta
  • stvaranje baza znanja,
  • računalna obrada teksta (pisanoga i govorenoga),
  • računalno potpomognuta ekstrakcija informacija iz teksta
  • računalno potpomognuta analiza,
  • računalno potpomognuto označavanje i obogaćivanje tekstova
  • digitalna reprezentacija tekstova
  • multimodalna analiza teksta
  • pretvorba pisanoga teksta u govoreni tekst i govorenoga teksta u pisani tekst
  • stvaranje digitalnih asistenata (transakcijski i konverzacijski AI)
  • razvoj suvremene primjene digitalnih alata i tehnika obrade teksta,
  • računalno potpomognuto prevođenje, s posebnim naglaskom na međujezično i
  • unutarjezično audiovizualno prevođenje

Ponuđeni kolegiji

  • Alati i metode digitalne lingvistike (kolegij je postavljen kao online kolegij svim studentima Sveučilišta u Rijeci te studentima u dolaznoj mobilnosti i YUFE mreži) (Odsjek za kulturalne studije)
  • Umjetna inteligencija i komunikacija (Odsjek za kulturalne studije)
  • Programiranje za humanističke znanosti (Odsjek za kulturalne studije)
  • Organizacija znanja (izlučivanje znanja iz teksta, organizacija znanja u bazama podataka)(Odjel za informatiku)
  • Književnost u prijevodu i digitalna humanistika (Odsjeku za anglistiku)
  • Uvod u analizu i vizualizaciju teksta (analitika teksta i reprezentacija tekst analitike; kolegij će početi s izvođenjem na Odjelu za informatiku u ak. Godini 2022./2023., međutim bit će ponuđen kao online kolegij svim studentima Sveučilišta u Rijeci te studentima u dolaznoj mobilnosti i YUFE mreži; kolegij je dobio potporu za projekt „Razvoj online kolegija Uvod u analizu i vizualizaciju podataka“ u okviru programa „UNIRI CLASS” – programska linija A2 Digitalno građanstvo – inovacije u učenju i poučavanju za 2021. godinu (Odjel za informatiku)
  • Strojno-potpomognuto prevođenje (Katedra za translatologiju, Sveučilišni diplomski prevoditeljski studij)
  • Digitalna humanistika u književno znanstvenim istraživanjima (Odsjek za kroatistiku)

Program podrazumijeva razvoj novih kolegija na matičnim sastavnicama kojima se obogaćuje ponuda domenskog znanja:

  • Digitalna obrada govora za potrebe fonetskih istraživanja (Odsjek za kroatistiku)
  • Od pergamene do digitalnoga kodeksa (digitalna fragmentologija, digitalna paleografija / optičko čitanje rukopisa) (Odsjek za kroatistiku)
  • Virtualni arhivi i knjižnice

Matrica razvoja mikrokvalifikacija

Poveznica na službene dokumente

Cjeloživotno obrazovanje na UNIRI

Objave o projektu razvoja mikrokvalifikacije

Suradne institucije na projektu

  • Filozofski fakultet, Sveučilište u Rijeci
  • Odjel za informatiku, Sveučilište u Rijeci
  • Pomorski fakultet, Sveučilište u Rijeci
  • Studij Logopedija, Sveučilište u Rijeci

Strukovne udruge i europski znanstveni konzorciji

  • Institut za hrvatski jezik i jezikoslovlje (http://ihjj.hr/),
  • Odsjek za tehnologije znanja Instituta Jožef Stefan u Ljubljani (https://www.ijs.si/ijsw )
  • Hrvatski nacionalni konzorcij istraživačke infrastrukture CLARIN ERIC‑a
  • (https://www.clarin.hr/hr/)
  • Digitalna istraživačka infrastruktura za umjetnost i humanistiku u Republici Hrvatskoj
  • (http://dariah.hr/)
  • Icarus
  • ReLDI centar za jezičke podatke, Beograd (https://reldi.spur.uzh.ch)

Industrijski partneri

  • Ericsson Nikola Tesla d.d. – R&D, I&S

Akademski partneri

  • projekt UPSKILLS
  • diplomski program LINGUISTIC DATA SCIENCES, Sveučilište Eastern
  • Finland
  • diplomski program Digital Text Analysis, Sveučilište u Antwerpenu

Srodnost projekta

Projekt razvoja mikro-kvalifikacije komplementaran je programu Razvoj suvremenih
komunikacijskih tehnologija u komercijalnim aplikacijama i industriji
kojim se dodatno potiču studenti na praktičnu primjenu stečenih znanja jezičnih tehnologija i digitalne obrade teksta.

The Center for Language Research of the Faculty of Humanities and Social Sciences at the University of Rijeka, Croatia, invites you to participate in the international scientific conference entitled “Language and Language Data“.

We invite the submission of abstract proposals for individual papers and panels. We seek quality, unpublished papers that address the empirical, theoretical, and/or methodological aspects of research focusing on the topics concerning the relationship between language and language data:    

Topics and themes

Language data for shared language resources: development and management of Shared Language Resources, including dictionaries, lexicons, and corpora.

Language Data for Machine Learning: Applying Machine Learning for Processing Language Data and Developing Language Models, Assessing the Quality of Language Data and Methods for Improving the Quality of Language Data.

Language data and language technologies: various approaches and methods for developing language technologies as well as the application of language technologies in various fields, including history, politics, law, medicine, economics and education.

Language Data in the Cloud: Application of the Cloud for Storing and Processing Language Data.

Language services and applications: Language services and applications for users, including translation, automatic speech services, and language interpretation services.

Corpus Linguistics: Methods for researching language data using corpora and applying corpus results in various language disciplines. Applying corpus approaches in philology for the study of language and language history.

Language policy and language management: Language policy and language management in various contexts and levels, including national and international levels.

Multilingualism and Language Issues: Multilingualism and language issues in various contexts, including language segregation, language discrimination, and language barrier.

Language data for personalized services: Application of language data to improve personalized services such as search and advertising.

Language data for automation of tasks: The application of language data for automation of tasks, including document processing, order processing and data processing.

Language data for social networks: Applying language data for analyzing content on social networks and improving social network services.

Language data for cyber security: Application of language data to improve cyber security, including the detection of fake news.

Using language data to improve user experience, including improving user interface and helping users.

Digitalization of Philological Manuscripts: Methods and Techniques for Digitalization and Processing of Philological Manuscripts.

Language services for archaeology: The application of language technologies in archaeology, including the interpretation of inscriptions and documents.

Language data for language history: Applying language data to research language history and changes in language.

Philological aspects of linguistic data: Philological aspects of linguistic data, including the standardization and normalization of linguistic data.

Digital Text Processing Techniques: Methods and techniques for digital text processing, including OCR processing and XML processing.

Digital Text Analysis Techniques: Methods and techniques for digital text analysis, including techniques for text classification and clustering.

Digital Techniques for Text Visualization: Methods and techniques for digital text visualization, including techniques for n-grams and word clouds.

Digital Knowledge Management Techniques: Methods and techniques for digital knowledge management, including document management techniques and database management techniques.

Digital Techniques for Multimedia Data Processing: Methods and techniques for digital processing of multimedia data, including image, sound, and video processing.

Use of large language models in linguistic data: Application of large language models for analysis of linguistic data, including techniques for predicting linguistic features and techniques for identification of corporate speech.

Large Language Models and Linguistic Diversity: Application of large language models for analysis of linguistic diversity, including techniques for studying regional and dialectal variations, techniques for identification and description of language microcultures.

Large Language Models and Language Technologies: Application of large language models in the development of language technologies, including techniques for translation and techniques for personalized language services.

Large Language Models and Language Policy: Application of large language models in the development of language policies, including techniques for studying the needs and interests of language communities and techniques for developing strategies for preserving language diversity.

Large Language Models and Language Research: Application of large language models in language research, including techniques for studying language evolution and techniques for analyzing sociolinguistic trends.

Use of linguistic data for sentiment analysis: The application of linguistic data for sentiment analysis, including techniques for identifying and coding positive, negative, and neutral attitudes.

Sentiment Analysis: The application of sentiment analysis in the development of language technologies, the study of linguistic diversity, techniques for analyzing regional and dialectal variations, the development of language policies, language evolution and techniques for analyzing sociolinguistic trends.

Philosophy and Ethics of Language Data and Language Technologies: Philosophical and ethical questions related to language data, including questions of privacy, intellectual property rights, and responsibility. Philosophical and ethical questions related to machine learning, including questions of responsibility and questions of AI development.

Philosophy and Ethics of Machine Learning: Philosophical and ethical questions related to machine learning, including questions of responsibility and questions of AI development.

Language data for tourism: Application of language data in tourism, including analysis of reviews of tourist destinations and services, techniques for translation and personalized offering of tourism services, application of language data for travel planning, creating itineraries, tourist offers, tourism marketing, techniques for targeting tourist offers and analyzing the competitiveness of tourist destinations.

Language data for business communications: Application of language data in business communications, negotiations, development of business plans, business strategies, and competitive analysis.

Language data for cultural policy development: The application of language data for the development of cultural policies, research in cultural industries, including techniques for studying trends and demand in the cultural industry and needs and interests of cultural consumers.

Language data in political campaigns: The application of language data in political campaigns, policy research, political decision-making, and political marketing, including techniques for analyzing language style and techniques for identifying and coding political attitudes, political stances, the needs and interests of political communities, translation techniques and techniques for personalizing political messages.

Philosophy and Ethics of Computer Science: Philosophical and ethical questions related to computer science, including questions of ethics and responsibility in research.

Language data for tourism: Application of language data in tourism, including analysis of reviews of tourist destinations and services, including techniques for translation and techniques for personalized offering of tourism services.

Language data for travel planning: Application of language data for travel planning, including techniques for creating itineraries and techniques for searching tourist offers.

Language data for tourism marketing: The application of language data in tourism marketing, including techniques for targeting tourist offers and techniques for analyzing the competitiveness of tourist destinations.

Language data for business communications: Application of language data in business communications, including techniques for writing business letters and techniques for preparing presentations.

Language data for business negotiations: Application of language data in business negotiations, including techniques for analyzing customer needs and techniques for crafting offers.

Language data for business plans: The application of language data for the development of business plans, including techniques for financial analysis and techniques for production and distribution planning.

Language data for business strategies: The application of language data for the development of business strategies, including techniques for competitive analysis and techniques for market opportunity identification.

Language data for cultural policy development: The application of language data in the development of cultural policies, including techniques for analyzing the needs and interests of cultural consumers.

Language data for research in cultural industries: Application of language data for research in cultural industries, including techniques for studying trends and demand in the cultural industry.

Language data in political campaigns: The application of language data in political campaigns, including techniques for analyzing language style and techniques for identifying and coding political stances, translation techniques and techniques for personalizing political messages.

Language data for policy research: The application of language data to policy research, including techniques for studying linguistic diversity in political speeches and techniques for analyzing political attitudes.

Language data in political decision-making: The application of language data in political decision-making, including techniques for analyzing the needs and interests of political communities and techniques for developing strategies for political reform.

Language data in political marketing: The application of language data in political marketing, including techniques for targeting political messages and techniques for analyzing the competitiveness of political parties.

Papers and panels focusing on any language and adopting any theoretical perspective are welcome. We particularly welcome interdisciplinary papers and panels. Proposals will be evaluated anonymously by two reviewers based on their scientific contribution, content quality, thematic relevance and abstract quality.  Working languages of the conference are English and Croatian.

Confirmed Plenary Speakers

We are honored that the following distinguished scholars have agreed to deliver their plenary lectures at the conference: 

Abstract Submissions

General Session Papers

We invite submissions of anonymous abstracts suited for a 15-minute presentation, followed by a 10-minute discussion. Each participant can be the first author of one presentation only. The number of joint presentations is not limited.

Instructions for authors

Authors are invited to submit either an extended abstract  or a  full paper describing work to be presented at the conference. The extended abstract will be published in the book of abstracts and the full papers in the conference proceedings, both of which will be published on the conference website under the Creative Commons license at the beginning of the conference. We leave it up to the authors whether to submit their contributions anonymized or not. The extended abstracts and full papers can be published in any of the official languages of the conference (Croatian or English). 

The extended abstracts should be 1-3 pages long, formatted according to the conference guidelines:
Word template

The full papers should be 6–8 pages, formatted according to the conference guidelines:
Word template

Templates are also available for papers written in Croatian; you can find them on the Croatian page of the conference.

The contributions are collected using EasyChair by clicking on this link.

Venue

Faculty of Humanities and Social Sciences, University of Rijeka
Sveučilišna avenija 4, 51000 Rijeka, Croatia

Registration Fees

Registration fees cover the cost of conference materials and refreshments during the breaks. On-site registration will not be possible.

Early registration: July 10 – September 1, 2023
Payment : 95 EUR 

Late registration: September 1 – September 28, 2023
Payment : 145 EUR

Information about the conference dinner will be available closer to the conference dates.

Important Dates

Conference dates: September 28 – 30, 2023

Abstract submission deadline: July 1, 2023

Ful paper submission deadline: September 1, 2023

Notification of acceptance (for all submissions): July 10, 2023 

Conference program announcement: July 30, 2023

Programme Committee

Mirjana Crnić Novosel, Branka Drljača Margić, Koraljka Kuzman Šlogar, Cecilija Jurčić Katunar, Tihana Kraš, Mihaela Matešić, Benedikt Perak, Diana Stolac, Zvjezdana Vrzić, Boris Pritchard, Mirjana Borucinsky, Anita Memišević,  Isabella, Matticchio, Lucia Načinović Prskalo

Organizing Committee

Mirjana Crnić Novosel, Branka Drljača Margić, Maja Đurđulov, Cecilija Jurčić Katunar, Tihana Kraš, Mihaela Matešić, Benedikt Perak, Iva Peršić, Zvjezdana Vrzić, Martina Podboj, Mirjana Borucinsky, Anita Memišević,  Isabella, Matticchio, Lucia Načinović Prskalo, Jasna Bićanić, Sandra Jukić

hrHrvatski