Bálint SASS
PhD
senior research fellow
Institute for Lexicology
My research fields: management and effective querying of large text databases, and computer aided dictionary creation. The corpus-driven methodology appears in some form in all my scientific activities. I participated in several international and domestic projects. I have 79 scientific publications, the one titled "The Hungarian Gigaword Corpus" has more than 250 references. I completed MTA Bolyai scholarship in 2020 with an "outstanding" rating. I am interested in all problems that are both linguistic and computer related.
Contact
306
+36 (1) 3429372 / 6095
Contact
306
+36 (1) 3429372 / 6095
Bálint SASS•Publications
Bálint SASS
•
Publications
Filter setting
All
87 results
87 results
All
87 results
Sass, Bálint. 2024. The “Dependency Tree Fragments” Model for Querying a Constructicon. In: Š. Despot Kristina, Ostroški Anić Ana, Brač Ivana (szerk.) Lexicography and Semantics: Proceedings of the XXI EURALEX International Congress 8–12 October 2024 Cavtat, Croatia. Zagreb: Institut za hrvatski jezik i jezikoslovlje (IHJJ). 257–264.
Pethő Gergely, Sass Bálint, Simon László, Lipp Veronika. 2023. Korpusztisztítás és sorvégi kötőjelek kezelése karakteralapú neurális nyelvmodellel. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 291–304.
Sass, Bálint. 2023. From a dictionary towards the Hungarian Constructicon. In: Medveď M., Měchura M., Tiberius C., Kosem I., Kallas J., Jakubíček M., Krek S. (szerk.) Electronic lexicography in the 21st century (eLex 2023): Invisible Lexicography. Proceedings of the eLex 2023 conference. Brno, 27–29 June 2023. Brno: Lexical Computing. 534–544.
Feldmann Ádám, Hajdu Róbert, Indig Balázs, Sass Bálint, Makrai Márton, Mittelholcz Iván, Halász Dávid, Yang Zijian Győző, Váradi Tamás. 2021. HILBERT, magyar nyelvű BERT-large modell tanítása felhő környezetben. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2021. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 29–36.
Sass Bálint, Mittelholcz Iván, Halász Dávid, Lipp Veronika, Kalivoda Ágnes. 2021. Magyar hadifoglyok adatainak orosz-magyar átírása és helyreállítása, és a szabadszöveges adatbázisok tulajdonságai. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2021. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 39–51.
Sass Bálint. 2021. Oltakozás 3.0. MAGYAR HANG 4, 13 Paper: 03.26.: 27.
Indig, Balázs, Bálint Sass, and Iván Mittelholcz. 2020. The xtsv Framework and the Twelve Virtues of Pipelines. In: Calzolari Nicoletta, Béchet Frédéric, Blache Philippe, Choukri Khalid, Cieri Christopher, Declerck Thierry, Goggi Sara (szerk.)et al. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020). Párizs: European Language Resources Association (ELRA). 7044–7052.
Sass Bálint. 2020. A duplakocka modell és az igei szerkezeteket kinyerő "ugrik és marad" módszer nyelvfüggetlensége, valamint néhány megjegyzés az UD annotáció univerzalitásáról. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2020: Szeged, 2020. január 23–24. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 399–407.
Simon Eszter, Indig Balázs, Kalivoda Ágnes, Mittelholcz Iván, Sass Bálint, Vadász Noémi. 2020. Újabb fejlemények az e-magyar háza táján. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2020: Szeged, 2020. január 23–24. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 29–42.
Váradi, Tamás, Koeva Svetla, Yalamov Martin, Tadić Marko, Sass Bálint, Nitoń Bartłomiej, Ogrodniczuk Maciejet al.. 2020. The MARCELL Legislative Corpus. In: Calzolari Nicoletta, Béchet Frédéric, Blache Philippe, Choukri Khalid, Cieri Christopher, Declerck Thierry, Goggi Sara (szerk.)et al. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020). Párizs: European Language Resources Association (ELRA). 3761–3768.
Indig Balázs, Sass Bálint, Simon Eszter, Mittelholcz Iván, Kundráth Péter, Vadász Noémi. 2019. emtsv – Egy formátum mind felett. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XV. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2019: Szeged, 2019. január 24–25. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 235–247.
Indig, Balázs, Bálint Sass, Eszter Simon, Iván Mittelholcz, Noémi Vadász, and Márton Makrai. 2019. One format to rule them all - The emtsv pipeline for Hungarian. In: Assoc Computat Linguist (szerk.) 13TH LINGUISTIC ANNOTATION WORKSHOP (LAW XIII). Stroudsburg (PA): Association for Computational Linguistics (ACL). 155–165.
Sass Bálint. 2019. Keresés korpuszban 2: így kerestek ti. In: Sulyok Hedvig, Juhász Valéria, Erdei Tamás (szerk.) Beszéd- és nyelvelemző szoftverek a versenyképességért és az esélyegyenlőségért: HunCLARIN korpuszok és nyelvtechnológiai eszközök a bölcsészet- és társadalomtudományokban. Szeged: SZTE JGYPK Magyar és Alkalmazott Nyelvészeti Tanszék. 21–30.
Sass, Bálint. 2019. The "Jump and Stay" Method to Discover Proper Verb Centered Constructions in Corpus Lattices. In: Angelova Galia, Mitkov Ruslan, Nikolova Ivelina, Temnikova Irina (szerk.) Natural Language Processing in a Deep Learning World. [s.l.]: s.n.. 1076–1084. https://doi.org/10.26615/978-954-452-056-4_124.
Váradi, Tamás, Eszter Simon, Bálint Sass, Iván Mittelholcz, Attila Novák, Balázs Indig, Richárd Farkas, and Veronika Vincze. 2018. E-magyar -- A Digital Language Processing System. In: Nicoletta Calzolari, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Koiti Hasida, Hitoshi Isahara (szerk.)et al. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Paris: European Language Resources Association (ELRA). 1307–1312.
Sass Bálint, Miháltz Márton, Kundráth Péter. 2017. Az e-magyar rendszer GATE környezetbe integrált magyar szövegfeldolgozó eszközlánca. In: Vincze Veronika (szerk.) XIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2017: Szeged, 2017. január 26-27. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 79–90.
Váradi Tamás, Simon Eszter, Sass Bálint, Gerőcs Mátyás, Mittelholcz Iván, Novák Attila, Indig Balázs, Prószéky Gábor, Farkas Richárd, Vincze Veronika. 2017. Az e-magyar digitális nyelvfeldolgozó rendszer. In: Vincze Veronika (szerk.) XIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2017: Szeged, 2017. január 26-27. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 49–60.
Oravecz Csaba, Sass Bálint, Váradi Tamás. 2015. Mennyiségbõl minõséget: Nyelvtechnológiai kihívások és tanulságok az MNSz új változatának elkészítésében. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) XI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2015: Szeged, 2015. január 15-16. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 109–121.
Sass Bálint. 2015. 28 millió szintaktikailag elemzett mondat és 500000 igei szerkezet. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) XI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2015: Szeged, 2015. január 15-16. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 303–308.
Sass Bálint. 2015. Egy kereslet-kínálat elvű elemző működése és a koordináció kezelésének módszere. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) XI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2015: Szeged, 2015. január 15-16. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 309–311.
Miháltz Márton, Sass Bálint. 2014. Mit iszunk? A Magyar WordNet automatikus kiterjesztése szelekciós preferenciákat ábrázoló szófajközi relációkkal. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) X. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2014. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 109–116.
Oravecz, Csaba, Tamás Váradi, and Bálint Sass. 2014. The Hungarian Gigaword Corpus. In: Calzolari Nicoletta, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asunción Moreno, Jan Odijk, Stelios Piperidis (szerk.) LREC 2014 - NINTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION. Lisbon: European Language Resources Association (ELRA). 1719–1723.
Prószéky Gábor, Indig Balázs, Miháltz Márton, Sass Bálint. 2014. Egy pszicholingvisztikai indíttatású számítógépes nyelvfeldolgozási modell felé. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) X. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2014. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 79–87.
Oravecz, Cs, B Sass, and L Tihanyi. 2012. Evaluation campaign report: Az iTranslate4.eu projekt nyilvános dokumentuma
Héja E, Takács D, Sass B. 2011. Igei bővítménykeretek fordítási ekvivalenseinek kinyerése mélyen elemzett párhuzamos korpuszból. In: Tanács Attila, Vincze Veronika (szerk.) VIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2011: Szeged, 2011. december 1-2. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 47–58.
Oravecz Csaba, Sass Bálint, Tihanyi László. 2011. Soknyelvpáros gépi fordítás hatékony és megbízható kiértékelése. In: Tanács Attila, Vincze Veronika (szerk.) VIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2011: Szeged, 2011. december 1-2. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 35–46.
Héja E, Sass B. 2010. Többszavas kifejezések kezelése a párhuzamos korpuszokra épülő szótárkészítési módszertanban. In: Tanács Attila, Vincze Veronika (szerk.) VII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2010: Szeged, 2010. december 2-3. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 80–90.
Kuti, J, E Héja, and B Sass. 2010. Sense disambiguation - "Ambiguous sensation"?: Evaluating sense inventories for verbal WSD in Hungarian. In: Calzolari Nicoletta, Choukri Khalid, Maegaard Bente, Mariani Joseph, Odjik Jan, Piperidis Stelios, Rosner Mike, Tapias Daniel (szerk.) Proceedings of the Seventh Conference on International Language Resources and Evaluation (LREC 2010). Paris: European Language Resources Association (ELRA). 23–30.
Sass B, Pajzs J. 2010. Igei szerkezetek gyakorisági szótára -- félautomatikus szótárkészítés nyelvtechnológiai eszközök segítségével: Félautomatikus szótárkészítés nyelvtechnológiai eszközök segítségével. ALKALMAZOTT NYELVTUDOMÁNY 10, 1-2: 5–32.
Sass Bálint, Váradi Tamás, Pajzs Júlia, Kiss Margit (szerk.). 2010. Magyar igei szerkezetek: A leggyakoribb vonzatok és szókapcsolatok szótára. Budapest: Tinta Könyvkiadó.
Sass Bálint. 2010. A szótárról. In: Sass Bálint, Váradi Tamás, Pajzs Júlia, Kiss Margit (szerk.) Magyar igei szerkezetek: A leggyakoribb vonzatok és szókapcsolatok szótára. Budapest: Tinta Könyvkiadó. 9–17.
Sass, B, and J Pajzs. 2010. FDVC -- Creating a Corpus-driven Frequency Dictionary of Verb Phrase Constructions for Hungarian. In: Grabger P, Paquot M (szerk.) eLexicography in the 21st century. 263–272.
Bálint, Sass. 2009. Automatically Creating a Frequency Dictionary of Verb Phrase Constructions. PÁZMÁNY PÉTER CATHOLIC UNIVERSITY PHD PROCEEDINGS: 65–68.
Héja E, Kuti J, Sass B. 2009. Jelentés-egyértelműsítés - egyértelmű jelentésítés?. In: Tanács Attila, Szauter Dóra, Vincze Veronika (szerk.) VI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2009: Szeged, 2009. december 3-4. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 348–352.
Oravecz CS, Sass B, Simon E. 2009. Gépi tanulási módszerek ómagyar kori szövegek normalizálására. In: Tanács Attila, Szauter Dóra, Vincze Veronika (szerk.) VI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2009: Szeged, 2009. december 3-4. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 317–324.
Sass, B. 2009. A Unified Method for Extracting Simple and Multiword Verbs with Valence Information. In: Angelova G (szerk.) Recent Advances in Natural Language Processing. Proceedings of RANLP 2009, Borovec, Bulgaria. Sofia: Bulgarian Academy of Sciences, Institute for Parallel Processing; Association for Computational Linguistics (ACL). 399–403.
Sass, B. 2009. Verb Argument Browser for Danish. In: Jokinen K, Bick E (szerk.) Computational Linguistics: Proceedings of the 17th Nordic Conference NODALIDA 2009. Odense: s.n.. 263–266.
Bálint, Sass. 2008. A Random Method for Flexible Multiword Expression Extraction. PÁZMÁNY PÉTER CATHOLIC UNIVERSITY PHD PROCEEDINGS: 13–16.
Sass B, Kertész ZS. 2008. Gyakori szókapcsolatok szövegekben. In: Kálmán L (szerk.) Magyar nyelv. Tanári kincsestár. Budapest: Raabe Kiadó.
Sass B. 2007. A Hunglish korpusz mint oktatási segédeszköz. In: Heltai Pál (szerk.) Nyelvi modernizáció: Szaknyelv, fordítás, terminológia: XVI. Magyar Alkalmazott Nyelvészeti Kongresszus, MANYE XVI. Pécs: Szent István Egyetem; Gödöllő: Magyar Alkalmazott Nyelvészek és Nyelvtanárok Egyesülete (MANYE).
Sass, B. 2007. First attempt to automatically generate Hungarian semantic verb classes. In: Davies Matthew, Rayson P, Hunston Susan, Danielsson Pernilla (szerk.) Proceedings of the 4th Corpus Linguistics Conference (CL2007). University of Birmingham.
Bottyán G, Sass B. 2005. Személyragos főnévi igeneves bővítményt megengedő predikátumok kinyerése a Magyar Nemzeti Szövegtárból. In: Alexin Z, Csendes D (szerk.) III. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2005: Szeged, 2005. december 8-9. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 265–266.
Bottyán, G, and B Sass. 2005. Conjugated infinitives in the Hungarian National Corpus. In: Radovan G (szerk.) Computer Treatment of Slavic and East European languages. Slovko 2005. Bratislava: Vydavatelstvo Slovenskej Akadémie Vied (VEDA). 27–30.