{"id":8652,"date":"2022-12-12T14:26:45","date_gmt":"2022-12-12T14:26:45","guid":{"rendered":"https:\/\/cc.eurohpc.pl\/?page_id=8652"},"modified":"2023-03-10T10:28:42","modified_gmt":"2023-03-10T10:28:42","slug":"seminarium-ai-lepiszcze","status":"publish","type":"page","link":"https:\/\/cc.eurohpc.pl\/index.php\/seminarium-ai-lepiszcze\/","title":{"rendered":"Seminarium AI Lepiszcze"},"content":{"rendered":"\t\t<div data-elementor-type=\"wp-page\" data-elementor-id=\"8652\" class=\"elementor elementor-8652\" data-elementor-post-type=\"page\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-83598de elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"83598de\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-c7d28fa\" data-id=\"c7d28fa\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-3e09220 elementor-widget elementor-widget-heading\" data-id=\"3e09220\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Jak zosta\u0142o zaprojektowane i stworzone LEPISZCZE, czyli kompleksowy benchmark zada\u0144 przetwarzania j\u0119zyka naturalnego dla j\u0119zyka polskiego<\/h2>\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-6ecff73 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"6ecff73\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-c7099e0\" data-id=\"c7099e0\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-0631b46 elementor-widget elementor-widget-text-editor\" data-id=\"0631b46\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t\t\t\t\t\t<p>Zapraszamy na kolejne seminarium z cyklu AI\/BigData w <strong>pi\u0105tek, 16 grudnia 2022 r. o godz. 10.30<\/strong>. Tym razem b\u0119dzie o narz\u0119dziach do trenowania modeli j\u0119zykowych. <br \/><strong>\u0141ukasz Augustyniak<\/strong> z Katedry Sztucznej Inteligencji (Wydzia\u0142 Informatyki i Telekomunikacji, Politechnika Wroc\u0142awska) wyja\u015bni<strong> Jak zosta\u0142o zaprojektowane i stworzone LEPISZCZE, czyli kompleksowy benchmark zada\u0144 przetwarzania j\u0119zyka naturalnego dla j\u0119zyka polskiego.<\/strong><\/p><p>Coraz szersza dost\u0119pno\u015b\u0107 zasob\u00f3w obliczeniowych i danych do trenowania du\u017cych modeli j\u0119zykowych zwi\u0119ksza zapotrzebowanie na tworzenie solidnych \u015brodowisk ewaluacyjnych pozwalaj\u0105cych na rzetelne oszacowanie post\u0119p\u00f3w w modelowaniu j\u0119zyka. W ostatnich latach zauwa\u017calny jest znacz\u0105cy post\u0119p prac nad standaryzacj\u0105 \u015brodowisk ewaluacyjnych dla j\u0119zyka angielskiego. \u015arodowiska takie jak GLUE, SuperGLUE czy KILT sta\u0142y si\u0119 standardowymi narz\u0119dziami do oceny modeli j\u0119zykowych. W tworzeniu \u015brodowisk dla innych j\u0119zyk\u00f3w wielu badaczy koncentrowa\u0142o si\u0119 na replikowaniu \u015brodowiska GLUE, czego przyk\u0142adem jest polski benchmark KLEJ.<\/p><p>Podczas seminarium om\u00f3wiona b\u0119dzie <a href=\"https:\/\/arxiv.org\/abs\/2211.13112\" target=\"_blank\" rel=\"noopener\">praca po\u015bwi\u0119cona narz\u0119dziu LEPISZCZE<\/a>. Autorzy przedstawiaj\u0105 przegl\u0105d prac nad tworzeniem \u015brodowisk ewaluacyjnych dla j\u0119zyk\u00f3w niskozasobowych. Pokazuj\u0105, \u017ce wci\u0105\u017c wiele j\u0119zyk\u00f3w nie posiada wyczerpuj\u0105cego zestawu danych testowych do oceny modeli j\u0119zykowych. Wskazuj\u0105 obecne w \u015brodowiskach ewaluacyjnych luki i por\u00f3wnuj\u0105 dost\u0119pne w ramach tych \u015brodowisk zadania, odnosz\u0105c si\u0119 przy tym do j\u0119zyka angielskiego i j\u0119zyka chi\u0144skiego \u2013 j\u0119zyk\u00f3w o licznych zasobach treningowo-testowych.<\/p><p>G\u0142\u00f3wnym wynikiem pracy jest <a href=\"https:\/\/lepiszcze.ml\/\" target=\"_blank\" rel=\"noopener\"><strong>LEPISZCZE<\/strong><\/a> \u2013 nowe \u015brodowisko ewaluacyjne dla polskiej technologii j\u0119zykowej opartej na modelowaniu j\u0119zyka, z szerokim zestawem r\u00f3\u017cnorodnych zada\u0144 testowych. Zaproponowane \u015brodowisko zosta\u0142o zaprojektowane z my\u015bl\u0105 o elastyczno\u015bci w dodawaniu zada\u0144, wprowadzaniu nowych modeli j\u0119zykowych, nadsy\u0142aniu wynik\u00f3w oraz wersjonowaniu danych i modeli. Autorzy wraz ze \u015brodowiskiem dostarczaj\u0105 r\u00f3wnie\u017c ocen\u0119 kilku nowych modeli j\u0119zykowych oraz do\u0142\u0105czaj\u0105 zar\u00f3wno poprawione zbiory istniej\u0105ce w literaturze, jak r\u00f3wnie\u017c i nowe zbiory testowe dla nowych zada\u0144. W \u015brodowisku zawarto 5 istniej\u0105cych zbior\u00f3w danych i 8 nowych zbior\u00f3w danych, kt\u00f3re dotychczas nie by\u0142y u\u017cywane w ewaluacji modeli j\u0119zykowych. W pracy zawarto r\u00f3wnie\u017c do\u015bwiadczenia i wnioski wynikaj\u0105ce z pracy nad tworzeniem \u015brodowiska ewaluacyjnego LEPISZCZE jako wskaz\u00f3wki dla projektant\u00f3w podobnych \u015brodowisk w innych j\u0119zykach o ograniczonych zasobach j\u0119zykowych.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-1683947 elementor-align-left elementor-widget elementor-widget-button\" data-id=\"1683947\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t\t\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/www.gotomeet.me\/NCBJmeetings\/eurocc\" target=\"_blank\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">LINK DO SZKOLENIA<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>\n\t\t","protected":false},"excerpt":{"rendered":"<p>Jak zosta\u0142o zaprojektowane i stworzone LEPISZCZE, czyli kompleksowy benchmark zada\u0144 przetwarzania j\u0119zyka naturalnego dla j\u0119zyka polskiego Zapraszamy na kolejne seminarium z cyklu AI\/BigData w pi\u0105tek, 16 grudnia 2022 r. o godz. 10.30. Tym razem b\u0119dzie o narz\u0119dziach do trenowania modeli j\u0119zykowych. \u0141ukasz Augustyniak z Katedry Sztucznej Inteligencji (Wydzia\u0142 Informatyki i Telekomunikacji, Politechnika Wroc\u0142awska) wyja\u015bni Jak&hellip;&nbsp;<a href=\"https:\/\/cc.eurohpc.pl\/index.php\/seminarium-ai-lepiszcze\/\" rel=\"bookmark\">Dowiedz si\u0119 wi\u0119cej &raquo;<span class=\"screen-reader-text\">Seminarium AI Lepiszcze<\/span><\/a><\/p>\n","protected":false},"author":5,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"page-templates\/template-pagebuilder-full-width.php","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"neve_meta_sidebar":"","neve_meta_container":"","neve_meta_enable_content_width":"","neve_meta_content_width":0,"neve_meta_title_alignment":"","neve_meta_author_avatar":"","neve_post_elements_order":"","neve_meta_disable_header":"","neve_meta_disable_footer":"","neve_meta_disable_title":"","footnotes":""},"class_list":["post-8652","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/cc.eurohpc.pl\/index.php\/wp-json\/wp\/v2\/pages\/8652","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/cc.eurohpc.pl\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/cc.eurohpc.pl\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/cc.eurohpc.pl\/index.php\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/cc.eurohpc.pl\/index.php\/wp-json\/wp\/v2\/comments?post=8652"}],"version-history":[{"count":4,"href":"https:\/\/cc.eurohpc.pl\/index.php\/wp-json\/wp\/v2\/pages\/8652\/revisions"}],"predecessor-version":[{"id":8656,"href":"https:\/\/cc.eurohpc.pl\/index.php\/wp-json\/wp\/v2\/pages\/8652\/revisions\/8656"}],"wp:attachment":[{"href":"https:\/\/cc.eurohpc.pl\/index.php\/wp-json\/wp\/v2\/media?parent=8652"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}