Тёмный

Aleksander Smywiński-Pohl: Rozwój NLP w Polsce, przetwarzanie tekstów prawniczych 

Bartosz Ziolko
Подписаться 254
Просмотров 343
50% 1

Aleksander Smywiński Pohl jest adiunktem na Wydziale Informatyki AGH w Krakowie. Ukończył studia na Uniwersytecie Jagiellońskim oraz AGH. Specjalizuje się w projektach związanych z językiem programowania Ruby oraz przetwarzaniem języka naturalnego (NLP).
Omawiamy, jak nowa generacja NLP różni się od tego, co było 20 lat temu. Wyjaśniamy, że wiele różnic wynika z ogromnego wzrostu mocy obliczeniowych i dostępności danych, co pozwala na tworzenie bardziej zaawansowanych modeli. Jednakże nawet największe modele nie mogą zapamiętać wszystkiego, np rzadkich słów czy szczegółów odmian. Pozostaje też pytanie na ile LLM korzystają z zasobów językowych opracowanych wcześniej i dostępnych w internecie.
Aleksander porównuje, czy tworzenie nowych algorytmów NLP było łatwiejsze 10 lat temu czy teraz. Zwraca uwagę na to, że choć teraz mamy lepsze narzędzia i więcej danych, to skomplikowanie problemów również wzrosło. Nastąpiło większe przesycenie rozwiązaniami oraz dominacja badań prowadzonych przez korporacje ponad akademickimi co wpływa także na szczegóły tematyki.
Analizujemy, czy dzięki dużym modelom językowym (LLM) małe zespoły bez dużego budżetu mogą teraz łatwiej stworzyć produkt lub startup. Podkreślamy, że LLM otwierają nowe możliwości, ale nadal wymagają odpowiednich zasobów i wiedzy. Produkty bazujące na LLM łatwiej wytwarzać, łatwiej uzupełniać własną wiedzę. Jednakże opracowywanie nowych technologii wydaje się trudniejsze np. przez koszty serwerów obliczeniowych.
Aleksander wyjaśnia, czym charakteryzuje się przetwarzanie dokumentów prawniczych. Zwraca uwagę na specyficzne wyzwania, takie jak precyzja języka, kontekst prawny i potrzeba dokładnej analizy. W większości tesktów częstym zadaniem jest rozpoznanie jakiś nazw własnych. W tekstach prawniczych ważniejsza jest logika.
Na koniec, Aleksander opowiada o firmie Enelpol prowadzonej z Krzysztofem Wróblem. Jest to projekt związany z przetwarzaniem języka naturalnego i analizą danych, który ma na celu wspieranie różnych sektorów przemysłu.
enelpol.com

Опубликовано:

 

8 окт 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии    
Далее
Czym jest ciemna energia? Sebastian Szybka
1:22:50
Просмотров 307 тыс.
O co chodzi w fizyce kwantowej - Andrzej Dragan BS3S #6
43:52
Konfrontacje: Czy przyrodą rządzą prawa?
1:05:06
Просмотров 60 тыс.