Jak sztuczna inteligencja radzi sobie w badaniach nad spektrum autyzmu?
12 09 2024
Kategoria: Aktualności Wydziału, Najnowsze publikacje
W lipcu 2024 r. w „Acta Psychiatrica Scandinavica” ukazał się artykuł autorstwa dr. Aleksandra Wawra, dr Justyny Sarzyńskiej-Wawer, mgr Małgorzaty Krawczyk oraz dr Izabeli Chojnickiej (która jest kierowniczką działającego przy naszym Wydziale AutismLab). Artykuł A cross-dataset study on automatic detection of autism spectrum disorder from text data [Badanie krzyżowe dotyczące automatycznego wykrywania zaburzeń ze spektrum autyzmu na podstawie danych tekstowych] przedstawia rezultaty badania, podczas którego naukowcy przeanalizowali potencjał automatycznego wykrywania zaburzeń ze spektrum autyzmu na podstawie tekstu autorstwa pacjenta przy użyciu nowoczesnych narzędzi uczenia maszynowego. Celem było porównanie skuteczności dwóch modeli językowych na dwóch zestawach danych transkrypcji wypowiedzi, które zebrano przy użyciu różnych narzędzi diagnostycznych: Skali Myśli, Języka i Komunikacji (TLC) oraz Protokołu Obserwacyjnego do Diagnozy Autyzmu (ADOS-2).
Badacze zajęli się modelem HerBERT, czyli dostosowanym do języka polskiego modelem opartym na anglojęzycznym BERT. Pod uwagę wzięli również narzędzia do analizy tekstów od OpenAI oraz specjalny program, który klasyfikuje te teksty. Badanie obejmowało eksperymenty cross-dataset, czyli testowanie, czy modele mogą wykorzystać to, czego nauczyły się na jednym zestawie danych (np. z jednego narzędzia diagnostycznego) do skutecznego działania na innym.
Wyniki pokazały, że modele osiągnęły dobre wyniki dla danych zebranych w TLC, ale przeciętne dla tych z ADOS-2. Próba transferu wiedzy między zestawami danych nie przyniosła oczekiwanych efektów. Dodatkowo zachodząca w modelach augmentacja danych (czyli zwiększenie ilości danych wskutek przetłumaczenia ich na z jednego języka na drugi, a następnie z drugiego na pierwotny) pogorszyła jakość działania modeli, co sugeruje, że ten proces może zacierać sygnały charakterystyczne dla autyzmu.
Wnioski sugerują, że jakość modeli uczenia maszynowego zależy od typu danych wejściowych, a wykrywanie zaburzeń ze spektrum autyzmu z danych tekstowych ma duży potencjał, ale wymaga dalszych badań.
Z całym artykułem można zapoznać na stronie pisma lub pobrać go tutaj w wersji PDF.
Źródło: Wawer, A., Chojnicka, I., Sarzyńska-Wawer, J., Krawczyk, M. (2024). A cross-dataset study on automatic detection of autism spectrum disorder from text data. Acta Psychiatrica Scandinavica, 1-11.