Nasza największa wartość to ludzie. Mamy tego dowody na każdym kroku (#1)
Aleksander Obuchowski, opowiada o budowaniu medycznych modeli open-source i demokratyzacji AI dla polskiego systemu zdrowia.
Aleksander Obuchowski od lat rozwija projekty, które łączą medycynę i sztuczną inteligencję – od analizy guzów nerek po medyczny model językowy Eskulap. Współtworzone przez niego TheLion.AI i Medalion Tech pomagają lekarzom korzystać z AI w praktyce, zachowując pełną kontrolę nad danymi. Pracuje nad rozwiązaniami, które mogą zmienić oblicze diagnostyki i opieki zdrowotnej w Polsce – od cyfrowych oświadczeń woli dla dawców organów po medycznych asystentów działających offline.
Michał Podlewski: Pamiętasz moment, w którym po raz pierwszy pomyślałeś, że sztuczna inteligencja to coś, czym chcesz się zajmować? Jak pojawiło się u Ciebie zainteresowanie medycyną jako obszarem zastosowań AI?
Aleksander Obuchowski: Pierwszy raz o sztucznej inteligencji usłyszałem jeszcze w liceum. Miałem przyjemność chodzić do klasy mat-inf prowadzonej przez Ryszarda Szubartowskiego, którego wychowankami byli Jakub Pachocki i Filip Wolski z OpenAI. Jakuba nigdy nie poznałem, natomiast Filip był u nas postacią legendarną, często wspominaną przez Pana Szubartowskiego w licznych historiach (można wręcz powiedzieć przypowieściach). Przeprowadził u nas na zajęciach gościnny wykład na temat sztucznej inteligencji. Wtedy (ok. 2016 roku) to była zupełna nowość, o której nikt nie słyszał. Od początku zaciekawił mnie ten temat. Częściowo wynikało to z faktu, że czysta algorytmika (która wtedy była głównym obszarem informatyki, na którym skupialiśmy się na zajęciach) nigdy mnie bardzo nie pociągała. W sztucznej inteligencji widziałem nową, niezagospodarowaną jeszcze dziedzinę, na której mogę się skupić. Potem już jakoś samo poszło. Na studiach zrobiłem w ramach nauki sieć neuronową od zera. Docenił to dr inż. Patryk Jasik (mój późniejszy promotor), który zaprosił mnie do współpracy w projektach badawczych. Wciągnąłem w to też kilku znajomych ze studiów i Barbarę Klaudel (z którą teraz prowadzimy medalion.tech i thelion.ai). W ramach jednego z projektów opracowaliśmy system TITAN (Technology In Tumor ANalysis) do oceny złośliwości guzów nerek we współpracy ze szpitalem Copernicus w Gdańsku. To był nasz pierwszy projekt z AI w medycynie.
Jeszcze na studiach, wspólnie z Barbarą Klaudel, współtworzyłeś startup MIDAS – platformę do wymiany wiedzy i analizy danych ze szpitali, docenioną w Europie. Czego nauczyły Cię te pierwsze doświadczenia z komercjalizacją projektów AI i pracą na styku nauki i biznesu?
MIDAS powstał jako spin-off projektu TITAN. Aby opracować model do analizy zdjęć TK (tomografii komputerowej), musieliśmy najpierw zrobić aplikację do zbierania danych, bezpiecznego przesyłania ich, anonimizacji i annotacji. Stwierdziliśmy, że można z tego zrobić osobny produkt, bo na pewno nie my jedyni mamy taki problem. Teraz jest sporo tego typu narzędzi, ale wtedy nie było ich wcale. Tak powstał MIDAS – Medical Dataset Annotation Service. Pasowało nazwą do motywu mitologii, tak jak TITAN. Myślę, że było to bardzo cenne doświadczenie związane z komercjalizacją i jej wyzwaniami. Możesz mieć świetny pomysł, który wygrywa konkursy i którym wszyscy się zachwycają, ale to nie oznacza, że ktoś zechce go kupić. To zupełnie inna sprawa. Zdaliśmy też sobie sprawę, że sprzedaż to nie nasza bajka, wolimy skupić się na technologii. To lekcja, którą potem wcieliliśmy w życie w Medalionie.
W 2020 roku powstało TheLion.AI. Jak udało się Wam zbudować zespół – od koła naukowego po ponad 70-osobowy kolektyw?
Tak jak wspominałem, jeszcze na studiach założyliśmy koło naukowe. Ja wciągnąłem do niego kolegów z mojego roku, a Basia później (studiując na innym wydziale) robiła projekt grupowy też o tematyce AI w medycynie i wciągnęła w niego swoich znajomych. Startowaliśmy więc z bazą około 10 osób, a to już coś. Dzięki naszym projektom poznaliśmy też wielu lekarzy, którzy mieli pomysły na projekty związane z AI. Pojawił się więc pomysł, żeby stworzyć przestrzeń, która łączy ekspertów z branży medycznej i programistów. Uznaliśmy też, że projekty, które będziemy robić, będą open-source. Dlaczego? Po pierwsze, komercjalizacja AI w medycynie w Polsce jest ciężka (ale o tym mógłby być osobny wywiad), a nam zależało na tym, żeby rozwiązania powstawały, a nie żeby zarabiały. Po drugie, w ten sposób łatwiej zachęcić ludzi do współpracy – zarówno szpitale, jak i programistów. Na przykład praca nad projektem open-source to świetny wpis do CV. Początkowo opieraliśmy się przed stworzeniem szerszej społeczności – nie chcieliśmy, żeby był to fanklub albo stowarzyszenie, które pobiera składki i wydaje ładne dyplomy członkostwa. Zależało nam na tym, żeby realizować realne projekty i pewną jakość. Lubimy być oceniani przez naszą pracę i chcemy, żeby ona mówiła sama za siebie. Dlatego sama liczba członków nie była dla nas nigdy wskaźnikiem, ale zawsze staramy się zapraszać do współpracy ciekawych ludzi, w których widzimy potencjał. I tak wyszło z tego 70 osób.
Stworzyliście modele sztucznej inteligencji odpowiadające na konkretne problemy medyczne. Jak narodził się pomysł na stworzenie polskiego medycznego modelu językowego Eskulap, opartego na Bieliku? Wspominałeś też, że udało Wam się pozyskać prawie 20 tysięcy otwartych publikacji naukowych oraz stworzyć blisko milion instrukcji do treningu modelu. To ogrom pracy – co w tym procesie było najtrudniejsze i jak udało się doprowadzić projekt do końca?
Pomysł na medyczny model języka narodził się w mojej głowie tak naprawdę bardzo dawno, jakoś 5 lat temu, jeszcze przed ChatGPT i fazą na LLMy. Próbowałem ten pomysł forsować w kilku miejscach, w których pracowałem, aplikować o granty badawcze, aż w końcu stwierdziłem: „fine, I'll do it myself” 🙂.
Tworzenie modeli języka jest bardzo skomplikowane i wymaga znaczących nakładów pracy i zasobów (głównie obliczeniowych). Najtrudniejsze są oczywiście dane, więc nad tym spędziliśmy najwięcej czasu i wciąż dokładamy nowe. Nie chcę wchodzić za bardzo w szczegóły techniczne (organizujemy też od czasu do czasu webinary na ten temat, na które serdecznie zapraszam), ale jest w naszej branży powiedzenie: „garbage in, garbage out”, które oznacza, że nawet najlepsza architektura AI nie jest w stanie nauczyć się dobrych informacji, jeśli będziemy ją karmić niskiej jakości danymi. Dlatego trzeba starannie dobierać źródła, filtrować i stale zapewniać jakość danych.
Jesteś współtwórcą Medalion – platformy, która pozwala szpitalom tworzyć modele AI we własnej infrastrukturze. Skąd wziął się pomysł na takie rozwiązanie i dlaczego prywatność danych oraz lokalne przetwarzanie były dla Was kluczowe? Czy lekarze bez zaplecza programistycznego faktycznie będą w stanie samodzielnie tworzyć modele AI dostosowane do swoich potrzeb? Do czego mogą je wykorzystać i czy zauważasz różnice w gotowości polskich szpitali – zarówno mentalnej, jak i technologicznej – do wdrażania takich rozwiązań?
Wszystkie nasze pomysły de facto biorą się z poprzednich projektów, obserwacji i szukania luk w technologii. Chcemy opracowywać takie narzędzia, z których sami chcielibyśmy korzystać. W projekcie TITAN brakowało nam narzędzia do oznaczania danych, tak powstał MIDAS. Potem brakowało nam bazowego modelu AI dla radiologii – tak powstał projekt UMIE (Universam Medical Image Encoder). A do UMIE brakowało danych, więc stworzyliśmy UMIE-dataset – największy na świecie open-source’owy zbiór oznaczonych obrazów medycznych.
Podobnie było z Medalionem. Spotkaliśmy sporo lekarzy, którzy mają nie tylko pomysły na wdrożenie AI, ale też niezbędną wiedzę merytoryczną – wiedzą, co model powinien brać pod uwagę, jak ocenić jego działanie. Jedyne, czego nie mają, to wiedza na temat algorytmów AI i umiejętności programowania, więc postanowiliśmy dać im to w formie naszej platformy Medalion. Jej celem jest również demokratyzacja i przyspieszenie wdrażania AI w medycynie. Zamiast płacić start-upom miliony za wdrożenie AI, szpital może to zrobić sam – i często może wyjść to lepiej, bo model będzie trenowany na konkretnych danych i zwalidowany przez ekspertów. My dajemy dożywotnią licencję na nasz produkt: możesz stworzyć tyle modeli, ile chcesz, i masz do tego odpowiednie narzędzie.
Otrzymujecie zapytania z zagranicy, nawet z Australii. Jak widzisz możliwości umiędzynarodowienia Waszych projektów?
Na razie skupiamy się na rynku europejskim, choć mamy też pomysły na USA, gdzie ochrona zdrowia wygląda nieco inaczej.
Jesteś w gronie doradców ds. AI przy Kancelarii Prezesa Rady Ministrów. Na jakich trzech głównych celach powinniśmy się skupić, aby nie zmarnować szansy w wyścigu AI? Czy Polska ma realną szansę stać się znaczącym graczem w dziedzinie medycznego AI w Europie?
Jeśli chodzi o rozwój polskiego AI, to moim zdaniem trzeba tę sytuację odwrócić i zadać sobie pytanie: co my jako kraj mamy? Jaka jest nasza największa wartość? I odpowiedź brzmi: ludzie. Mamy na to dowody na każdym kroku – Polacy w OpenAI, projekt Bielik, który broni się technologicznie na skalę światową, czy ElevenLabs. Tylko dlaczego mówimy o Polakach w OpenAI i o ElevenLabs jako „firmie amerykańskiej założonej przez Polaków”, a nie o polskiej firmie? Trzeba takim osobom stworzyć warunki do rozwoju.
Mam tu na myśli na przykład naukę, gdzie stypendia doktoranckie wynoszą 3,5 tys. brutto. Mamy też skromne fundusze VC, więc główne źródło finansowania stanowią środki publiczne, które – jak każdy widzi – wyglądają kiepsko, chociażby po sytuacji KP Labs. Trudniej jest dostać polski grant na paręset tysięcy złotych niż europejski na parę milionów czy finansowanie VC w Stanach na paręnaście milionów.
Dlatego powiedziałbym, że przede wszystkim potrzebne jest: udrożnienie systemu grantowego, obsadzenie w nim prawdziwych ekspertów, którym będziemy płacić duże pieniądze, ale też wymagać dużej odpowiedzialności. Nie brakuje nam pomysłów – po prostu nie umiemy ich wykorzystać.
Przygotowując się do rozmowy, zauważyłem, że ogłosiłeś dwa kolejne projekty – e-przeszczep i LOMA. Czy mógłbyś je przedstawić naszym czytelnikom i uchylić rąbka tajemnicy, jakie są Twoje kolejne plany?
E-przeszczep to pomysł, który przyszedł do nas od prof. Beaty Januszko-Giergielewicz z Akademii Nauk Medycznych i Stosowanych w Elblągu, która szukała partnerów technologicznych. Od razu uznaliśmy, że idea jest świetna i chcemy wspierać ją nie tylko technicznie. Jest to aplikacja, która nie tylko informuje o tym, jak wygląda transplantologia w Polsce, ale też pomaga zbierać cyfrowe oświadczenia woli na zostanie dawcą narządów po śmierci. W Polsce mamy z tym duży problem – ponad dwa razy więcej osób czeka na przeszczep, niż jest ich wykonywanych każdego roku. To dla nas ważny społecznie problem, który chcemy pomóc rozwiązać. Odbiór projektu jest bardzo pozytywny – w przyszłym tygodniu mamy umówione spotkania z Ministerstwem Zdrowia i Ministerstwem Cyfryzacji. Liczymy na to, że nasz system będzie można zintegrować z aplikacją mObywatel albo IKP.
LOMA (Local Offline Medical Assistant) natomiast to na tym etapie proof of technology. Stworzyliśmy medycznego asystenta AI z bazą ponad 5 milionów pytań i odpowiedzi, który działa w pełni offline na telefonie. Zrobiliśmy go w ramach konkursu Gemma 3n Impact Challenge organizowanego przez Google. Zachęcam więc do zapoznania się z nim i głosowania na nas na platformie Kaggle 🙂 link.
A co będzie dalej? Planuję na pewno wykorzystać bazę danych z Eskulapa do stworzenia zestawu małych, lokalnych narzędzi AI. Pierwszymi z nich są modele MedalioNER do parametryzacji notatek lekarskich oraz AnonimiNER do anonimizacji tekstów medycznych, które już wypuściliśmy. Następny w kolejce jest model rozpoznawania mowy (ASR), model ekstrakcji informacji z PDF-ów i enkoder tekstu (np. pod modele RAG). Tak jak mówiłem, staram się tworzyć modele, z których sam chciałbym korzystać.
***
Aleksander Obuchowski jest współzałożycielem i CTO w Medalion Tech, współzałożycielem grupy badawczej TheLion.ai oraz współtwórcą aplikacji e-przeszczep. Jest absolwentem Politechniki Gdańskiej. Zajmuje się sztuczną inteligencją w medycynie oraz projektami open-source.
Linki